肖恩技术周刊(第 79 期):AI结对编程
肖恩技术周刊(第 79 期):AI结对编程
对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击上方订阅,第一时间获取更新通知。

结对编程(Pair Programming)是一种两名开发者在同一台电脑前并肩作战的敏捷开发实践。它就像赛车中的车手与领航员:
一人负责驾驶(Driver),专注于键盘输入和具体的逻辑实现。
另一人负责领航(Navigator),在旁边观察代码,思考整体架构、捕捉细微错误,并预判潜在的风险。
这种模式的核心价值在于“实时代码审查”,不仅能显著减少 Bug 数量、提升代码质量,还能有效促进团队内部知识共享。
AI 结对编程(AI Pair Programming)则是将你的合作伙伴从一名同事换成 AI 编程助手。在传统模式中,两人是平等的思维碰撞,角色通常会定期互换。但在 AI 模式中,关系转变为开发者作为主导者,AI 作为执行者。简单对比如下:
| 维度 | 传统结对编程 (Human-Human) | AI 结对编程 (Human-AI) |
|---|---|---|
| 角色分配 | 严格的驾驶员与领航员,定期互换 | 开发者始终是领航员(决策者),AI 是永远的驾驶员 |
| 沟通方式 | 自然语言对话、白板讨论 | 提示词 (Prompt)、补全触发、代码内联对话 |
| 反馈速度 | 取决于同伴的反应和思考时间 | 瞬时反馈,毫秒级生成代码片段 |
| 纠错机制 | 依靠人类的经验和实时观察 | 依靠 AI 对海量模式的匹配和语法扫描 |
AI 结对编程具体有哪些优势呢?
- 24/7 无限续航 : AI 不会疲劳、不需要咖啡休息,也不会因为你凌晨三点灵感迸发而感到困扰,它随时待命。
- 消灭样板代码 :传统结对中,写重复的配置文件或 CRUD 逻辑会让两人都感到枯燥。AI 擅长处理这些机械任务,让你能把精力留在更复杂的架构设计上。
- 百科全书般视野: AI 熟悉几乎所有公开的开源库和文档。当你使用一个从未接触过的 API 时,AI 能立即给出示例,省去了大量调研时间。
- 消除社交压力与性格冲突: 不必担心质疑 AI 会伤及其自尊心,也不必在意见不合时进行复杂的沟通管理。AI 永远保持冷静,且完全服从你的编码风格偏好。
钢铁侠们,准备好遇见你的Jarvis了吗?
业界资讯
苹果选择谷歌的 Gemini 而非 OpenAI 的 ChatGPT 来为下一代 Siri 提供支持

苹果宣布下一代 Siri 将采用谷歌的 Gemini 语言模型,而非 OpenAI 的 ChatGPT。此次合作是苹果与谷歌多年合作的一部分,苹果将使用谷歌的 AI 模型来提升 Siri 的性能。谷歌的 Gemini 模型将在苹果的私有云服务器上运行,确保用户数据安全。这一决定对 OpenAI 来说是一个打击,因为苹果原本在 iOS 和 macOS 中使用了 ChatGPT。
ChatGPT Go 现已面向全球用户开放

OpenAI 宣布 ChatGPT Go 面向全球用户开放,订阅价格每月 8 美元。该服务提供最新模型 GPT‑5.2 Instant 的使用权限,消息、文件上传和图像生成额度比免费层级多 10 倍,还具备更长的记忆和上下文窗口。
Claude Cowrok 发布

Claude 团队推出了 Cowork,这是 Claude Code 的扩展,旨在为非开发者提供更便捷的工作方式。Cowork 允许用户授权 Claude 访问本地文件夹,从而实现文件的读取、编辑和创建,例如整理下载文件、从截图生成费用表格或从笔记生成报告初稿。Cowork 基于 Claude Code 的技术基础,但更适用于非编码任务,支持任务排队和并行处理,减少用户干预,提升工作效率。
佳文共赏
在谷歌 14 年的 21 条经验

Addy Osmani 在其博客中分享了 21 条在谷歌工作 14 年的经验教训,这些经验聚焦于软件工程的实践和团队协作。
优秀的工程师应专注于解决用户问题,而非单纯追求技术的复杂性。在技术选型上,应谨慎对待新技术,避免因过度创新而增加系统的复杂性和维护成本。他还提到,代码的清晰性比巧妙性更重要,因为清晰的代码更易于后续维护和理解。在团队协作中,他指出,真正的挑战在于达成共识,而非单纯证明自己正确。
此外,他还提到,性能优化的关键在于去除不必要的工作,而非单纯增加处理能力。这些经验教训为工程师提供了宝贵的指导,帮助他们在技术实践和团队合作中取得更好的成果。
2026年最香AI工具曝光:Claude Skill免费白嫖,小白友好,开箱即用,绝了!

OpenCode作为一款免费、小白友好的AI工具脱颖而出,可替代Claude Code,实现解读论文、生成知识画布、创作小红书文案等功能。支持多系统,推荐通过终端命令安装,提供75+模型供应商,其中GLM - 4.7模型在代码生成和指令遵循方面表现出色。
OpenCode拥有活跃的开发者生态,Oh - My - Opencode(OMO)是其备受推崇的Agent框架,内置多个Agent和MCP,实现与Claude Code兼容,提升编程体验。Skill是其核心功能,安装和使用简单,还可通过skill - creator创建Skill,包含提示词等多种元素,能打包分享或发布到Github。推荐了Superpowers、Planning - with - files等实用Skills。
OpenCode降低了AI编程门槛,让普通人轻松上手,其免费、易用的特点极具吸引力,有望让AI世界更精彩。
用第一性原理拆解 Agentic Coding:从理论到实操

TRAE 技术专家深入探讨了 Agentic Coding 实践中与 AI 协作的优化策略。
首先,强调了理解大语言模型(LLM)的工作原理至关重要,其自回归生成机制决定了推理过程即生成过程,且上下文窗口是其全部记忆,这导致了局部最优、偏差累积、无法回头修改等问题。
其次,介绍了强化学习在 Coding Agent 中的应用,通过尝试-反馈-调整循环,让模型学会在编程环境中执行任务,如调用工具、修复 bug 等,但其效果依赖于奖励信号的设计。
最后,讨论了 Coding Agent 的实现原理,包括基于消息的对话结构、工具调用机制、上下文管理策略等,指出短对话优于长对话,应将复杂任务拆解为专注的子对话,并通过实践将经验沉淀为项目知识库,以提升效率。
技术博客
Cursor:使用 Agent 编码的最佳实践

本文详细阐述了在 Cursor 平台中利用 AI 智能体(Agent)进行高效编程的核心方法论与操作技巧。
强调开发者应通过 Plan 模式进行先规划后编码的思维转变,并通过合理配置静态规则(Rules)与动态技能(Skills)来定制化智能体的行为模式。为了实现高质量的代码产出,手册建议通过管理上下文(Context)、使用调试模式以及执行多模型并行运行来优化工作流。
最终目标是指导用户将智能体视为具备能力的协作者,通过提供具体指令和可验证的目标,实现软件构建流程的智能化升级。
如何为AI智能体编写一份优质的规范(Spec)

文章为开发者提供了一套编写AI智能体规范(Spec)的系统化框架,旨在解决大型项目因上下文过载导致模型失效的难题。
一份优秀的规范应从高层次愿景起步,引导AI共同拟定技术细节,并采用专业的需求规格说明书结构来明确指令、测试路径及项目边界。为了维持AI的专注度,核心策略是将复杂任务拆解为模块化提示词,通过分阶段执行、建立自我核查机制以及设置三级约束(务必、询问、禁止)来确保输出质量。
最终目的是将规范转变为一个动态迭代的活文档,利用规范驱动开发(Spec-driven development)让AI在清晰的导航下高效、稳健地完成代码工程。
我 2026 年初的AI编码工作流

文中详细描述了作者的AI 辅助工程工作流,强调了在人工智能时代,人类工程师仍需作为具备主导权的决策者。
其核心架构围绕前期规划与颗粒度管理展开,提倡先通过与 AI 迭代讨论生成详细的技术规范(spec.md),再将复杂任务拆解为细小的迭代步骤。文中重点提出了上下文填充与规则定制的重要性,主张利用各种工具为 AI 提供充分的项目背景,并建立明确的代码规范文件以确保输出质量。
最后提醒开发者必须保持严格的监督与验证,通过频繁提交代码快照、实施自动化测试以及 AI 互审等手段,将 AI 视为一个高效但偶尔鲁棒性不足的结对编程伙伴,而非完全自主的替代品。
开源项目
wxt:Web 扩展开发框架

WXT 是一个下一代 Web 扩展开发框架,类似于 Nuxt,但专为 Web 扩展设计,支持所有主流浏览器。
superpowers:Skills合集库

Skill合集库,涵盖了测试、调试、协作和元技能等多个方面,支持创建新技能并遵循最佳实践。
clipsketch-ai:AI 驱动内容创作工具

ClipSketch AI 是一款面向视频创作者的 AI 驱动内容创作工具,基于 React 19 和 TypeScript 构建,集成 Google Gemini 多模态大模型。它支持解析 Bilibili 和小红书视频链接,实现帧级精准标记,通过键盘快捷键控制播放和标记。其核心功能包括智能绘图,可将标记帧整合为连贯的手绘风格故事板,自动生成适配社交媒体的文案,并支持角色融合与封面生成。此外,还支持批量生成和优化分镜,响应式设计适配多平台操作。
工具推荐
ChatGPT 翻译

OpenAI推出的翻译功能,页面很像Google翻译。
Agent Skills 市场

用AI收集的Skills合集市场。
资源推荐
冷知识:bin、sbin 与 usr/bin、usr/sbin 目录的由来

Linux/macOS 系统的根目录下存在 bin、sbin、usr/bin、usr/sbin 等目录,这种结构源自 1970 年代 Unix 系统。
当时受限于磁盘容量(如 1.5MB),系统分为根文件系统(/)和第二块硬盘挂载的 /usr 目录。/bin 和 /sbin 存放启动早期必需的命令,/usr/bin 和 /usr/sbin 则在系统启动完成、挂载 /usr 后使用。
这种划分解决了启动时的依赖问题,但现代系统有了临时根文件系统(initramfs/initrd),启动依赖问题已解决,且共享库的使用使程序和库紧密绑定,目录分离的必要性消失。
如今,这种目录结构因历史惯性延续,虽缺乏技术必要,但被各发行版沿用,增加了复杂度。
《麻省理工科技评论》预测2026年AI五大趋势

2026 年 AI 领域将呈现五大趋势。
首先,中国开源模型影响力持续扩大,如 DeepSeek 的 R1、阿里巴巴的 Qwen 系列等,凭借开放权重、易定制等优势,被越来越多硅谷产品采用,且中国模型与西方前沿水平时间差不断缩短。
其次,美国 AI 监管斗争升级,白宫与各州围绕治理权持续争执,AI 公司激烈游说,中期选举中相关角力将更明显。
最后,聊天机器人将改变购物方式,Salesforce 预计其将推动大量线上购买,AI 公司纷纷布局,未来类似合作将更多。
《麻省理工科技评论》发布2026年“十大突破性技术”

2026年“十大突破性技术”,涵盖AI、能源、生命科学等领域。
- 超大规模数据中心为AI模型提供动力,但能源成本高昂,促使企业探索新型冷却与供电方式。
- 钠离子电池作为锂离子电池的替代品,凭借成本低、安全性高、资源丰富等优势,在汽车和电网领域迎来发展机遇。
- 碱基编辑技术取得重大突破,全球首例定制化基因编辑治疗成功,为罕见病治疗带来新希望。
- AI模型的机制可解释性研究取得进展,研究人员通过新方法探查模型内部工作机制,提升模型的安全性和可控性。
- 先进核反应堆技术吸引大量投资,小型模块化设计和新材料应用使核能更安全、更便宜。
- 胚胎植入前基因检测技术引发伦理争议,相关公司声称可对胚胎的复杂性状进行筛查。
- AI聊天机器人与用户建立亲密关系,但可能放大用户心理脆弱性。
- 基因复活技术取得进展,为生物医药和生物多样性保护提供新解决方案。
- 生成式AI编码工具普及,改变软件创作方式,但可能减少初级编码岗位。
- 首个商业轨道前哨站计划于2026年5月发射,开启太空旅游新时代。
