肖恩技术周刊（第 85 期）：卖铲子的先富了

2026/3/16大约 13 分钟约 3829 字

肖恩技术周刊（第 85 期）：卖铲子的先富了

对周内阅读的技术内容精品（个人向）进行总结。觉得不错可点击上方订阅，第一时间获取更新通知。

去西昌玩了一周，因此鸽了一期。西昌真是个好地方，天气好、风景美、美食多，更关键的是非常适合遛娃，推荐大家去玩。

这两周的热点依然是OpenClaw，但从信息源内容来看，多数讨论仍集中在安装和工具本身。国内各大厂也陆续推出了自己的版本，进一步降低了部署门槛。

卖铲子的人越来越多，但真正淘到金的有多少？

如果只是用来做基础的日程管理、对话和信息收集，为了这点提效而耗费大量精力部署和订阅昂贵的模型API，似乎并不划算。

但转念一想，我可能陷入了一个误区。作为程序员，将重复工作自动化是一种本能，而且我们有能力实现它。但对于普罗大众，OpenClaw成为他们在数字世界里创作的画笔，有了它，想法才能真正落地。例如：

自媒体：自动抓取热点、生成文案/脚本、排版、多平台发布
创作者：素材整理、灵感沉淀、多轮打磨创意、批量生成初稿
个人数字助理：自动整理文件、邮件、财务、日程；定制早报、周报、信息摘要；家庭/生活自动化
一人公司：只要有想法，就能将产品落地。把零散需求变成自动化流程，实现"想法→执行→落地"的闭环。

或许，OpenClaw真正发挥作用的地方，在程序之外。

业界资讯

Gemini 3.1 Flash-Lite：为大规模智能而打造

谷歌推出Gemini 3.1 Flash-Lite预览版，开发者可经Gemini API在AI Studio使用，企业可在Vertex AI接入，定价0.25美元/百万输入token与1.50美元/百万输出token，相比2.5 Flash首字节更快且输出提速，支持可调"思考"等级，面向高并发翻译、内容审核、界面生成与仿真等任务以更低成本实现实时规模化推理。

改进 skill-creator：测试、衡量并优化 Agent 技能

Anthropic升级skill-creator，支持无代码编写eval与基准测试，多代理并行与对比代理做A/B评估，并完善技能描述以减少误触发与漏触发，帮助开发者在模型迭代中监测回归、判断技能是否仍必要并稳定提升效果。

联想新款 T 系列 ThinkPad 笔记本电脑在可维修性方面获得 10/10 的评分

联想ThinkPad T14 Gen7与T16 Gen5在iFixit可修复性评测获暂定10/10，因iFixit提前介入开发并提升电池、键盘、散热、雷电口等模块化与标准件可更换性，将高可维修性从小众特性推向主流商用笔记本基线并降低维护成本与废弃物。

Google NotebookLM 推出“电影级视频概览”新功能

谷歌NotebookLM上线“电影级视频概览”，用户导入研究资料或笔记即可由Gemini3、Nano Banana Pro、Veo3等模型自动生成沉浸式定制讲解视频，现仅向18岁以上Google AI Ultra订阅用户开放并仅支持英语，推动产品从研究辅助向创意生产力工具升级。

GPT‑5.4 震撼登场

OpenAI发布GPT-5.4及Pro并上线ChatGPT、API与Codex，整合更强推理、编码与代理能力，支持原生电脑操作、100万token上下文与工具搜索，提供可调计划、深网研究和更稳上下文，同时更省token并提速，基准成绩整体优于GPT-5.2与GPT-5.3，提升复杂专业任务产出与开发效率。

Anthropic在Claude Code推出AI代码审查工具Code Review，自动检测Pull Request漏洞

Anthropic在Claude Code上线AI代码审查工具Code Review，先向Teams与Enterprise研究预览开放，集成GitHub自动审Pull Request并在代码中标注逻辑漏洞与修复建议，采用多智能体并行审查，汇总后去重并确定优先级，支持基础安全分析和自定义规则，按代币计费单次约15-25美元，目标缓解企业PR激增导致的人工审查瓶颈并降低漏洞风险。

Gemini Embedding 2：Google首款原生多模态嵌入模型

谷歌发布Gemini Embedding 2公测版，通过Gemini API与Vertex AI提供，将文本、图像、视频、音频与PDF映射到统一向量空间，支持多模态混合输入与100多语言语义表示，可用于跨媒体检索、分类、RAG与聚类等任务，并以可缩放向量维度在性能与存储成本间取舍，整体多模态与语音表现优于以往与主流模型。

佳文共赏

人工智能软件开发的第三个时代

Cursor认为AI软件开发进入第三阶段，云端自治代理可在更少人类指挥下长时独立完成更大任务并返回日志、录屏、预览等可审阅工件，其内部已约35%合并PR由代理在云端VM自主生成，开发者角色转向定义问题与验收标准并并行调度多代理，预计一年内，开发者的大部分工作将转变为调度此类代理。

没人会因为简单而获得晋升

工程团队在面试、评审和晋升中常奖励“复杂度叙事”，促使工程师过度设计，简单可用的实现因难以被描述其价值而被低估；作者建议个人记录取舍与避免的复杂度、评审时为复杂方案设证据门槛，领导调整评价与公开表彰以让“选择简单”可见，否则组织将持续产出不必要的复杂系统。

软件工程循环中的人类与智能体

人类不应放任代理独立完成开发，也不必逐行审查代码，而应“在环上”设计并管理从需求到交付的多层反馈回路，通过规格、测试、评估与流程指导构建并持续改进代理执行的“harness”，再引入测试指标、性能与故障验证、生产与业务数据驱动代理自我评估与提出改进，形成持续加速的飞轮，以降低时间成本与失控风险并提升系统可靠性与可演进性。

我的编码智能体工作效率提高技巧

积累可运行的技术解法与代码样例，通过博客与仓库并借助LLM持续扩充，再让编码代理检索并重组既有示例快速生成新工具，如合并PDF.js与Tesseract.js做浏览器OCR。这样技巧只需攻克一次即可反复复用并显著加速后续开发。

2026，写给 AI 创业者的慷慨、残酷、与迷雾

AI代理让写代码从辅助转为主导并快速商品化，个人产出与企业组织随之加速重构且裁员叙事获得市场认可，历史类比印刷术、电力与云计算表明能力一旦变廉价价值会迁移并出现供给爆炸与注意力稀缺，创业竞争转向问题定义、产品判断、用户与数据等代码之外护城河，机会在围绕新能力重写软件形态并把握解构后再整合的窗口。

编码代理如何重塑工程、产品和设计领域

编码代理让写代码成本骤降，EPD流程从“先写PRD再出设计再实现”转为“先快速原型再集中评审”，瓶颈由实现转到架构、产品与交互的审查与仲裁；传统PRD式瀑布流程逐渐消亡，但需求意图文档仍必需且可演化为结构化提示；角色更趋融合，通才与产品感更关键，专才门槛提高，组织分化为用代理构建的builder与高强度系统思考的reviewer，坏产品想法将放大浪费与产品膨胀风险。

程序员之后的编程：我们所熟知的计算机编程的终结

硅谷开发者正把写代码交给AI代理，转而用自然语言下达任务、审阅计划与结果并用测试约束幻觉，初创公司效率可提升至数十倍，大厂在既有代码库中更多用AI做理解、修复与自动化运维，整体提速约10%且团队规模缩小；现在编码工作更像架构与评审，而非手工实现，入门岗位与技能传承承压，但非程序员也能快速生成可用软件，白领工作或普遍转向“生成更少、判断更多”。

理解债务 —— 人工智能生成代码的隐性成本

过度依赖AI生成代码会累积“理解债”，即代码规模增长快于人类理解速度，表面测试与指标向好却削弱系统心智模型，变更与排错时集中爆雷；研究显示用AI代写理解力下降约17%，被动委派最伤技能，测试与规范文档无法替代理解与审查，组织应将“真正理解所交付内容”作为质量门槛与合规前置条件。

技术博客

从被动应对到主动出击：借助大语言模型弥合钓鱼攻击防御缺口

Cloudflare将LLM接入邮件安全，实时细分海量恶意邮件并锁定“销售外联”式钓鱼，基于语义意图训练专用模型输出风险分数并与信誉等信号联动拦截且持续自我迭代，使防御从依赖用户事后上报转为提前发现盲区，Q4 2025相关漏报日均提交由965降至769并在2026年初继续大幅下降。

智能体框架的深层剖析

Agent由模型与Harness组成，Harness指除模型外的代码与执行机制，通过提供持久状态、文件系统与Git、工具与代码执行、沙箱环境、搜索与记忆注入、上下文压缩与输出卸载、规划与自验证循环及编排钩子，把仅能输入输出文本的模型变成可长期自主完成任务的工作引擎，并与模型后训练共同演化但也可能导致对特定工具逻辑过拟合，因此优化Harness本身可显著改变同一模型的效果。

作者基于半年重度使用Claude Code的踩坑，总结其六层系统与代理循环，指出质量下降多源于上下文污染、工具与规则堆叠及缺乏验证闭环，提出用精简CLAUDE.md分层加载、Hooks强制约束、Subagent隔离探索、面向缓存设计Prompt并配套Verifier与/clear /compact等治理，最终结论是以“可验收定义+约束下自治”替代单纯调prompt，并提供/health技能做配置体检。

开源项目

microgpt: 一个最小化的 GPT 实现

microgpt以200行无依赖Python把数据集、字符级分词、自写autograd、类GPT-2网络、Adam训练与采样推理压进单文件，在3.2万姓名上训练1000步使loss约3.3降至2.37并生成新名字。GPT训练与生成的算法本质可被极简复现，生产差异主要在规模与工程效率。

LangChain Skills

LangChain团队开源langchain-skills仓库11项技能，按需动态加载脚本与指令，覆盖LangChain、LangGraph、DeepAgents，使Claude Code相关任务通过率由25%升至95%，可用npx skills安装并绑定代理，后续将持续扩充并同步发布LangSmith技能。

Qwen-Agent：基于 Qwen 的智能体框架

Qwen-Agent是阿里通义千问团队开源的Qwen大模型智能体框架，作为Qwen Chat后端，提供并行多步函数调用、MCP集成、Docker沙箱代码执行、1M tokens长文档RAG问答与浏览器助手及Gradio WebUI，支持通过PyPI或源码安装并接入DashScope/OpenAI兼容API快速构建和运行Agent。