肖恩技术周刊(第 86 期):思路打开
肖恩技术周刊(第 86 期):思路打开
对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击上方订阅,第一时间获取更新通知。

本周将自己关于"信息处理"的实践整理了一篇博客 信息过载时代,我的漏斗式阅读工作流,并投稿了阮一峰的《科技爱好者周刊》,有幸得到了推荐。
第一次被大V转载,效果确实很震撼,博客访问量大幅增长,就连公众号也增加了不少粉丝。

但这些都不是重点,更开心的是和不少朋友进行了沟通交流,收获颇丰,同时也加深了我对 Agent 使用的理解。
其实博客中介绍的内容对于探索过的朋友来说算不上新颖,也已有类似的工具或工作流。但用 Agent 来串联这个流程,拥有其他工具不具备的优势。
那就是:低门槛和高灵活。
低门槛在于不需要深入了解技术,只需要给Agent讲出你的想法,就能推进实现落地。高灵活则是可以在实施中灵活地试错、快速迭代。
这相对于那些固定模版的工具或只具备一定灵活性的低代码、工作流来说,是难以忽视的优势。也让非技术人员具备了搭建复杂流程的能力。
业内有种说法是:模型将吞噬软件。如果成真,传统的框架类平台可能面临巨大挑战。框架的存在是为了模板化重复工作,但当开发成本大幅降低,其存在价值可能被重新定义。
届时,想法可能成为最重要的资产之一。或许我们确实需要打开思路了。
业界资讯
GPT-5.4 mini 与 nano 正式发布

OpenAI发布GPT‑5.4 mini与nano,两者主打高吞吐、低延迟和低成本;mini较GPT‑5 mini在代码、推理、多模态和工具调用上明显增强,速度翻倍且多项评测接近GPT‑5.4,适合代码助手与计算机使用场景;nano则面向分类、提取、排序等轻任务,现已分别在API、Codex和ChatGPT等渠道上线。
Codex 支持 Subagents

Codex支持按需并行生成子代理处理复杂任务,并汇总结果输出,用户还可为不同任务自定义代理的模型配置与指令;该能力当前默认可用,已在应用和CLI中显示、IDE扩展即将支持,但仅在明确要求时触发,代价是比单代理消耗更多tokens。
智谱发布 GLM-5-Turbo:专为“龙虾”智能体优化的实干型基座模型

智谱发布基座模型GLM-5-Turbo,面向开源智能体龙虾重构训练,重点提升工具调用、复杂任务拆解、长时运行和高吞吐执行,解决长链路任务失速问题;盲测中实战表现居前,并已适配硬件与企业安全体系,推动AI从辅助工具走向可落地的数字劳动力。
通过 Stitch 推出 “氛围设计” 理念

Stitch正升级为AI原生软件设计画布,用户可用自然语言、语音、图片、文本或代码生成并迭代高保真UI,在无限画布上借助设计代理、多方案管理、交互原型和设计系统复用快速协作,并通过MCP、SDK及导出衔接开发工具,最终把想法到可用产品的周期从数天压缩到数分钟。
为智能体赋能:Workers AI 现已支持运行大模型,首批上线 Kimi K2.5

Cloudflare将Workers AI升级为智能体全生命周期平台,接入开源大模型Kimi K2.5,支持256k上下文、工具调用、视觉和结构化输出,并配套前缀缓存、会话亲和与重构异步API;其内部实测在保证质量下比专有模型更快更省,单用例成本降77%,开源大模型正成为可规模化部署智能体的更优选择。
推出 Composer 2

Composer 2 已在 Cursor 上线,编程能力较前代显著提升,在 CursorBench、Terminal-Bench 2.0 和 SWE-bench Multilingual 等基准全面刷新成绩,并通过持续预训练与强化学习增强长周期复杂任务处理能力,定价为每百万输入 token 2.50,另有更快版本 7.50,整体形成高智能、低成本的新默认选择。
MiniMax M2.7:自我进化的早期回响

M2.7是MiniMax首个参与自身进化的模型,能通过代理团队、记忆、自我反馈和工具调用迭代优化框架与学习流程,已承担30%至50%研发工作并带来内部编程性能约30%提升,同时在软件工程、办公任务和复杂交互中达到开源领先水平,意味着AI正从辅助工具转向可持续自我优化的生产与组织引擎。
Astral 将加入 OpenAI

Astral宣布与OpenAI达成协议并加入Codex团队,核心目标仍是提升编程效率。其Ruff、uv、ty等开源Python工具将继续获得支持并保持开放协作,同时与Codex更深度整合,在AI与软件开发前沿扩大影响,推动更高效的软件构建体验。
佳文共赏
智能体工程的 8 个等级

AI编程能力提升快于团队实践,真正决定产出差距的不是基准分数,而是从补全、上下文管理、经验沉淀、工具接入到反馈闭环和后台智能体的分级进化;每升一级都会放大效率,且团队短板会卡住整体吞吐,当前最有价值的方向是把智能体从辅助写码推进到可异步协作、可自我验证的后台执行。
AI,正在吞噬所有软件。
作者判断AI正从根本上改写软件与组织。人人可用自然语言快速造软件,软件因此从稀缺资产变成可替换耗材;Agent通过调用Skills直接完成任务,弱化UI、人机交互和SaaS价值;未来产品服务对象更多是Agent而非人,企业竞争转向可调用性、可靠性与信任,组织中依赖传话、协调的信息中间层也将被压缩。
一个数据中心拥有多少算力?

AI数据中心建设正以空前规模扩张,驱动力是AI扩展定律对算力的持续需求;若按H100 GPU计,典型数据中心约配10万张、超大型可达百万级,5GW园区甚至超400万张,其总算力约相当于数百万至数亿部iPhone 16,意味着AI基建不仅烧钱耗电,更在快速形成前所未有的集中计算能力,并将显著推高电力需求与模型能力上限。
AI算力的瓶颈已不是电,而是半导体供应链

2026年AI竞赛的关键不再是融资或电力,而是芯片制造链,四大科技巨头6000亿美元支出和OpenAI、Anthropic巨额融资,短期难完全转化为可上线算力;核心瓶颈已转向ASML光刻机、先进晶圆和HBM内存,导致算力供给持续紧张、价格上升、强者靠提前锁单扩大优势,并可能冲击消费电子与中美AI长期竞争格局。
技术博客
Harness Engineering — Agent 不好用,也许不是模型的问题
Harness指模型权重外的一切系统设计,涵盖提示、上下文、工具、沙箱、中间件与子代理等,其核心不是反复改prompt,而是改环境让错误难以再发生;实验证明同一模型仅优化自检、环境注入、死循环检测和推理强度调度,成绩可从Top30升至Top5;因此Agent可靠性主要取决于Harness,持久价值在缓存、存储、隔离等受物理约束的设计。
我研读了 Hermes Agent 的记忆系统,它弥补了 OpenClaw 的设计缺陷

Hermes采用四层记忆架构,小型MEMORY.md和USER.md保存稳定高价值事实,SQLite会话库按需检索历史,Skills沉淀可复用流程,Honcho可选扩展深层用户建模;其关键动作是冻结系统提示、把大部分记忆转移到工具检索,并在压缩上下文前先提炼持久信息,从而在控制成本与缓存稳定性的同时保持连续性与实用性。
构建 Claude Code 的经验:我们如何运用技能
Anthropic基于数百个Claude Code技能的实践指出,技能不是单纯文档,而是可含脚本、数据和钩子的文件夹,最有效的方向集中在知识参考、验证、数据分析、流程自动化、脚手架、代码质量、部署、Runbook和运维;写好技能的关键是聚焦非显然信息、沉淀易错点、善用文件系统渐进暴露、保留灵活性,并通过仓库或插件市场分发和监测使用。因此技能应从小规模迭代沉淀,持续优化才能真正提升开发效率。
开源项目
OpenViking:AI Agent上下文数据库

OpenViking是火山引擎开源的AI Agent上下文数据库,用文件系统统一管理记忆、资源和技能,通过三级分层加载、目录递归检索、可视化轨迹和自动会话管理,解决传统RAG存储碎片化、检索差和不可观测问题,实测可将任务完成率提升43%至49%,输入Token成本降低83%至96%。
NemoClaw:安全运行OpenClaw的参考栈

NVIDIA发布开源参考栈NemoClaw,用于安全运行OpenClaw智能体,集成OpenShell运行时、Nemotron模型、沙箱容器与云推理网关,通过声明式策略和四层防护统一限制网络、文件系统、进程及模型调用,为自主AI代理提供隔离执行环境。
browser:专为AI代理和自动化设计的无头浏览器

browser是面向AI代理、自动化、爬虫与测试的开源无头浏览器,基于Zig从零开发,支持JavaScript、Web API和部分CDP,可兼容Puppeteer与Playwright;其关键价值是相比Chrome内存降至1/9、速度提升11倍,支持Docker和WSL2部署。
OpenMAIC:多智能体交互式课堂平台

OpenMAIC是清华开源的多智能体课堂平台,可把任意主题或文档一键生成包含大纲、幻灯片、测验、交互模拟和PBL活动的沉浸式课程,由AI教师与同学实时讲解、讨论和协作,强化课程生产与互动学习效率。
Context Hub:解决AI编程助手API幻觉和会话遗忘问题

Context Hub是Andrew Ng团队开源的AI编程助手增强工具,针对API幻觉和会话遗忘,通过chub向代理提供人工筛选、版本化技术文档,并支持检索、获取、持久注释和全局反馈;经验可跨会话复用、文档随社区持续迭代,减少代码错误并形成越用越准的自我改进闭环。
资源推荐
OiiOii:AI动画创作平台

以AI动画代理团队为核心,提供艺术总监与角色、风格参考能力,覆盖脚本、分镜、场景、角色、产品与音乐等制作环节,让创作者在保持创作愿景与质量负责的前提下加速动画内容生成与交付。
CanIRun.ai:检测设备能运行哪些本地大模型

CanIRun.ai通过浏览器API检测或让用户选择GPU、显存、带宽、RAM与CPU核心数,自动评估本地设备对开源大模型的可运行性。
RSS.app:一站式RSS订阅生成平台

为任意网站与社交媒体生成自定义RSS源,并可创建RSS与社交组件嵌入站点或自动同步发布到Discord、Slack、Telegram等渠道,从而集中采集与分发内容、提升更新触达与跨平台传播效率。
YouMind:AI 创作智能体

YouMind 提供学习与创作一体的平台,用户可与AI智能体协同学习、思考并完成创作,形成持续迭代的内容产出与能力提升闭环,最终实现个人成长与创作效率提升。
小云雀AI:一句话生成完整短剧

字节跳动推出小云雀AI,定位为Seedance2.0短剧Agent,核心动作是用一句话直接生成完整短剧,提供从创意到成片的一站式内容创作能力,其影响是显著降低短剧制作门槛并提升爆款内容生成效率。
学习资料
智能体工程模式

总结与Claude Code、OpenAI Codex等编程代理协作的工程模式,让AI稳定产出更好的代码。
机器学习系统:设计和实现

系统覆盖机器学习系统全技术栈,内容含编程接口、计算图、AI加速器、编译器与运行时、数据处理、训练、模型服务、强化学习和大规模GPU集群管理,帮助读者完整理解机器学习系统的设计与实现。
感谢阅读
微信公众号「肖恩聊技术」
如果这期周刊对你有帮助,欢迎扫码关注,获取每周更新推送。

扫码关注公众号
