2025年总结:Agent元年,寻找人类最后的护城河
2025年总结:Agent元年,寻找人类最后的护城河

2025年结束了,周刊又坚持了一年,可喜可贺。
今年被称作Agent元年,是AI从“只会聊天的对话框”进化为“能够代劳的打工人”的关键转折点。对于这个称呼,行内人感叹星汉灿烂,行外人则是雾里看花。身在其中的我切实感受到AI的变化和影响,至少在编程智能体这个领域,AI已经带来了深刻的变革。那么到底有哪些关键性突破呢:

技术底层的突破:从“对话”到“推理”。以Reasoning Models(推理模型)为核心的技术路线成熟,模型具备了慢思考能力,学会在回答前进行自我检查、多步规划和逻辑推演。Agent能够将一个复杂目标(如“帮我策划一场去日本的旅行并预订所有门票”)拆解成几十个子任务,并具备出错后自动修正的能力。
交互模式的变革:从“人找工具”到“工具找人”。Agent开始接管工具操作权,具备了直接操作屏幕、点击按钮和填写表格的能力。模型上下文协议(MCP)解决了智能体与外部工具安全、高效交互的核心问题。AI不再是一个APP,而是长在操作系统里。Android、iOS和Windows全面转向“AI优先”,Agent成为了调用各种底层功能的接口。
商业落地的规模化:从“Demo”到“生产力”。各大公司开始将AI引入到实际业务中,部署多个专业Agent(如财务Agent、HR Agent、代码Agent)组成的“虚拟团队”,通过Cross-Agent(A2A)通信协议,多个智能体能够有效连接与协作。
很多关键标志性事件,也都在印证这个趋势:
- OpenAI在年初推出的o3及后续的o4-mini,首次将“思考链(CoT)”技术标准化
- DeepSeek-R1开源发布,颠覆全球大模型竞争格局,激发Agent开发热潮
- 创业公司Manus(通用型AI Agent)一夜爆红,被媒体称为AI Agent的“iPhone时刻”
- OpenAI发布AGENTS.md标准,被数万个开源项目采用,推动Agent行为一致性
- Vibe Coding(氛围编程)开始流行,人们开始尝试“口喷”代码,技术壁垒被打破
- 大模型密集升级潮 xAI Grok 4.1、Google Gemini 3、Anthropic Claude Opus 4.5、OpenAI GPT-5.2相继发布,显著提升Agent的推理、工具调用和自主执行能力
- “豆包手机”将AI深度集成进硬件,Agent成为了操作系统(OS)的一层,用户只需说话,就能在后台调用各个应用完成操作
...
但技术狂欢的背后,我更多的开始思考人类的价值,我们到底还有哪些稀缺特质是无法(或者最后)被取代的。为了弄明白这个问题,我咨询了一下AI(笑),它的回答是:
- 真实性与信任
- 情感与人际能力
- 伦理与治理能力
- 物理技能
- 深度创造力与原创性
- 审美与品味
- 判断力和洞察力
- 哲学思辨能力
- 责任与社会贡献
- 隐私与数据主权
- 生态与自然资源
- 元认知与学习能力
我很认同,并点了一个踩,不愿承认AI比我更懂人类。
但不可否认,我们在AI时代的稀缺性将向“人类本质”回归,弄清楚“人为何为人”可能是这个时代最重要的问题。完美的答案可能还需要时间来思索,但如果让现在的我来回答这个问题,我会说:
“独特的品味,真实的活人感和小圈子的归属感是人之根本。”

年度回顾
将周刊内容按照时间线进行串联总结:
第一季度:许可证之争、国产AI爆火与智能体的萌芽
年初,数据库领域率先燃起战火,Redis和Elasticsearch的许可证变动引发了社区关于开源商业模式的剧烈讨论。紧接着,NVIDIA在CES 2025上发布的RTX 50系列及Blackwell架构,预示着个人PC向AI超级计算机转型的开始。
- 社会热度: 1月,美国对TikTok的“不卖就禁”法案导致大量“TikTok难民”涌入小红书,引发了关于跨文化社区管理的讨论。
- 国产之光: 春节期间,DeepSeek (R1) 凭借极高的性价比和开源精神震惊全球,甚至引发了美国监管层对技术出口管制的担忧。
- 技术趋势: OpenAI推出的L3级智能体Operator和华为宇树机器人在春晚的亮相,标志着AI开始从“对话框”走向“实际操作”和“物理世界”。
第二季度:氛围编程、全球化架构与数学突破
随着AI工具的普及,开发者群体中兴起了一种名为“氛围编程(Vibe Coding)”的新范式,强调通过AI辅助快速实现功能而非深究细节,这在降低门槛的同时也引发了对技能退化的担忧。
- 社会热度: 北京大学校友王虹在三维空间中证明了困扰数学界百年的挂谷猜想,成为科学界的年度盛事。
- 技术深度: Model Context Protocol (MCP) 协议的发布解决了AI模型与外部系统集成的痛点,成为AI应用层开发的关键标准。
- 企业动态: 支付宝由于测试“国补”功能误部署导致系统Bug,让社会再次关注到高并发支付系统的稳定性挑战。
第三季度:推理模型乱斗、AI垃圾反思与硬件革新
进入年中,AI的竞争进入了“深水区”。Qwen 3(通义千问)系列的发布让国产模型在编程和逻辑推理上达到了全球领先水平。同时,Google的Gemini 2.5/3系列通过图像生成与实时推理能力,开始尝试平替传统专业软件如PS。
- 社会热度: 互联网开始反思“Slop(AI生成的低质量垃圾内容)”现象,研究表明过度接触此类数据甚至会导致模型产生“脑损伤”般的认知衰退。
- 行业变革: GitHub CEO Thomas Dohmke的离职,标志着GitHub将更紧密地整合进微软的AI战略版图。
- 生活方式: 周刊通过“新公园文化”和“外卖员生活体验”等记录,反映了在技术高速发展下,普通人寻找精神慰藉与生活实感的努力。
第四季度:Faker六冠、白银狂潮与AGI的终极赛跑
年末,技术与现实社会的碰撞达到了高潮。AI模型通过强化学习(RL)和链式思考(CoT)实现了智能形态的重塑,GPT-5.2、Claude 4.5以及DeepSeek V3.2的相继发布,将“长时推理”推向了极致。
- 社会热度: Faker获得职业生涯第六冠,被誉为“最高的山、最长的河”,引发了全网关于坚持与巅峰的讨论。同时,白银价格的暴涨严重冲击了光伏和电动车等高科技制造业的供应链成本。
- 程序员节: 1024程序员节期间,关于“程序员身份认同”的讨论升温,大家在拥抱AI驱动开发的同时,也在反思如何保留“纯粹工程”的艺术性。
- 年度人物: 《时代》杂志将年度人物授予AI构建者们,比喻他们如同当年修建摩天大楼的工人,正坐在钢梁上俯瞰并重塑人类的未来。
⭐️ 更多细节可阅读往期:肖恩技术周刊
数据分析
2025年1月1日- 12月31日共发表了46期周刊,累计117,458字(vuepress字数统计),各类内容共592条,公众号累计阅读8410人次。
阅读趋势
52-55期题材应该命中了流量池,阅读量高很多。除去这几期外整体趋势比较平稳,已有30+左右的稳定读者啦,谢谢你们的喜欢。

信息源
周刊信息源持续扩充中,已包含130+ RSS订阅源,主要覆盖了:
- 技术前沿资讯
- 知名开发者技术博客
- 国内大厂技术团队公众号(美团、阿里、腾讯、字节等)
- 国外技术公司工程博客

内容分析
内容共592条,类型占比:

今年主题覆盖情况(TOP100关键词):

来年规划
第一是增加“活人感”。正如前文所述,在AI时代,“活人感”是最重要的稀缺特质之一。这一点其实在24年总结中已经注意到,但今年碍于精力实在有限,未能做到有效改善。来年继续去AI味,尝试更人性化的开篇内容,并在摘要后增加个人见解。
第二是优化信息源。丰富的信息源是周刊质量的保障,今年增加了不少,达到了134个。但只求量不行,更需要质。来年在持续收集的过程中也会对现有信息源进行整理,剔除低质部分。
第三是流程自动化。周刊的产出流程为:信息收集 → 阅读 → 留存 → 撰写。理想状态应该是只聚焦于阅读、标注是否喜欢、想法等,工具基于交互自动生成周刊。
信息收集基本实现了自动化,通过自部署FreshRSS + 定时任务实现RSS源的定时拉取,再通过网页端或手机应用Readrops实现随时随地碎片阅读,更多细节见:碎片时间刷文章!懒人阅读方案分享。
阅读是目前耗时最多的阶段,虽有AI工具辅助,但整体效率仍不高。有考虑搞一个AI初筛工具,但实际上一天收集的内容数量并不多(大概百来篇),且一篇文章多数情况看了标题和第一段就能确定是否对味,因此筛选并不是核心痛点。效率低的根本原因应该还是阅读本身,被英语水平和阅读效率所拖累(从小就阅读慢😭),来年再研究研究有没有提效思路。
留存目前使用flomo,撰写是kimi + Obsidian + doocs/md。理论上这两步可以做到全自动化。
调查问卷
闭门造车当然是不行的,最后还是例行问卷收集环节,虽然召回率很低,但不能没有!

