肖恩技术周刊（第 59 期）：OpenAI进化之路

周刊内容: 对一周内阅读的资讯或技术内容精品（个人向）进行总结，分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”，除周刊外还有更多原创技术博文，欢迎关注👏🏻~

以不同年份为节点，呈现了OpenAI模型的进化历程。从2018年的GPT-1只能简单表达困惑，到2019年的GPT-2能与人探讨AI相关问题。2021年的TEXT-DAVINCI-001能礼貌问候并询问未来AI相关事宜，2023年的GPT-4-0314能提出与未来AI对话可能涉及的诸多前沿话题，再到2025年的GPT-5能以更深入、更具哲学意味的方式思考自身与未来模型的关系以及对人类的看法，展现了AI在理解、表达、思考深度和广度等方面的飞速进步。

业界资讯

DeepSeek-V3.1 发布

DeepSeek-V3.1版本发布，包含混合推理架构，支持思考模式与非思考模式。思考效率提升，Agent能力增强，在编程和搜索智能体测试中表现优异。API升级，支持128K上下文和strict模式Function Calling，兼容Anthropic API格式。模型开源，Base模型和后训练模型在Huggingface与魔搭平台发布。价格调整，自2025年9月6日起执行新版价格表，取消夜间时段优惠。

佳文共赏

语言腐败之首：代指泛滥

文章探讨了网络语言中“代指泛滥”现象及其影响。代指是指在讨论具体的人或事物时，不直呼其名，而是使用模糊的代词来代替。这种现象在网络上尤为严重，形式多样，包括缩略/变形/谐音、特征/事件指代、隐喻/象征化和圈层黑话/梗等。

文章指出代指泛滥严重影响了交流的准确性和有效性，增加了沟通成本，模糊了信息，助长了思维惰性和标签化，消解了严肃讨论和公共理性，加速了语言污染和记忆断层，甚至可能成为网络暴力的工具。其背后的原因包括规避风险与审查、构建圈层身份与认同、表达特定情感与立场、追求新奇趣味和传播性、从众心理与语言惰性等。

作者呼吁警惕“代指泛滥”的弊端，努力保持语言的准确性和沟通的开放性，以维护健康的网络生态。

关于优秀系统设计的一切

文章分享了系统设计的经验。好的系统设计应低调且稳定，长时间不出错。系统设计的核心是组装服务，其中数据库是关键。设计时要减少状态组件，因为它们容易出错。处理操作时，慢操作应放入后台作业，避免阻塞主线程。缓存虽能提升性能，但会增加状态管理的复杂性，需谨慎使用。事件驱动架构适用于特定场景，但不应过度依赖。数据推送比拉取更高效，尤其在处理大量客户端时。热点路径是系统中最关键的部分，需特别关注其稳定性和性能。日志和度量对监控系统运行至关重要，失败策略需根据具体功能灵活选择。总之，良好的系统设计需综合考虑多个方面，以实现高效、稳定和可维护的系统。

MIT报告发现95% 的公司在生成式AI支出上 “零回报”

麻省理工学院的一项新研究发现，企业在生成式人工智能项目上花费了约300亿美元，但95%的企业表示这些工具没有带来任何可衡量的收益。只有5%的试点项目实现了价值提取，大多数项目对收入或利润没有影响。许多公司匆忙测试像ChatGPT这样的大型语言模型平台，但发现这些工具往往无法与实际工作流程匹配，缺乏上下文学习和适应性。报告指出，生成式人工智能系统大多无法保留反馈、适应上下文或随着时间推进建立新的推理能力。尽管如此，投资者和高管仍对人工智能充满兴趣，希望技术进步能够弥补这些差距。然而，短期内的进展可能比许多人预期的要慢。

技术博客

一个半月高强度 Claude Code 使用后感受

文章分享了一个半月高强度使用Claude Code（简称CC）后的感受和经验总结。指出CC显著提升了编程的迭代速度，其快速更新和新功能的推出令人印象深刻。

CC作为命令行工具，相比传统编辑器AI，能够更全面地理解和操作整个项目，从而提高开发效率。然而，CC在处理某些任务时存在局限性，如复杂重构和特定语言支持不足。作者建议采用小步迭代的方式使用CC，以确保代码质量和可控性。他还分享了如何通过任务拆解、使用Subagent和合理管理上下文窗口来优化使用体验。

此外，CC在代码提交、文档撰写和数据处理等方面也有广泛应用。尽管存在一些限制，如模型性能波动和资源限制，作者认为vibe coding代表了一种新的编程思维模式，强调技术应为人服务，开发者需适应并利用AI技术以保持竞争力。

可信实验白皮书系列08：开放式分析引擎

本位介绍了AB实验分析方法库在美团的实践。实验分析引擎BETA具备丰富实验方法、易用性、高效性、多重比较修正、功效提升、统合分析和功效测算等特性，旨在帮助用户零门槛进行可信、高效的实验。系统采用模块化分层设计，包括应用层、接口层、路由层、数据准备层和分析方法层，提升迭代和拓展效率。分析引擎已向美团内部成员开放，提供多种接入方式。通过案例展示了如何使用分析引擎进行随机对照实验的设计和评估。白皮书基于美团实践，构建了完整的实验科学方法体系，提供使用指南，未来将持续追踪前沿进展，推动实验能力赋能。

是什么让 Claude Code 如此出色

本文分析了Claude Code作为AI代理的出色之处，并提供了构建类似代理的建议。作者通过使用Claude Code的经验，从控制循环、提示、工具和可操控性四个方面总结了关键要点。控制循环方面，Claude Code采用单一主线程，通过简单分支和待办事项列表处理复杂任务，避免多代理系统带来的调试难题。提示方面，使用上下文文件（如claude.md）传递用户偏好和开发人员指定的上下文，显著提升性能。工具方面，使用复杂的命令搜索代码库，避免RAG带来的复杂性和隐藏故障模式。可操控性方面，系统提示中包含关于语气、风格和主动性的详细指导，使代理的评论和行为更符合用户期望。