肖恩技术周刊(第 59 期):OpenAI进化之路
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
以不同年份为节点,呈现了OpenAI模型的进化历程。从2018年的GPT-1只能简单表达困惑,到2019年的GPT-2能与人探讨AI相关问题。2021年的TEXT-DAVINCI-001能礼貌问候并询问未来AI相关事宜,2023年的GPT-4-0314能提出与未来AI对话可能涉及的诸多前沿话题,再到2025年的GPT-5能以更深入、更具哲学意味的方式思考自身与未来模型的关系以及对人类的看法,展现了AI在理解、表达、思考深度和广度等方面的飞速进步。
业界资讯
DeepSeek-V3.1 发布
DeepSeek-V3.1版本发布,包含混合推理架构,支持思考模式与非思考模式。思考效率提升,Agent能力增强,在编程和搜索智能体测试中表现优异。API升级,支持128K上下文和strict模式Function Calling,兼容Anthropic API格式。模型开源,Base模型和后训练模型在Huggingface与魔搭平台发布。价格调整,自2025年9月6日起执行新版价格表,取消夜间时段优惠。
佳文共赏
语言腐败之首:代指泛滥
文章探讨了网络语言中“代指泛滥”现象及其影响。代指是指在讨论具体的人或事物时,不直呼其名,而是使用模糊的代词来代替。这种现象在网络上尤为严重,形式多样,包括缩略/变形/谐音、特征/事件指代、隐喻/象征化和圈层黑话/梗等。
文章指出代指泛滥严重影响了交流的准确性和有效性,增加了沟通成本,模糊了信息,助长了思维惰性和标签化,消解了严肃讨论和公共理性,加速了语言污染和记忆断层,甚至可能成为网络暴力的工具。其背后的原因包括规避风险与审查、构建圈层身份与认同、表达特定情感与立场、追求新奇趣味和传播性、从众心理与语言惰性等。
作者呼吁警惕“代指泛滥”的弊端,努力保持语言的准确性和沟通的开放性,以维护健康的网络生态。
关于优秀系统设计的一切
文章分享了系统设计的经验。好的系统设计应低调且稳定,长时间不出错。系统设计的核心是组装服务,其中数据库是关键。设计时要减少状态组件,因为它们容易出错。处理操作时,慢操作应放入后台作业,避免阻塞主线程。缓存虽能提升性能,但会增加状态管理的复杂性,需谨慎使用。事件驱动架构适用于特定场景,但不应过度依赖。数据推送比拉取更高效,尤其在处理大量客户端时。热点路径是系统中最关键的部分,需特别关注其稳定性和性能。日志和度量对监控系统运行至关重要,失败策略需根据具体功能灵活选择。总之,良好的系统设计需综合考虑多个方面,以实现高效、稳定和可维护的系统。
MIT报告发现95% 的公司在生成式AI支出上 “零回报”
麻省理工学院的一项新研究发现,企业在生成式人工智能项目上花费了约300亿美元,但95%的企业表示这些工具没有带来任何可衡量的收益。只有5%的试点项目实现了价值提取,大多数项目对收入或利润没有影响。许多公司匆忙测试像ChatGPT这样的大型语言模型平台,但发现这些工具往往无法与实际工作流程匹配,缺乏上下文学习和适应性。报告指出,生成式人工智能系统大多无法保留反馈、适应上下文或随着时间推进建立新的推理能力。尽管如此,投资者和高管仍对人工智能充满兴趣,希望技术进步能够弥补这些差距。然而,短期内的进展可能比许多人预期的要慢。
技术博客
一个半月高强度 Claude Code 使用后感受
文章分享了一个半月高强度使用Claude Code(简称CC)后的感受和经验总结。指出CC显著提升了编程的迭代速度,其快速更新和新功能的推出令人印象深刻。
CC作为命令行工具,相比传统编辑器AI,能够更全面地理解和操作整个项目,从而提高开发效率。然而,CC在处理某些任务时存在局限性,如复杂重构和特定语言支持不足。作者建议采用小步迭代的方式使用CC,以确保代码质量和可控性。他还分享了如何通过任务拆解、使用Subagent和合理管理上下文窗口来优化使用体验。
此外,CC在代码提交、文档撰写和数据处理等方面也有广泛应用。尽管存在一些限制,如模型性能波动和资源限制,作者认为vibe coding代表了一种新的编程思维模式,强调技术应为人服务,开发者需适应并利用AI技术以保持竞争力。
可信实验白皮书系列08:开放式分析引擎
本位介绍了AB实验分析方法库在美团的实践。实验分析引擎BETA具备丰富实验方法、易用性、高效性、多重比较修正、功效提升、统合分析和功效测算等特性,旨在帮助用户零门槛进行可信、高效的实验。系统采用模块化分层设计,包括应用层、接口层、路由层、数据准备层和分析方法层,提升迭代和拓展效率。分析引擎已向美团内部成员开放,提供多种接入方式。通过案例展示了如何使用分析引擎进行随机对照实验的设计和评估。白皮书基于美团实践,构建了完整的实验科学方法体系,提供使用指南,未来将持续追踪前沿进展,推动实验能力赋能。
是什么让 Claude Code 如此出色
本文分析了Claude Code作为AI代理的出色之处,并提供了构建类似代理的建议。作者通过使用Claude Code的经验,从控制循环、提示、工具和可操控性四个方面总结了关键要点。控制循环方面,Claude Code采用单一主线程,通过简单分支和待办事项列表处理复杂任务,避免多代理系统带来的调试难题。提示方面,使用上下文文件(如claude.md)传递用户偏好和开发人员指定的上下文,显著提升性能。工具方面,使用复杂的命令搜索代码库,避免RAG带来的复杂性和隐藏故障模式。可操控性方面,系统提示中包含关于语气、风格和主动性的详细指导,使代理的评论和行为更符合用户期望。
开源项目
60s:开放 API 集合
60s API 是一个开源、免费的高质量开放API集合,提供日更资讯、热搜榜单、实用功能和娱乐消遣等多种服务。
claudia:Claude Code图形界面
为Claude Code设计的优雅桌面图形用户界面(GUI)伴侣,旨在提升AI辅助开发的体验。
工具推荐
Qoder
Qoder是通义推出的智能编程平台,通过增强的上下文引擎和智能代理,帮助开发者更高效地进行软件开发。
AI播客
帮助用户将创意转化为播客,提供速听精华和深度探索两种播客时长选择,支持多种文件格式和语言,并且有不同音色可选。
学习资源
吴恩达AI课:Claude Code-高智能的编程助手
Claude Code 实战开发课程,全面教授如何使用进行高效的软件开发工作。将掌握利用 AI 助手进行代码探索、开发、测试、重构和调试的核心技能,显著提升编程效率和代码质量。
AI 相关的笔记
精心组织的引导词集合,帮助提升AI协作效率和质量。