肖恩技术周刊（第 47 期）：端午安康

2025/6/3大约 10 分钟约 3084 字

肖恩技术周刊（第 47 期）：端午安康

对周内阅读的技术内容精品（个人向）进行总结。觉得不错可点击上方订阅，第一时间获取更新通知。

祝大家端午安康，儿童节快乐！上图为《多洛可小镇》游戏截图，一款画风可爱的种田游戏，非常适合社畜休闲时游玩。

业界资讯

Claude团队推出“电路追踪”（circuit tracing）工具，读懂大模型的“脑回路”?

Claude团队通过构建“替代模型”来揭示语言模型计算图的方法。

开发了跨层转码器（CLT），其特征分布在模型的多层中，通过线性编码器和非线性激活从残差流读取，并向MLP层输出。训练后的CLT可以定义替代模型，替换底层模型的MLP神经元。进一步构建的局部替代模型在特定提示上替换了CLT，并添加误差调整项以匹配原始模型输出。归因图通过描绘局部替代模型的计算步骤，包含输出节点、中间节点、初级输入节点和误差节点，边代表直接线性归因。

还开发了交互式界面用于追溯关键路径，并通过特征可视化手动解释和标记图中的特征。此外，通过将语义相似的特征分组为超节点，归因图能够更清晰地展示模型的计算过程。该方法在18层语言模型上进行了初步研究，并为后续对Claude 3.5 Haiku模型的研究奠定了基础。尽管取得了一定成果，但该方法仍存在局限性，如缺失注意力电路、重建误差和图复杂性等问题。

DeepSeek R1 模型于 2025 年 5 月 28 日完成小版本升级，新版本号为 DeepSeek-R1-0528。该版本在深度思考能力上显著强化，基于 DeepSeek V3 Base 模型，通过增加算力提升思维深度与推理能力，在多项基准测评中取得优异成绩，接近国际顶尖模型水平。此外，新版模型在幻觉问题上优化，降低了幻觉率；创意写作能力也得到提升，能输出更长、结构更完整的长篇作品。工具调用能力、前端代码生成、角色扮演等领域也有所更新。API 同步更新，增加了新功能支持并调整了 max_tokens 参数。模型开源，私有化部署简单，开源版本上下文长度为 128K，采用 MIT License。

技术博客

渐进式JSON（英文）

文章探讨了如何将渐进式加载的概念应用于JSON数据传输，以解决传统JSON传输方式中客户端需等待完整数据加载完成才能处理的局限性。作者提出了“渐进式JSON”的概念，通过广度优先的方式发送数据，先传输顶层对象结构并用占位符标记未发送部分，后续逐步填充数据。这种方式允许客户端在数据流中逐步处理数据，未加载部分以Promise形式表示。文章还介绍了React Server Components（RSC）如何利用这种渐进式JSON实现更高效的用户界面加载。RSC通过将组件树的属性以渐进式方式发送到客户端，允许React在数据流中逐步构建组件树，并通过<Suspense>组件控制加载状态的显示，避免页面内容的随意跳变。作者呼吁更多工具采用这种渐进式数据流的方式，以改善用户体验。

MCP技术浪潮中的Agent应用开发新范式

本文介绍了MCP（模型上下文协议）及其在AI应用开发中的作用。MCP通过标准化应用程序与AI模型之间的上下文信息交换，简化了资源和工具的集成。其核心组件包括MCP Server、MCP Client和MCP Host，采用JSON-RPC编码进行通信。MCP的执行细节涉及Host调用LLM、Client调用MCP Server以及返回最终处理结果的过程。与Agent和Function Calling相比，MCP解决了标准化接口和复用率等问题。目前，MCP技术生态发展迅速，出现了多个MCP Server Marketplace和大量支持MCP的应用程序。然而，MCP也面临应用范围受限、行业标准支持挑战、本质受质疑以及安全风险等问题。

如何构建你的AI智能体：让AI更出色的11种提示技巧

本文探讨了如何通过提示工程提升AI智能体的表现。提示工程是优化AI模型输入提示的过程，以增强其在特定任务上的表现。文章总结了11种提示技巧，包括提供高质量的上下文信息、保持提示组件间的一致性、让模型与用户视角对齐、避免过度拟合、注意模型调用工具的局限性等。这些技巧强调了为模型提供完整且一致的上下文的重要性，并指出模型的表现依赖于提示中包含的信息的完整性和一致性。文章还建议像管理代码库一样管理提示，进行版本控制、审阅和测试，以确保其质量和一致性。通过这些方法，可以将AI智能体打造成真正扩展人类能力的伙伴，而不是制造更多麻烦。

开源项目

deepwiki-open：代码库交互式文档

DeepWiki的开源平替，能够为GitHub、GitLab或Bitbucket仓库自动生成交互式维基文档。它通过分析代码结构、生成全面文档、创建可视化图表，并将其组织成易于导航的维基，帮助用户快速了解仓库内容。DeepWiki支持多种功能，包括即时文档生成、私有仓库支持、智能分析、美观图表、问答功能以及深度研究等。它还支持Google Gemini、OpenAI、OpenRouter和本地Ollama等多种AI模型。

void：开源AI代码编辑器

Void是一个开源AI代码编辑器，旨在平替Cursor。它通过AI代理处理代码库，支持检查点和可视化更改，并允许本地运行任何模型或主机。

资源推荐

开源大模型食用指南

针对国内初学者的开源大模型（LLM）和多模态大模型（MLLM）教程，专注于Linux平台上的快速部署、使用和微调。内容涵盖环境配置、模型部署、应用指导及微调方法，支持LLaMA、ChatGLM等主流模型。建议学习顺序为先环境配置，再模型部署，最后微调。项目还提供应用案例，如Chat-嬛嬛、Tianji-天机等，并推荐Happy-LLM、Tiny-Universe等进阶学习资源。

从零开始的大语言模型原理与实践教程

深入理解大语言模型（LLM）的原理和训练过程，分为基础知识和实战应用两部分。基础知识部分（第1章至第4章）涵盖了自然语言处理（NLP）的基础概念、Transformer架构、预训练语言模型的类型以及LLM的定义和训练策略。实战应用部分（第5章至第7章）则指导读者动手实现LLaMA2模型，掌握从预训练到微调的全流程，并介绍LLM在模型评测、检索增强（RAG）和智能体（Agent）等领域的应用。

中国软件著作权申请教程 & 模板文件

关于中国软件著作权申请的详细指南，提供了完整的申请流程、所需材料清单和常见问题解决方案。申请材料主要包括用户操作手册或设计说明书、源码文档和申请表。不同申请主体（个人、多人、企业、院校等）需提交不同的附加材料，如身份证复印件、营业执照复印件或合作开发协议等。文章还针对申请过程中常见的问题，如补正通知书未收到、补正材料提交方式、高频错误等，提供了具体的解决方法。此外，作者提供了联系方式和相关资源链接，以帮助申请人顺利完成软件著作权的申请。

佳文共赏

JWT的十年及未来展望（英文）

文章回顾了JSON Web Token（JWT）自2015年成为RFC 7519标准以来的十年发展历程。JWT及其相关标准（如JWS、JWE、JWK、JWA等）经过4.5年的开发，最终在2015年正式发布，成为互联网安全领域的重要组成部分。JWT与OpenID Connect协同设计，旨在创建通用且广泛适用的安全标准。如今，JWT已被广泛应用于多种场景，甚至包括发明者未曾想象的领域，例如打击欺诈电话。

文章还提到，为了确保JWT在未来十年的安全性，相关规范正在更新。例如，JWT最佳当前实践规范（BCP）正在更新，以纳入过去五年中发现的新威胁和缓解措施。同时，OAuth 2.0客户端认证和授权授权的JWT配置文件也在更新，以解决因令牌受众值的歧义而引起的漏洞。作者对过去十年的工作表示感谢，并对未来充满期待。

【Java 30年】詹姆斯・高斯林口述历史

计算机历史博物馆对Java语言之父James Gosling的访谈录，详细回顾了他职业生涯及Java语言的诞生与发展。Gosling于1955年出生，1977年毕业于卡尔加里大学，1983年在卡内基梅隆大学获得博士学位，期间开发了Unix版Emacs和Andrew窗口系统。1991年加入Sun公司后，他参与Green项目，因C/C++的局限性，开发了Java（最初名为Oak），其“一次编写，随处运行”的特性使其在互联网时代大放异彩。1995年，Java与Netscape合作后迅速流行，成为企业计算和移动领域的主导语言。Gosling在Sun工作26年后，短暂加入谷歌，后成为Liquid Robotics首席软件架构师，目前已退休。访谈还涉及他对开源项目和编程工具的贡献。

循环往复的“开发者更替” 热潮（英文）

文章探讨了软件开发领域中“开发者替代”炒作的周期性现象，分析了从无代码（NoCode）到人工智能辅助开发（AI-assisted development）等技术变革对软件开发者的影响。文章指出，每隔几年就会出现一种声称能让软件开发者变得多余的新技术，但这些技术最终并未取代开发者，而是促使开发者技能的转型和提升。

文章回顾了无代码/低代码工具、云计算技术、海外开发浪潮以及当前的AI辅助开发技术的兴起与发展。无代码工具创造了新的专业领域，如无代码专家；云计算技术将系统管理员转变为DevOps工程师；海外开发面临沟通和质量问题；而AI辅助开发虽然能快速生成代码，但生成的代码常存在错误，且缺乏连贯的架构。文章强调，代码是负债而非资产，真正的价值在于代码所支持的业务能力。AI在局部优化方面表现出色，但在全局设计方面无能为力。因此，系统架构能力才是开发者的核心竞争力，也是AI无法替代的