肖恩技术周刊肖恩技术周刊
主页
  • 2025

    • 第 47 期:端午安康
    • 第 46 期:好习惯要坚持
    • 第 45 期:冰冷的规则
    • 第 44 期:凌晨3点的高速
    • 第 43 期:电子榨菜
    • 第 42 期:新公园文化
    • 第 41 期:疲乏
    • 第 40 期:智能体是通往AGI的必经之路吗?
    • 第 39 期:战斗,爽!
    • 第 38 期:陪伴
    • 第 37 期:反差魅力
    • 第 36 期:国漫雄起!
    • 第 35 期:DeepSeek爆火
    • 第 34 期:辞旧迎新
    • 第 33 期:泼天流量?
    • 第 32 期:克隆声音
    • 第 31 期:自力更生
  • 2024

    • 第 30 期:2024的尾声
    • 第 29 期:宇宙的尽头是上岸
    • 第 28 期:小机器人是什么鬼啊?
    • 第 27 期:移动的移动充电宝
    • 第 26 期:无痛写作
    • 第 25 期:第一生产力
    • 第 24 期:伟大的母亲
    • 第 23 期:MAGA!
    • 第 22 期:4 > 1
    • 第 21 期:惬意
    • 第 20 期:折腾要趁早
    • 第 19 期:物理学不存在了
    • 第 18 期:啪的一下,假期就没了!
    • 第 17 期:牛市来了?
    • 第 16 期:白嫖AI的最佳时间
    • 第 15 期:中秋节快乐
    • 第 14 期:什么是完美副业?
    • 第 13 期:肉,好次!
    • 第 12 期:热 & 累!
    • 第 11 期:猴哥,我好急啊!
    • 第 10 期:太阳神鸟
    • 第 9 期:Queen Wen!!!
    • 第 8 期:奥运会热度不高?
    • 第 7 期:Fight!
    • 第 6 期:陶冶情操!
    • 第 5 期:小魔女太可爱了!
    • 第 4 期:Steam夏季促销开始啦!
    • 第 3 期:基于“智能体”创造自发展的冒险镇
    • 第 2 期:房地产降温
    • 第 1 期:起点!
  • 2024
博客
订阅
GitHub
主页
  • 2025

    • 第 47 期:端午安康
    • 第 46 期:好习惯要坚持
    • 第 45 期:冰冷的规则
    • 第 44 期:凌晨3点的高速
    • 第 43 期:电子榨菜
    • 第 42 期:新公园文化
    • 第 41 期:疲乏
    • 第 40 期:智能体是通往AGI的必经之路吗?
    • 第 39 期:战斗,爽!
    • 第 38 期:陪伴
    • 第 37 期:反差魅力
    • 第 36 期:国漫雄起!
    • 第 35 期:DeepSeek爆火
    • 第 34 期:辞旧迎新
    • 第 33 期:泼天流量?
    • 第 32 期:克隆声音
    • 第 31 期:自力更生
  • 2024

    • 第 30 期:2024的尾声
    • 第 29 期:宇宙的尽头是上岸
    • 第 28 期:小机器人是什么鬼啊?
    • 第 27 期:移动的移动充电宝
    • 第 26 期:无痛写作
    • 第 25 期:第一生产力
    • 第 24 期:伟大的母亲
    • 第 23 期:MAGA!
    • 第 22 期:4 > 1
    • 第 21 期:惬意
    • 第 20 期:折腾要趁早
    • 第 19 期:物理学不存在了
    • 第 18 期:啪的一下,假期就没了!
    • 第 17 期:牛市来了?
    • 第 16 期:白嫖AI的最佳时间
    • 第 15 期:中秋节快乐
    • 第 14 期:什么是完美副业?
    • 第 13 期:肉,好次!
    • 第 12 期:热 & 累!
    • 第 11 期:猴哥,我好急啊!
    • 第 10 期:太阳神鸟
    • 第 9 期:Queen Wen!!!
    • 第 8 期:奥运会热度不高?
    • 第 7 期:Fight!
    • 第 6 期:陶冶情操!
    • 第 5 期:小魔女太可爱了!
    • 第 4 期:Steam夏季促销开始啦!
    • 第 3 期:基于“智能体”创造自发展的冒险镇
    • 第 2 期:房地产降温
    • 第 1 期:起点!
  • 2024
博客
订阅
GitHub
  • 主页
  • 合集

    • 2024年周刊合集(01期 - 30期)
  • 周刊

    • 2025

      • 第 47 期:端午安康
      • 第 46 期:好习惯要坚持
      • 第 45 期:冰冷的规则
      • 第 44 期:凌晨3点的高速
      • 第 43 期:电子榨菜
      • 第 42 期:新公园文化
      • 第 41 期:疲乏
      • 第 40 期:智能体是通往AGI的必经之路吗?
      • 第 39 期:战斗,爽!
      • 第 38 期:陪伴
      • 第 37 期:反差魅力
      • 第 36 期:国漫雄起!
      • 第 35 期:DeepSeek爆火
      • 第 34 期:辞旧迎新
      • 第 33 期:泼天流量?
      • 第 32 期:克隆声音
      • 第 31 期:自力更生
    • 2024

      • 第 30 期:2024的尾声
      • 第 29 期:宇宙的尽头是上岸
      • 第 28 期:小机器人是什么鬼啊?
      • 第 27 期:移动的移动充电宝
      • 第 26 期:无痛写作
      • 第 25 期:第一生产力
      • 第 24 期:伟大的母亲
      • 第 23 期:MAGA!
      • 第 22 期:4 > 1
      • 第 21 期:惬意
      • 第 20 期:折腾要趁早
      • 第 19 期:物理学不存在了
      • 第 18 期:啪的一下,假期就没了!
      • 第 17 期:牛市来了?
      • 第 16 期:白嫖AI的最佳时间
      • 第 15 期:中秋节快乐
      • 第 14 期:什么是完美副业?
      • 第 13 期:肉,好次!
      • 第 12 期:热 & 累!
      • 第 11 期:猴哥,我好急啊!
      • 第 10 期:太阳神鸟
      • 第 9 期:Queen Wen!!!
      • 第 8 期:奥运会热度不高?
      • 第 7 期:Fight!
      • 第 6 期:陶冶情操!
      • 第 5 期:小魔女太可爱了!
      • 第 4 期:Steam夏季促销开始啦!
      • 第 3 期:基于“智能体”创造自发展的冒险镇
      • 第 2 期:房地产降温
      • 第 1 期:起点!

肖恩技术周刊(第 47 期):端午安康

周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
公众号二维码

开篇图

祝大家端午安康,儿童节快乐!上图为《多洛可小镇》游戏截图,一款画风可爱的种田游戏,非常适合社畜休闲时游玩。

业界资讯

Claude团队推出“电路追踪”(circuit tracing)工具,读懂大模型的“脑回路”?

Claude团队通过构建“替代模型”来揭示语言模型计算图的方法。

开发了跨层转码器(CLT),其特征分布在模型的多层中,通过线性编码器和非线性激活从残差流读取,并向MLP层输出。训练后的CLT可以定义替代模型,替换底层模型的MLP神经元。进一步构建的局部替代模型在特定提示上替换了CLT,并添加误差调整项以匹配原始模型输出。归因图通过描绘局部替代模型的计算步骤,包含输出节点、中间节点、初级输入节点和误差节点,边代表直接线性归因。

还开发了交互式界面用于追溯关键路径,并通过特征可视化手动解释和标记图中的特征。此外,通过将语义相似的特征分组为超节点,归因图能够更清晰地展示模型的计算过程。该方法在18层语言模型上进行了初步研究,并为后续对Claude 3.5 Haiku模型的研究奠定了基础。尽管取得了一定成果,但该方法仍存在局限性,如缺失注意力电路、重建误差和图复杂性等问题。

DeepSeek-R1 更新,思考更深,推理更强

DeepSeek R1 模型于 2025 年 5 月 28 日完成小版本升级,新版本号为 DeepSeek-R1-0528。该版本在深度思考能力上显著强化,基于 DeepSeek V3 Base 模型,通过增加算力提升思维深度与推理能力,在多项基准测评中取得优异成绩,接近国际顶尖模型水平。此外,新版模型在幻觉问题上优化,降低了幻觉率;创意写作能力也得到提升,能输出更长、结构更完整的长篇作品。工具调用能力、前端代码生成、角色扮演等领域也有所更新。API 同步更新,增加了新功能支持并调整了 max_tokens 参数。模型开源,私有化部署简单,开源版本上下文长度为 128K,采用 MIT License。

技术博客

渐进式JSON(英文)

文章探讨了如何将渐进式加载的概念应用于JSON数据传输,以解决传统JSON传输方式中客户端需等待完整数据加载完成才能处理的局限性。作者提出了“渐进式JSON”的概念,通过广度优先的方式发送数据,先传输顶层对象结构并用占位符标记未发送部分,后续逐步填充数据。这种方式允许客户端在数据流中逐步处理数据,未加载部分以Promise形式表示。文章还介绍了React Server Components(RSC)如何利用这种渐进式JSON实现更高效的用户界面加载。RSC通过将组件树的属性以渐进式方式发送到客户端,允许React在数据流中逐步构建组件树,并通过<Suspense>组件控制加载状态的显示,避免页面内容的随意跳变。作者呼吁更多工具采用这种渐进式数据流的方式,以改善用户体验。

MCP技术浪潮中的Agent应用开发新范式

本文介绍了MCP(模型上下文协议)及其在AI应用开发中的作用。MCP通过标准化应用程序与AI模型之间的上下文信息交换,简化了资源和工具的集成。其核心组件包括MCP Server、MCP Client和MCP Host,采用JSON-RPC编码进行通信。MCP的执行细节涉及Host调用LLM、Client调用MCP Server以及返回最终处理结果的过程。与Agent和Function Calling相比,MCP解决了标准化接口和复用率等问题。目前,MCP技术生态发展迅速,出现了多个MCP Server Marketplace和大量支持MCP的应用程序。然而,MCP也面临应用范围受限、行业标准支持挑战、本质受质疑以及安全风险等问题。

如何构建你的AI智能体:让AI更出色的11种提示技巧

本文探讨了如何通过提示工程提升AI智能体的表现。提示工程是优化AI模型输入提示的过程,以增强其在特定任务上的表现。文章总结了11种提示技巧,包括提供高质量的上下文信息、保持提示组件间的一致性、让模型与用户视角对齐、避免过度拟合、注意模型调用工具的局限性等。这些技巧强调了为模型提供完整且一致的上下文的重要性,并指出模型的表现依赖于提示中包含的信息的完整性和一致性。文章还建议像管理代码库一样管理提示,进行版本控制、审阅和测试,以确保其质量和一致性。通过这些方法,可以将AI智能体打造成真正扩展人类能力的伙伴,而不是制造更多麻烦。

开源项目

deepwiki-open:代码库交互式文档

DeepWiki的开源平替,能够为GitHub、GitLab或Bitbucket仓库自动生成交互式维基文档。它通过分析代码结构、生成全面文档、创建可视化图表,并将其组织成易于导航的维基,帮助用户快速了解仓库内容。DeepWiki支持多种功能,包括即时文档生成、私有仓库支持、智能分析、美观图表、问答功能以及深度研究等。它还支持Google Gemini、OpenAI、OpenRouter和本地Ollama等多种AI模型。

void:开源AI代码编辑器

Void是一个开源AI代码编辑器,旨在平替Cursor。它通过AI代理处理代码库,支持检查点和可视化更改,并允许本地运行任何模型或主机。

学习资源

开源大模型食用指南

针对国内初学者的开源大模型(LLM)和多模态大模型(MLLM)教程,专注于Linux平台上的快速部署、使用和微调。内容涵盖环境配置、模型部署、应用指导及微调方法,支持LLaMA、ChatGLM等主流模型。建议学习顺序为先环境配置,再模型部署,最后微调。项目还提供应用案例,如Chat-嬛嬛、Tianji-天机等,并推荐Happy-LLM、Tiny-Universe等进阶学习资源。

从零开始的大语言模型原理与实践教程

深入理解大语言模型(LLM)的原理和训练过程,分为基础知识和实战应用两部分。基础知识部分(第1章至第4章)涵盖了自然语言处理(NLP)的基础概念、Transformer架构、预训练语言模型的类型以及LLM的定义和训练策略。实战应用部分(第5章至第7章)则指导读者动手实现LLaMA2模型,掌握从预训练到微调的全流程,并介绍LLM在模型评测、检索增强(RAG)和智能体(Agent)等领域的应用。

中国软件著作权申请教程 & 模板文件

关于中国软件著作权申请的详细指南,提供了完整的申请流程、所需材料清单和常见问题解决方案。申请材料主要包括用户操作手册或设计说明书、源码文档和申请表。不同申请主体(个人、多人、企业、院校等)需提交不同的附加材料,如身份证复印件、营业执照复印件或合作开发协议等。文章还针对申请过程中常见的问题,如补正通知书未收到、补正材料提交方式、高频错误等,提供了具体的解决方法。此外,作者提供了联系方式和相关资源链接,以帮助申请人顺利完成软件著作权的申请。

随便看看

JWT的十年及未来展望(英文)

文章回顾了JSON Web Token(JWT)自2015年成为RFC 7519标准以来的十年发展历程。JWT及其相关标准(如JWS、JWE、JWK、JWA等)经过4.5年的开发,最终在2015年正式发布,成为互联网安全领域的重要组成部分。JWT与OpenID Connect协同设计,旨在创建通用且广泛适用的安全标准。如今,JWT已被广泛应用于多种场景,甚至包括发明者未曾想象的领域,例如打击欺诈电话。

文章还提到,为了确保JWT在未来十年的安全性,相关规范正在更新。例如,JWT最佳当前实践规范(BCP)正在更新,以纳入过去五年中发现的新威胁和缓解措施。同时,OAuth 2.0客户端认证和授权授权的JWT配置文件也在更新,以解决因令牌受众值的歧义而引起的漏洞。作者对过去十年的工作表示感谢,并对未来充满期待。

【Java 30年】詹姆斯・高斯林口述历史

计算机历史博物馆对Java语言之父James Gosling的访谈录,详细回顾了他职业生涯及Java语言的诞生与发展。Gosling于1955年出生,1977年毕业于卡尔加里大学,1983年在卡内基梅隆大学获得博士学位,期间开发了Unix版Emacs和Andrew窗口系统。1991年加入Sun公司后,他参与Green项目,因C/C++的局限性,开发了Java(最初名为Oak),其“一次编写,随处运行”的特性使其在互联网时代大放异彩。1995年,Java与Netscape合作后迅速流行,成为企业计算和移动领域的主导语言。Gosling在Sun工作26年后,短暂加入谷歌,后成为Liquid Robotics首席软件架构师,目前已退休。访谈还涉及他对开源项目和编程工具的贡献。

循环往复的“开发者更替” 热潮(英文)

文章探讨了软件开发领域中“开发者替代”炒作的周期性现象,分析了从无代码(NoCode)到人工智能辅助开发(AI-assisted development)等技术变革对软件开发者的影响。文章指出,每隔几年就会出现一种声称能让软件开发者变得多余的新技术,但这些技术最终并未取代开发者,而是促使开发者技能的转型和提升。

文章回顾了无代码/低代码工具、云计算技术、海外开发浪潮以及当前的AI辅助开发技术的兴起与发展。无代码工具创造了新的专业领域,如无代码专家;云计算技术将系统管理员转变为DevOps工程师;海外开发面临沟通和质量问题;而AI辅助开发虽然能快速生成代码,但生成的代码常存在错误,且缺乏连贯的架构。文章强调,代码是负债而非资产,真正的价值在于代码所支持的业务能力。AI在局部优化方面表现出色,但在全局设计方面无能为力。因此,系统架构能力才是开发者的核心竞争力,也是AI无法替代的。

Last Updated:
Next
第 46 期:好习惯要坚持