肖恩技术周刊(第 73 期):何意味?
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~

《时代》杂志公布了2025年的百大年度照片,展示了25年全球各地的重要事件和瞬间,涵盖了政治、社会、自然、体育等多个领域。这些照片不仅记录了重大事件,也反映了人类在面对各种挑战时的情感和反应。
其中这张拍摄于2025 年 3 月 21 日,在华盛顿白宫外,当唐纳德・特朗普总统向记者发表讲话时,埃隆・马斯克在一旁注视着。
业界资讯
DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

DeepSeek 发布了 V3.2 正式版模型,包含 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 两个版本。DeepSeek-V3.2 平衡推理能力与输出长度,在公开推理 Benchmark 测试中达到 GPT-5 水平,输出长度大幅降低,减少计算开销与用户等待时间。DeepSeek-V3.2-Speciale 是长思考增强版,结合 DeepSeek-Math-V2 的定理证明能力,推理能力媲美 Gemini-3.0-Pro,在 IMO 2025、CMO 2025、ICPC World Finals 2025 及 IOI 2025 中斩获金牌,但仅用于研究,不支持工具调用。DeepSeek-V3.2 首次将思考融入工具调用,提出大规模 Agent 训练数据合成方法,构造大量强化学习任务,提高模型泛化能力,在智能体工具调用评测中达到开源模型最高水平。DeepSeek-V3.2 已在官方网页端、App 和 API 更新,DeepSeek-V3.2-Speciale 以临时 API 服务形式开放。
豆包手机助手

字节跳动发布“豆包手机助手”技术预览版,这是一款具有创新性的手机AI助手。其核心技术亮点包括“端侧记忆”功能,实现本地持久化存储,加密保护用户数据,支持快速调取信息,如车位照片、快递取件码等。此外,豆包具备跨App代操作能力,可模拟真人屏幕操作,完成如全网比价、请假订票等复杂任务。它还支持实时多模态互动,通过摄像头进行实时视频通话,提供中英双语字幕和互动讲解。Pro模式可处理复杂长链任务,结合GUI模拟点击、API调用和推理,完成如旅行规划和票务预订等任务。所有记忆数据本地化,用户可一键关闭,确保隐私安全。
12月5日Cloudflare发生停机故障

2025年12月5日,Cloudflare网络出现部分故障,持续约25分钟,影响约28%的HTTP流量。故障由对React Server Components行业性漏洞(CVE-2025-55182)的防护措施触发。Cloudflare为保护客户,将WAF缓冲区大小从128KB增加到1MB,但内部测试工具不支持新大小,因此关闭该工具。此操作通过全局配置系统快速传播,导致FL1代理版本在特定条件下出现Lua异常,返回HTTP 500错误。受影响客户包括使用FL1代理且部署Cloudflare托管规则集的用户,而中国网络客户未受影响。故障发生后,Cloudflare迅速回滚配置,恢复正常服务。此次事件再次凸显了全局配置系统快速传播变更的风险,Cloudflare正在推进增强部署与版本控制、改进紧急操作能力以及“失败开放”错误处理等韧性项目,以防止类似故障再次发生。
佳文共赏
裸辞一年, 我用AI两周狂造520个视频,结果...

本文作者通过AI技术实现视频自动化剪辑与生成,涵盖多语言、多主题的视频内容创作。其技术流程包括文案撰写、通过TTS(Text-to-Speech)生成音频、ASR(自动语音识别)抽取文本、字幕制作、AI生成B-roll辅助镜头图片以及数字人生成等环节,最终借助工具完成视频自动化剪辑与导出。该流程显著提高了视频制作效率,短视频制作时间约3-5分钟,长视频约10分钟。
此外,作者还探讨了AI在封面设计、文案创作等方面的应用,强调了AI时代下复合型人才的重要性以及AI对内容创作和商业变现的推动作用。
大公司程序员为何总写出糟糕的代码

大型科技公司中,工程师频繁变动,导致大部分代码变更由新手完成。公司平均工作年限仅一两年,工程师常在不同代码库和语言间切换,缺乏长期专精。虽有“老手”提供深度代码审查,但因非正式且工作过载,难以持续。工程师通常在不熟悉的代码库中工作,面临紧迫的截止日期,难以保证代码质量。公司为快速部署工程师,牺牲了部分代码质量。工程师无法决定工作内容,只能适应公司安排。
2025 年维基百科最热门文章榜单

2025 年维基百科最热门文章榜单公布,涵盖政治、流行文化和名人逝世等主题。排名第一的是关于美国政治活动家查理·柯克的文章,其在 9 月遇刺身亡后,文章单日浏览量近 1500 万次,全年约 43% 的浏览量来自美国以外地区。
“2025 年逝世人物”文章位居第二,记录了众多知名人士的离世,其中包括教皇方济各,其继任者教皇利奥十四世相关文章浏览量激增,导致维基媒体项目流量峰值达每秒 80 万次,创历史新高。唐纳德·特朗普再次进入榜单,这是他第八次登上维基百科年度热门文章榜单。
流行文化方面,受影视作品带动,如因网飞《怪兽》季播影响,美国连环杀手埃德·盖恩相关文章受关注;《罪人》《武器》等电影及《人生切割术》《青春期》等剧集均上榜,此外还有 DC 和漫威的超级英雄相关内容。
政治领域除上述人物外,还有美国副总统 JD 万斯和前高级顾问埃隆·马斯克。流行文化领域,摇滚歌手奥兹·奥斯本、互联网名人 MrBeast 和足球明星克里斯蒂亚诺·罗纳尔多相关文章也受关注。
技术博客
提示词缓存的工作原理 —— 分页注意力与自动前缀缓存以及实用技巧

本文深入探讨了提示缓存(prompt caching)的工作原理,特别是基于分页注意力(Paged Attention)和自动前缀缓存(Automatic Prefix Caching)的技术实现,并提供了实用的提示以提高缓存命中率。
文章首先指出,在大规模部署语言模型时,为了处理并发用户请求,通常采用异步分布式系统,这与本地单线程模型推理有显著不同。接着,文章介绍了LLM推理的基础知识,包括预填充(prefill)和解码(decode)阶段,以及关键的KV缓存机制。文章详细介绍了分页注意力技术,这是一种受操作系统分页启发的解决方案,通过将KV缓存划分为固定大小的块,并使用块表进行管理,从而解决了传统KV缓存分配面临的内存碎片化和扩展性问题。
此外,文章还解释了前缀缓存的工作原理,即通过块哈希(block hashing)技术,实现对相同前缀的缓存重用,从而避免重复计算,显著提高了推理效率。
最后,文章通过实际案例展示了如何通过保持系统提示的稳定性、使用确定性序列化等方法来提高缓存命中率。
Claude 4.5 Opus的灵魂文档

内容主要围绕人工智能助手 Claude 4.5 Opus 的“灵魂文档”展开,该文档是 Anthropic 为训练 Claude 而设计的指导性文件。
文档强调 Claude 的核心使命是安全、有益且易于理解,旨在通过具备良好价值观和知识体系来实现安全和有益的行为。Claude 被设计为一个极其出色的助手,同时注重诚实和对世界的关怀。文档还详细讨论了 Claude 在与人类互动时的行为准则,包括在不同情境下的优先级排序,如安全、伦理、遵循指南和对用户及操作者的帮助。
此外,文档探讨了 Claude 在处理冲突、遵循指令和默认行为时的策略,以及在代理行为中如何确保安全和避免伤害。
评估深度智能体的经验总结

LangChain 在过去一个月发布了四个基于 Deep Agents 的应用,包括 DeepAgents CLI(编码助手)、LangSmith Assist(应用内助手)、Personal Email Assistant(个性化邮件助手)和 Agent Builder(无代码代理构建平台)。在开发这些应用过程中,LangChain 团队总结了评估 Deep Agents 的关键模式。
Deep Agents 需要为每个数据点定制测试逻辑,因为每个测试案例都有其独特的成功标准。例如,一个日程安排代理需要验证其是否正确更新了用户偏好记忆文件。LangSmith 的 Pytest 和 Vitest 集成支持这种定制化测试。
单步评估对于验证特定场景下的决策非常有价值且高效,例如验证代理是否调用了正确的工具及其参数。大约一半的测试案例采用单步评估。全代理回合提供了完整的端到端行为视图,可用于评估工具调用轨迹、最终响应质量和其他状态(如代理生成的文件)。多回合运行模拟了用户与代理之间的完整交互,但需要通过条件逻辑来保持测试路径的正确性。正确的评估环境设置至关重要,Deep Agents 需要为每次评估运行提供干净、可复现的环境,以确保结果的可靠性。
开源项目
code996:统计 Git 提交信息推导出工作强度

code996 是一个分析工具,它可以统计 Git 项目的 commit 时间分布,进而推导出项目的编码工作强度。
Fizzy:看板工具

37signals 开源了看板工具Fizzy。
Sourcetrail:源代码可视化工具

Sourcetrail 是一个开源的跨平台源代码浏览器,支持 C、C++、Java 和 Python,提供 SDK 用于开发语言扩展。
工具推荐
Nessie:AI对话自动转知识库

Nessie 是一款将分散的 AI 对话转化为个人知识库的工具。它能够将 AI 对话内容提炼为结构化笔记,完整保留上下文,避免重要想法在聊天历史中丢失。用户可以一次性导入大量 AI 聊天记录,Nessie 会将其按主题组织,方便浏览、搜索和进一步构建知识体系,从而将聊天内容转化为可积累的知识。此外,Nessie 还能连接用户的想法,将过去的思考转化为新的见解,使用户看到模式的出现、见解的发展以及理解的深化。
AdBlock:浏览器广告拦截工具

AdBlock 是一款开源浏览器工具,旨在拦截恼人的广告和弹窗,提升浏览体验。它通过阻止广告商的跟踪工具来保护用户隐私,同时提高页面加载速度,节省内存。AdBlock 还支持可接受的广告项目,允许非侵入性广告展示,以维持网站和内容创作者的健康生态系统。该工具自 2009 年由 Michael Gundlach 发起,支持 30 多种语言,全球有超过 6500 万用户使用。
不蒜子:极简网页计数器

不蒜子是一个极简网页计数器工具,通过两行代码即可实现网页访问量统计功能。
资源推荐
开源项目指南

指南围绕开源项目的启动、维护和增长。涉及安全最佳实践,包括多因素认证(MFA)、代码扫描、安全依赖管理以及私有漏洞报告。还包含开源维护者的自我平衡技巧,以及如何为开源项目吸引用户。此外,强调了构建欢迎社区的重要性,以及为开源维护者提供便利的最佳实践,如文档化流程和利用社区力量。还提及了开源项目的领导力与治理、开源工作的财务支持、行为准则以及开源项目的度量和法律方面。
Xbotics 具身智能社区知识库

Xbotics具身智能社区知识库是一个整合具身智能领域前沿技术、理论与应用案例的开放平台,为初学者和专家提供学习资源与技术文档。知识库涵盖具身智能综述、具身基础、仿真平台、操作与行走、灵巧手、大模型、公司及产品探讨、遥操作等子类,数据来源包括课程PPT文档总结、网络论文资料、专家技术分享及群内技术讨论。其GitHub参考综述包括具身智能论文列表、中文指南、创业项目信息汇总及细分研究方向等。
AI指南-极客时间

极客时间搭建的AI导航站。

