肖恩技术周刊(第 82 期):AI春晚?!
肖恩技术周刊(第 82 期):AI春晚?!
对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击上方订阅,第一时间获取更新通知。

从本周的 AI 大战上能明显看出中美两国在 AI 发展上的结构性差异,以及背后两国意识形态的不同。不聊背后,我们先看表象。
美国侧重“技术上限与规则制定权”,中国侧重“落地规模与系统性效率”。
美国更偏向不确定性高的“0→1”突破式创新,以 Transformer、RLHF、Scaling Law 等范式探索为代表,依托 OpenAI、Anthropic、DeepMind 等机构押注通用大模型,通过幂律式投资与较高失败容忍度换取潜在的长期技术红利。
而中国更强调“1→100”的工程化与规模化,围绕垂直/行业模型、本地部署与私有化交付、国产化替代等路径,在成本约束下追求可复制与可核算的 ROI。其市场条件表现为单一语言下的超大内需与行业高度碎片化,同时数据合规与安全要求更强,使“行业模型+场景交付”相对更匹配。
此外,两国在资本耐心与政策节奏上也存在差异。美国以私人与市场为主,追求高溢价 SaaS与短期回报;中国以政策牵引与长期资本投入攻关关键短板,形成“国家队+民企”协同与开源降门槛的扩散模式。
全球布局上,美国将技术输出与盟友体系绑定,强化出口管制与阵营化扩散;中国侧重多边合作与面向全球南方的开源模型、基础设施与培训供给,并以场景方案输出扩大生态影响力。
所以竞争的核心其实是“算力霸权+闭源壁垒+盟友体系”与“开源生态+国家能力+制造场景”两种范式的长期对峙。
业界资讯
OpenAI 推出 Codex 桌面版

OpenAI推出Codex macOS应用,作为多智能体协作中枢,支持并行任务、长期项目管理和技能扩展,集成自动化与沙盒安全机制,现免费开放给ChatGPT Free用户,付费用户速率翻倍,旨在降低复杂开发门槛并提升人机协作效率。
xAI 携手 SpaceX,加速人类的未来

SpaceX收购xAI,整合AI、火箭、星链与直连手机通信技术,构建天地一体化创新引擎;核心目标是将AI计算迁移至太空,利用太阳能部署百万颗轨道数据中心卫星,实现每年百吉瓦级算力扩容,2-3年内太空AI计算成本将低于地面,推动人类迈向卡尔达谢夫II型文明,支撑月球基地、火星城市及星际扩张。
OpenAI GPT-5.3-Codex 正式登场

GPT-5.3-Codex 是迄今最强的智能体编程模型,整合前沿编程性能与推理能力,运行速度提升25%,可自主完成研究、工具调用及复杂任务,支持实时交互引导,在SWE-Bench Pro、Terminal-Bench等基准测试中创行业新高,并首次用于自身训练与部署,推动Codex从代码工具升级为通用计算机协作伙伴。
Claude Opus 4.6 发布

Claude Opus 4.6 升级发布,核心提升编程能力,具备更强规划、长时任务执行、大代码库操作及自检调试能力,首次支持100万 token 上下文窗口(Beta),在 Terminal-Bench 2.0、Humanity’s Last Exam 等基准测试中领先,尤其在金融、法律等高价值知识任务上显著超越 GPT-5.2 和前代模型,同时保持行业顶尖安全水平,新增自适应推理、上下文压缩、多智能体协作等功能,已上线 claude.ai、API 及主流云平台,定价不变。
面壁智能首推“松果派”:AI原生端侧开发板开启硬件开发新范式

面壁智能发布首款AI原生端侧开发板“松果派”,基于NVIDIA Jetson模组,集成多模态硬件接口,适配自研MiniCPM端侧大模型,提供275TOPS算力,支持离线多模态交互;开发者可通过自然语言直驱硬件,实现高效智能设备开发,保障数据隐私与实时性,计划2026年中上市。
佳文共赏
马斯克三小时访谈实录:36 个月后,太空是训练和运行 AI 最便宜的地方

马斯克认为AI发展的核心瓶颈是电力而非芯片,中国以外全球电力产出停滞,而芯片产能指数增长,2026年底将出现芯片堆积无法通电;太空太阳能效率是地面5倍、成本仅1/10,36个月内或成AI最经济部署地;燃气轮机叶片全球仅三家公司能造,产能排至2030年,构成电力扩张终极瓶颈;xAI与SpaceX合并意在打造太空AI基础设施,特斯拉计划自建TeraFab芯片厂并量产Optimus机器人,以应对中美制造业差距——美国若无突破将被中国彻底主导。
我的妈妈和 DeepSeek 博士

一位57岁中国肾移植患者因医疗资源紧张、医生问诊仓促,转而依赖AI聊天机器人DeepSeek获取健康建议,尽管专家指其建议存在错误与风险,但她认为AI更耐心、平等且随时可用,反映出弱势群体在现实医疗缺位下对人工智能的情感与功能依赖。
技术博客
AI 辅助如何影响编程技能的形成

一项针对软件开发者的随机对照试验发现,使用AI辅助编程虽略微提升任务完成速度(差异不显著),但导致技能掌握度显著下降——AI组在后续测试中得分比手动编码组低17%,尤其在调试和概念理解方面差距最大;研究进一步揭示,学习效果取决于AI使用方式:仅依赖AI生成或调试代码会削弱认知投入,而主动结合代码生成与解释性提问、或专注概念探究的用户则能兼顾效率与理解,表明AI工具的设计需引导用户保持认知参与,以避免以牺牲长期技能发展为代价换取短期生产力。
Claude Code 团队的 10 个内部技巧,但你不一定都要学

Claude Code 团队总结十大高效用法:用 git worktrees 并行多任务、Plan Mode 先规划再执行、维护 CLAUDE.md 沉淀项目规范、创建 Skills 自动化重复操作、让 AI 自主修 Bug、优化 Prompt 技巧、配置高效终端环境、使用 Subagents 拆分复杂任务、通过 CLI 实现无 SQL 数据分析、以及利用 AI 解释与生成内容辅助学习,核心在于根据个人习惯定制工具,而非照搬模板。
智能体工程

“Vibe coding”指不审查代码、完全依赖AI生成并迭代的编程方式,适用于原型开发或个人工具,但混淆其与专业开发导致误解与风险;真正高效的AI辅助开发实为“agentic engineering”——人类制定规范、审查代码、主导架构,AI作为代理执行任务,强调纪律性与工程规范,二者需明确区分以避免质量失控与技能退化。
用并行的 Claude 团队构建了一个C编译器

研究者Nicholas Carlini开发“代理团队”方法,让多个Claude实例在无人工干预下并行协作,成功构建出10万行Rust编写的C编译器,可编译Linux 6.9及多个主流项目,验证了LLM代理在复杂任务中的自主能力,但也暴露出效率、代码质量与功能完整性等局限。
开源项目
gavrielc/nanoclaw:极简、安全的个人Claude助手

NanoClaw是一个极简、安全的个人Claude助手,运行于Linux容器中,代码仅几文件、单进程,支持WhatsApp通信、定时任务、网页抓取及群组隔离,通过AI原生方式(如Claude Code)实现无配置定制,强调“技能贡献”而非功能堆砌,确保用户完全掌控代码与安全边界。
microsoft/playwright-cli: 浏览器自动化命令行工具

Playwright CLI 是为编码代理优化的轻量命令行工具,通过 SKILLs 提供高效浏览器自动化,避免 MCP 的上下文开销;支持多会话、持久化存储、网络拦截、视频录制等核心功能,适用于高吞吐测试与复杂自动化场景。
HKUDS/nanobot:轻量个人 AI 助手

nanobot 是一款超轻量个人 AI 助手,核心代码仅约 4000 行,比 Clawdbot 小 99%,支持多 LLM 提供商(如 OpenRouter、DeepSeek、vLLM 本地模型)和多种聊天渠道(Telegram、Discord、WhatsApp、飞书),具备实时市场分析、代码开发、日程管理等能力。
openai/skills:Codex的技能目录

Agent Skills是AI代理可调用执行特定任务的指令、脚本和资源包,支持一次编写、多处复用。Codex通过技能封装能力,提供可重复使用的功能模块,该仓库收录技能供分发使用。系统技能自动安装,精选和实验技能需通过$skill-installer命令安装,安装后需重启Codex生效。
工具推荐
Exa:AI最好的搜索API

Exa提供统一API,覆盖5大端点,支持全行业数据获取,包括编程、金融、招聘、生产力、咨询和营销场景,具备高精度代码引用、历史市场分析、人才搜索、实时新闻摘要、深度行业研究及专家定位功能,支持自定义网页子集过滤,企业级特性含零数据留存、SOC 2合规及单点登录,保障隐私与合规。
TapTap 制造

TapTap 制造是零门槛 AI 游戏创作工具,用户通过自然语言描述即可生成完整游戏,AI 自动完成代码、美术、音乐及联网功能,作品可直接上架 TapTap 平台,实现“对话即创作,完成即发布”。
网站推荐
RentAHuman.ai:AI 代理雇佣人类完成体力任务

人类可出租身体执行AI无法完成的现实任务,通过平台设定费率、接收AI指令、完成任务后即时获得加密货币报酬,成为连接数字与物理世界的执行者。
