肖恩技术周刊(第 84 期):Token 粉碎机
肖恩技术周刊(第 84 期):Token 粉碎机
对周内阅读的技术内容精品(个人向)进行总结。觉得不错可点击上方订阅,第一时间获取更新通知。

高强度使用了一周OpenClaw,即使用着顶尖模型(gpt-5.3-codex),但如果不对小龙虾本身进行调优,效果还是差点意思。主要表现在记不住事,执行效率差(响应慢,老是中断),token倒是消耗的飞快。
本周先对记忆(Memory)进行了一些优化。OpenClaw默认实现是基于对话上下文 + 持久化存储的分层结构,对于持久化存储又分为长期记忆MEMORY.md和流水记忆memory/YYYY-MM-DD.md。记忆写入的逻辑大概是:
- 长期稳定信息写
[MEMORY.md](http://MEMORY.md),例如你的偏好、长期规则、固定配置、持续项目背景。 - 当日过程信息写
memory/YYYY-MM-DD.md,例如今天做了什么、临时决策、排障经过、待跟进事项。 - 明确指令“记住这个” ,立即落盘,直接写到上述文件。
- 会话临近压缩时(memory flush),会把应持久化的信息补写到记忆文件,避免上下文压缩后丢失。
默认情况下记忆读取是没有开启向量检索的,不能通过相似度召回内容,只能通过读取文件的方式进行查询。因此强烈建议开启向量检索(可在硅基流动上申请一个key,使用免费的BAAI/bge-m3模型)。开启之后记忆读取的逻辑大概是:
- 确定检索范围,默认只看:
MEMORY.md+memory/**/*.md(以及你配置的extraPaths)。 - memory_search 语义召回,对 Markdown 分块做向量检索,返回候选片段。
- 必要时 memory_get 精读,选中候选后,再按路径和行号读取原文上下文,确认细节再回答。
- 索引增量同步,文件有变更时会去抖后增量更新;会话开始/检索时也会触发同步,保证结果尽量新。
我对记忆的期望是“能记事,更懂我”,因此对召回的准确度有更高的要求,于是在语义召回这步做了一些定制化增强。改造后会在召回前对意图进行分类(精确查、常规查、探索查),自动选择最合适的策略。同时当结果不稳时会自动再补搜一轮,并和默认结果合并去重,所以更不容易漏关键记忆,也更少答非所问。
需要注意的是,OpenClaw记忆检索通过Tools调用实现,因此这些增强逻辑不能放到脚本或skill里,需要通过extension替换默认实现。如果不这样做,你会发现这些逻辑智能体很难触发运行。
后面预计还会针对任务编排、成本控制、个性设定、自进化和一键迁移能力进行探索,等有成果了再和大家分享。
这番折腾还带来一个深层次的思考——通用AI智能体助手的核心能力有哪些?我现在想到这几个:
- 活人感:交流不要机械化,要像和人在沟通交流
- 更懂你:能记住事,了解你的喜好
- 能干活:能够高效完成交代的任务
- 可进化:能够持续地对自身能力进行迭代
- 易复制:能够批量生成多个智能体
- 要省钱:token消耗更可控一些
对于这个问题,大家的想法是什么呢?
业界资讯
告别中文乱码!谷歌发布 Nano Banana 2 图像 AI 模型:画质直达 4K

谷歌发布新一代图像生成模型Nano Banana2,基于Gemini3.1Flash Image架构,提升理解与响应并修复中文乱码、语义混乱和伪影,使中文文本生成更清晰可用,输出从2K升至4K,支持最多5角色跨图一致与单图融合14元素,后续将逐步接入Gemini、搜索、AI Studio、Flow及付费API与Ads完成替换。
我国首个国家级人形机器人与具身智能标准体系正式发布

工信部人形机器人与具身智能标委会发布《人形机器人与具身智能标准体系(2026版)》,首次覆盖全产业链全生命周期,明确软硬件集成、数据与模型训推部署闭环及安全伦理要求,填补规范空白并缓解数据荒与标准碎片化,推动人形机器人在工业和医疗等场景规模化落地与生态协同。
让 Gemini 在安卓系统上帮你处理多步骤的日常任务

谷歌将在Gemini应用为Pixel 10系列和三星Galaxy S26推出多步骤任务自动化测试版,先在美国和韩国上线,用户长按电源键即可让Gemini后台完成打车、DoorDash复购等操作,进度可通过通知实时监控并随时接管或终止,Gemini仅在安全虚拟窗口内运行指定应用以限制权限,初期覆盖外卖、杂货、出行类应用并收集反馈。
将记忆导入 Claude

Claude支持从其他AI导入偏好与上下文,用户将官方提示词粘贴到任意AI获取整理结果,再复制到Claude记忆设置即可一键更新记忆并无缝续聊,该记忆功能覆盖所有付费方案。
特朗普下令:美国联邦政府将立即停用 Anthropic 的产品

特朗普指示美国各联邦机构立即停用Anthropic技术,已在用机构获6个月逐步淘汰期,并要求其配合迁移与支持,否则将动用总统权力强制执行,且可能面临重大民事与刑事后果。
佳文共赏
工厂模式:编码智能体如何改变软件工程

软件开发正从写代码转向编排自主代理并行生成与修改代码,工程师需像建工厂一样写清规格、用测试先行和严格验证来控质,否则错误会被放大;生成不再瓶颈,验证与系统判断决定产出与个人竞争力。
人工智能如何帮助打破 COBOL 现代化的成本壁垒

AI通过自动读取COBOL代码库,梳理隐性依赖与数据流、补全工作流文档并评估迁移风险,配合工程师制定路线与测试,在逐组件迁移和并行验证中把现代化从多年高成本顾问工程压缩为数季度可控实施。
研究:人工智能聊天机器人向易受影响用户提供的信息准确性较低

MIT研究测试GPT-4、Claude3、Llama3在TruthfulQA与SciQ上对不同用户画像的答复,发现对低英语水平、低学历、非美国出身者准确性与真实性下降、拒答率上升且更易出现居高临下措辞,结论是LLM可能向弱势群体传播错误信息并加剧信息不平等。
人工智能改变了编程的面貌

作者称自去年12月起AI编码代理从几乎不可用跃迁为可独立推进长任务,示例中其在约30分钟内完成环境部署、模型下载测试、服务与界面搭建并提交报告,结果编程从手写代码转向用自然语言指派并行代理并审核,工程师重心变为拆解、判断与编排,开发流程被显著重塑但仍需监督且更适合可验证任务。
技术博客
管理 Claude 的记忆

Claude Code跨会话记忆分自动记忆与CLAUDE.md体系,启动时加载工作目录向上CLAUDE.md全量及MEMORY.md前200行,子目录内容按需读取且指令越具体优先级越高,用户可用/memory编辑并用设置或环境变量开关,CLAUDE.md支持@导入并可用.claude/rules按路径分模块定规则,使组织团队与个人偏好长期一致且可控。
在智能体投入生产之前,你根本不知道它会做什么

智能体因自然语言输入无穷且对提示微变敏感、推理与工具链路不可预期,生产监控需从只看延迟错误转为追踪全对话、上下文与轨迹,并用标注队列引入结构化人工复核、用LLM在线评估与聚类洞察自动发现模式,最终形成可告警的质量与安全指标闭环以持续改进。
[教程] 为你的OpenClaw添加救援机器人 主机器人挂掉后可以快速自动救援

在同一服务器部署主机器人与救援机器人两套 OpenClaw 实例,主机故障时由救援机通过独立配置与密钥接管排障,自动查看主机日志与配置、修正错误并重启服务,减少手动 SSH 操作与恢复时间;可加装开机自启并按需授予更高权限以提升自动化,但需控制密钥暴露风险。
停止使用 /init 生成 AGENTS.md

研究对比显示AGENTS.md效果取决于内容:自动/init生成的概览多为可自行发现信息,导致噪声、成功率降2-3%且成本增20%+;人工仅写工具陷阱、隐性约定等不可发现信息可提效提准,应将其视为可随问题修复而删减的最小“异味清单”,并按目录分层按需加载以控成本与偏置。
我们是如何在一周内用人工智能重构 Next.js 的

Cloudflare工程师借助AI以约1100美元代币在一周内重写Next.js接口为Vite插件vinext,实现替换脚本即用并一键部署到Workers,基准显示构建最快4.4倍且客户端包小57%,并提出按流量预渲染结合ISR降大型站点构建成本,但项目仍属实验阶段。
开源项目
zvec:阿里巴巴开源的轻量级向量数据库

阿里开源zvec为基于Proxima的进程内向量数据库,提供毫秒级十亿向量检索、稠密稀疏与多向量查询及语义+结构化混合过滤,免服务器配置可在笔记本到边缘设备运行,支持Python/Node安装后即可建库插入并执行相似度搜索。
airi:开源的 AI VTuber/虚拟角色项目

AIRI 是开源 AI VTuber/虚拟角色项目,目标在本地可自主托管复刻 Neuro-sama 式互动虚拟伴侣。
LobsterAI:网易有道开发的全能个人AI助手

网易有道LobsterAI个人AI助手Agent,24/7代办数据分析、文档/PPT/视频生成、搜索邮件与定时任务,通过Cowork在本地或沙箱执行工具,结合持久记忆与Telegram等IM远程控制,跨平台且数据本地SQLite存储,能将重复工作自动化并在权限可控下提升效率。
Agent-Reach:让 AI Agent 具备搜索多平台内容能力

Agent-Reach是开源脚手架工具,通过一句话安装把各平台分散的登录、代理、API等配置打通,使AI Agent可在网页、YouTube、Twitter、Reddit、GitHub、B站、小红书等读取与搜索并在部分平台发帖互动,凭据仅本地保存且支持safe与dry-run降低改动风险,以免API付费方式提升联网检索与操作能力但需注意Cookie小号防封。
CoPaw:阿里开源的个人 AI 助手项目

阿里开源个人AI助手CoPaw,面向钉钉飞书QQDiscord等聊天平台提供统一助手服务,支持本地或云端部署并由用户掌控数据与记忆,内置cron与自定义技能自动加载且无厂商锁定,可通过pip一键脚本或Docker安装,兼容云端API模型与llama.cpp/MLX本地模型,init配置后启动服务进入控制台使用。
Superset:编程智能体的终端 IDE

Superset 是面向 AI 编程代理的终端 IDE,可在本地并行运行 10+ 个 CLI 编码代理,通过工作树隔离为每个任务提供独立分支与目录,并监控状态、通知完成、内置差异审查编辑、预设工作区与快速切换,兼容任意终端代理并可一键在常用编辑器打开。
Mobile-Agent:多模态 GUI 自动化智能体框架

Mobile-Agent跨平台多模态GUI自动化框架家族发布基于Qwen3-VL的GUI-Owl1.5等版本,提供界面感知定位、端到端多步操作、工具/MCP调用与长程记忆,在20+GUI基准达SOTA并获NeurIPS/ICLR等接收,代码与权重MIT开源且提供在线演示与限时免费API。
资源推荐
OpenClaw真实使用案例

项目汇总社区对OpenClaw的真实用例,覆盖社媒摘要与分析、内容流水线、DevOps自愈、各类生产力助手、研究学习与模拟交易,展示其可自动化日常与工作流程,但相关技能与第三方依赖或有漏洞,使用前需审查代码与权限并避免泄露密钥。
Hugging Face 推出的开源技能库

Hugging Face 发布开源 Skills 技能库,以标准化 Agent Skill format 将指令、脚本和资源封装为自包含文件夹(含带 YAML 元数据的 SKILL.md),让 AI 编程助手可一致执行数据集管理、训练微调、评估、作业运行、实验追踪、UI 构建等机器学习任务,并可在 Claude、Codex、Gemini CLI、Cursor 等主流工具中通过插件或目录方式直接安装使用。
OpenClaw 技能集合

OpenClaw本地AI助手发布技能集合,从官方13,729个社区技能中筛出5,494个,剔除垃圾测试、重复、非英文、加密交易、恶意软件、描述不足等共6,940个,覆盖30+类以编码与前端为主,可用ClawHub CLI安装或手动放入指定目录;已筛选但未审计,需自行审代码并扫描以防注入、投毒与恶意软件风险。
CS146S:现代软件开发者

课程以LLM驱动的软件工程为核心,训练学生按“规划-生成-修改-迭代”用代理、MCP与AI IDE完成编码、自动化测试与安全检测、代码评审与文档生成、UI构建及上线后监控与事故响应,最终掌握将前沿模型嵌入复杂开发流程并规避常见风险的方法。
