肖恩技术周刊（第 81 期）：太空光伏可行吗？

2025/2/2大约 19 分钟约 5579 字

肖恩技术周刊（第 81 期）：太空光伏可行吗？

对周内阅读的技术内容精品（个人向）进行总结。觉得不错可点击上方订阅，第一时间获取更新通知。

太空光伏（Space-Based Solar Power，SBSP）指在太空里部署超大太阳能板收集阳光发电，然后再把能量传回地面使用。

为什么要去太空发电？在地面上，太阳能发电受夜晚、云层、大气衰减的严重影响，效率大打折扣。而在太空，尤其是地球同步轨道上，太阳光几乎永不间断，没有大气削弱，能量密度极高。因此自然想到通过太空光伏电站收集这些强大的太阳能，将其转化为电能，再通过微波或激光等无线方式，安全地传输回地球上的接收站，最终并入电网供我们使用。

那么它可行吗？从技术角度看，核心部件都是已知技术的延伸。太阳能电池板本身是成熟技术，国际空间站早已应用。无线能量传输在地面短距离内也已验证。但真有那么容易实现吗，当前还有哪些挑战？

核心挑战一：天文数字般的发射成本。太空电站的规模往往以公里计，重量达万吨级。把成千上万吨的太阳能板、巨型天线、支撑结构发射到地球同步轨道（约3.6万公里高），即使是最先进的商业火箭（如SpaceX的星舰），目前每公斤成本也要几百美元。要实现经济可行性，发射成本仍需再降1-2个数量级。

核心挑战二：在轨巨型建造与维护。现有空间站仅几百吨，而商业级太空电站需数万吨级结构。目前缺乏在太空大规模组装巨型设施的技术，更不用说长期维护。这需要自动化在轨制造、机器人组装、太空维修等技术上的突破，而相关基础设施几乎为零。

核心挑战三：能量传输的"最后一公里"难题。主流的方式是用微波（或激光）把能量“射”到地面的接收站，需要极高精度的波束控制。且整个链条效率只有10%–15%左右，虽然太空电池效率高，但转换、发射、穿过大气、地面接收整流等环节，每一步都有很大损耗。同时接收站直径有几公里到十几公里，像一个小型城市那么大，选址、建设和维护都极难。

核心挑战四：散热也是大问题。太空中没有空气对流，设备散热只能靠辐射，效率极低。太阳能电池板只能将大约20-30%的太阳光转化为电能，其余70%以上的能量会直接转化为废热。大量热量如果散不出去，会直接烧毁电池板。但要排掉几吉瓦废热，辐射器面积可能要达到几十到上百平方公里（相当于几千个足球场）。

除上述核心挑战外，还有很多问题需要解决。所以太空光伏理论上很完美，但工程和经济现实非常残酷。目前只在小规模实验和卫星供电阶段（自给自足），真正给地球电网大规模送电的商业化，最乐观估计也要2035–2040年后才可能起步，并且前提是发射成本继续暴降 + 多项技术同时突破。

短期内，它更可能是给太空算力中心供电的辅助方案，而不是取代地面能源的“救世主”。

业界资讯

Google Genie计划：探索无限的交互式世界

Google DeepMind 推出了 Project Genie，这是一个基于 Genie 3 模型的实验性研究原型。Genie 3 是一种通用世界模型，能够实时生成多样化的交互式环境，模拟物理和动态世界，支持从机器人到动画、历史场景等多种应用场景。

Project Genie 通过网页应用实现，结合 Nano Banana Pro 和 Gemini 技术，提供“世界草图”“世界探索”和“世界混音”三大核心功能，用户可以创建、探索和重新混合自己的交互式世界。尽管 Genie 3 是早期研究模型，存在生成世界不够真实、角色控制延迟和生成时长限制等问题，但 Google 正在持续改进，并计划未来将该技术推广至更多用户。

OpenAI 推出 Prism，借助 AI 提升科研写作与协作效率

Prism 是由 OpenAI 推出的专为科研写作与团队协作设计的免费 AI 原生工作空间，基于 GPT-5.2 模型，旨在整合科研流程，提升科研效率。Prism 整合了初稿撰写、润色修订、团队协作及投稿准备等功能，支持实时协作与云端操作，无需本地安装配置，解决了传统科研工具碎片化问题，减少版本冲突与手动操作。Prism 采用纯云端架构，支持无限人数协作，面向所有 ChatGPT 个人账户用户开放，未来将拓展至更多套餐用户。

Kimi K2.5：视觉智能体

Kimi K2.5 是一款强大的开源多模态模型，基于约 15T 视觉和文本混合标记的持续预训练，具备先进的编码和视觉能力。在编码方面，Kimi K2.5 特别擅长前端开发，能够将简单对话转化为完整的前端界面，并通过图像和视频推理提升图像/视频到代码的生成和视觉调试能力。

此外，Kimi K2.5 在真实世界的软件工程任务中表现出色，通过内部编码基准 Kimi Code Bench 的评估，在多种编程语言的构建、调试、重构、测试和脚本编写任务中均展现出比 K2 更一致和有意义的改进。

Manus AI 拥抱开放标准：集成 Agent Skills，开启智能体新篇章

Manus AI 宣布全面集成 Agent Skills 开放标准，旨在将通用 AI 代理转变为专业化的智能工具。Agent Skills 通过模块化、可复用的方式，将专业知识和工作流程打包成基于文件系统的资源，分为元数据、指令和资源三个层级，按需加载，优化上下文窗口的使用效率。

这一集成将为用户提供两大核心价值：固化个人最佳实践，提升工作效率；降低使用门槛，促进团队知识共享。Manus AI 的架构与 Agent Skills 的设计理念高度兼容，其多工具协作能力与 Skills 的专业化知识相结合，能够实现复杂任务的自动化处理。

此外，Manus AI 还将推出“使用 Manus 构建 Skill”功能，允许用户将成功的交互流程封装为可复用的 Skill，并通过斜杠命令实现精准触发。未来，Manus AI 将进一步深化 Skills 的集成，包括项目与连接器集成以及团队技能库的引入，以构建更加智能化和协作化的工作流。

DeepSeek 发布 DeepSeek-OCR 2 模型

DeepSeek 团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文，开源 DeepSeek-OCR 2 模型，采用创新的 DeepEncoder V2 方法，使 AI 能根据图像含义动态重排图像各部分，更接近人类视觉编码逻辑。

浏览新时代：Chrome 集成 Gemini

谷歌浏览器引入基于Gemini 3模型的重大更新，推出新侧边栏体验，集成AI功能，助力用户高效多任务处理。侧边栏可实时辅助浏览，无需切换标签页，适用于多场景任务。同时，Nano Banana技术集成至Chrome，用户可在侧边栏输入提示，即时转换网页图像，无需额外操作。Gemini还支持与Gmail、日历等Google应用深度整合，实现复杂任务自动化，如旅行规划、文档收集等。

未来，Chrome将引入个人智能功能，根据用户过往对话提供个性化回答，进一步提升浏览体验。此外，Chrome将支持谷歌通用商务协议（UCP），确保AI代理在Chrome中无缝执行用户任务。

佳文共赏

欢迎来到煤气镇

Gas Town 是由 Steve Yegge 开发的一种新型集成开发环境（IDE），旨在简化运行大量 Claude Code 实例的繁琐工作。它通过提供一种自维持的机器来解决开发者在使用多个编码代理时的管理难题。

Gas Town 的设计灵感来源于 Kubernetes 和 Temporal，尽管其底层实现有所不同，但其复杂性在于需要不断添加组件以实现自维持运行。Gas Town 能够轻松解决复杂的 MAKER 问题，例如 20 盘汉诺塔问题，通过生成百万步的轻量级工作流程来实现。Gas Town 的工作基于 Beads，一个 Git 支持的数据平面，用于存储和管理所有工作单元。它通过角色分配和工作流程的分子表达（MEOW 栈）来实现高效的工作流编排。Gas Town 的工作流程包括巡逻（Patrols）、分子（Molecules）、原型分子（Protomolecules）和公式（Formulas），这些组件共同构成了一个强大的工作流管理系统。

尽管 Gas Town 目前还处于早期阶段，但其潜力巨大，有望成为未来 AI 辅助编程的重要工具。

AI编程80%问题

随着人工智能（AI）在编程中的应用日益广泛，开发者的工作模式正在发生显著变化。AI 编程已从“70% 问题”（AI 完成 70% 的编码工作，剩余部分需人工处理）转变为“80% 问题”，即 AI 能够完成更多工作，但同时也带来了新的挑战。

AI 的错误类型从语法问题转变为概念性失误，如错误假设、过度抽象、代码膨胀和缺乏质疑等。这些错误可能导致架构问题和维护成本增加。此外，开发者面临“理解债务”，即在快速审查 AI 生成代码时可能失去对代码的理解。尽管 AI 提高了代码生成速度，但代码审查时间增加，导致开发效率的提升并不如预期。

文章强调，AI 是开发实践的放大器，良好的开发流程会因 AI 而更高效，而不良流程则会加速技术债务的积累。开发者需要适应从命令式到声明式开发的转变，更多地关注问题定义和验证策略，而不是直接编写代码。

日均上百commit：Moltbot（Clawdbot）如何兼顾产品路线图和开发速度

Moltbot 是一个由 Peter Steinberger 创立的开源 AI 项目，自 2025 年 11 月启动以来，在短短 66 天内积累了 8,297 次代码提交，日均 127 次，其中 Peter 个人贡献了 86.5%。该项目采用原子化提交策略，每个提交只做一件事，结合 Conventional Commits 规范，将提交分为 fix、docs、feat 等类型，便于快速定位问题和代码审查。

Moltbot 的开发过程是渐进式的，从一个简单的 WhatsApp 消息中继器逐步演化为一个跨平台的 Agent 系统，经历了多个明确的阶段。Peter 还采用了 AI 辅助开发，利用不同的 AI 工具来提高开发效率，并通过多 Agent 并行开发来加速项目进展。此外，Moltbot 的成功也得益于其清晰的产品路线图、社区贡献的整合以及对本地优先和数据主权的强调。

技术博客

自我改进的编码智能体

介绍了自主AI编码代理（如Claude Code）的设置与应用，这些代理可在夜间自动完成代码编写、测试和审查工作。

核心是“连续编码循环”（Ralph Wiggum技术），将开发任务分解为多个小任务，AI代理逐一处理。每个循环包括选取任务、编写代码、验证变更、提交代码和更新任务状态，通过重置代理上下文避免混淆。任务应明确且有清晰的完成标准，可由AI辅助转化为结构化任务列表。循环可通过脚本运行，如Bash或Python脚本，支持多阶段循环，如分析、规划和执行。

AI代理使用持久上下文文件（如AGENTS.md）记录知识，避免重复错误。质量保证方面，自动测试和验证是关键，包括单元测试、类型检查和持续集成。规模化时，可采用规划者-工作者模型，提高效率。风险方面，需限制代理权限，防止破坏性操作，并处理模型幻觉和任务偏离。

深入解析：通用商业协议（UCP）

Universal Commerce Protocol（UCP）是由谷歌与Shopify、Etsy等20多家行业领导者共同开发的开源标准，旨在为新一代代理型商业提供支持。

UCP通过建立通用语言和功能原语，实现消费者界面、商家与支付提供商之间的无缝商业旅程。它兼容现有零售基础设施和Agent Payments Protocol（AP2），提供安全的代理支付支持，并通过API、Agent2Agent（A2A）和Model Context Protocol（MCP）提供灵活的集成方式。

UCP为商业生态系统的各方带来益处：商家可展示独特产品和服务，保持商户记录所有权；AI平台可简化商业接入；开发者可参与社区驱动的开源标准建设；支付提供商获得开放的支付方法选择；消费者则享受从产品发现到决策的无缝购物体验。UCP通过统一集成、共享语言、可扩展架构和安全优先的方法，减少集成复杂性，推动代理型商业的发展。

Cursor是如何将其编码智能体推向生产的

Cursor 于 2025 年 10 月 29 日推出 Cursor 2.0，其核心是 Composer，一款新型的编码代理模型。该模型通过系统架构创新，实现了比同类智能模型快 4 倍的速度，大多数操作可在 30 秒内完成。其系统架构包括路由器、编码模型、工具、上下文检索、协调器和沙箱等关键组件，其中路由器动态分析请求复杂度以选择最佳模型，工具提供核心编码操作，上下文检索系统从代码库中提取相关代码片段，协调器控制模型与工具的交互，沙箱则提供安全的执行环境。

在生产环境中，Cursor 面临了可靠编辑、延迟累积和大规模沙箱等挑战。为解决这些问题，Cursor 采用了混合专家架构、推测性解码和上下文压缩等技术，以提高模型的效率和响应速度。此外，Cursor 还构建了自定义沙箱基础设施，以应对大规模并发需求，并确保沙箱的快速启动和资源回收。这些技术的应用使 Cursor 能够在实际开发环境中高效地执行任务，为开发者提供可靠的编码支持。