肖恩技术周刊(第 34 期):辞旧迎新
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
开篇图
龙年最后一个工作日,极度充实的一年马上就要结束啦。本周对一整年的经历做了回顾和总结,虽然知道事项不少,但真正罗列出来的时候,还是比预想的多一些,在工作、家庭和个人上都有不小的收获。等蛇年伊始把总结发出来(当然还有🧧),和大家一起辞旧迎新!
业界资讯
刚刚,特朗普联手奥特曼,狂砸5000亿美元启动AI「星际之门」
2025 年 1 月 22 日,特朗普与 OpenAI CEO Sam Altman 等人联合宣布「星际之门」项目,计划 4 年内投资 5000 亿美元建设人工智能基础设施,首期投入 1000 亿美元,旨在确保美国在 AI 领域的领导地位,创造大量就业机会并带来全球经济效益。该项目由软银、OpenAI 等投资,孙正义任主席,Arm、微软等为技术合作伙伴,目前建设工作已展开,且与微软现有合作基础上继续增加合作。
OpenAI 首个 L3 级智能体深夜觉醒!AI 自己玩电脑引爆全网
OpenAI推出首个L3级智能体Operator,打破API局限,能像人类一样直接与界面交互,完成各类任务,如填写表单、购物等。其背后是Computer-Using Agent(CUA),通过处理屏幕像素数据,使用虚拟鼠标和键盘操作,具备多步骤任务执行、错误应对和适应变化的能力。在测试中,CUA在WebArena和WebVoyager等基准测试中刷新了SOTA,但与人类相比仍有差距。目前,Operator仅对美国Pro用户开放,但OpenAI计划扩展其动作空间并开放API接口,让开发者构建自定义智能体,这可能引发下一场人机交互革命。
技术博客
iTerm2 的一些鲜为人知的功能(英文)
文章介绍了iTerm2这款Mac终端软件的实用功能。支持显示时间戳(快捷键⌘+Shift+E切换),帮助用户跟踪日志时间;安装Shell Integration后,可在新提示时提醒用户(快捷键⌘+Option+A设置),便于跟踪长时间运行的命令。此外,用户可以通过快捷键在提示之间快速跳转(⌘+Shift+Up/Down),并使用热键重新排列标签(如Ctrl+Shift+B/F),无需离开键盘。
iTerm2的复制模式(⌘+Shift+C进入)允许用户通过键盘选择和复制文本,支持箭头键或Vim键绑定操作。同时,按住⌘键可使链接和路径可点击,URL在浏览器中打开,路径在Finder中打开。选择文本时,iTerm2会自动将其复制到剪贴板,提升了操作效率。
LinkedIn 如何将用户限制系统扩展到每秒 500 万次查询(英文)
LinkedIn的用户限制系统(CASAL)经历了从关系型数据库到分布式NoSQL系统的多次架构演进,以应对高查询量、低延迟和大规模数据增长的挑战。最初,LinkedIn使用Oracle数据库管理限制数据,但随着用户增长和微服务架构的转型,关系型数据库在高查询量和低延迟方面逐渐力不从心。为此,LinkedIn引入了服务器端缓存和客户端缓存,通过缓存旁加载策略和布隆过滤器等技术,减少了对数据库的依赖,但这些方案仍存在内存占用大、重启时资源消耗高等问题。
为应对高QPS、超低延迟和高可用性的需求,LinkedIn迁移到自建的Espresso分布式NoSQL系统,并与Kafka集成,实现实时数据同步。这一代系统通过水平扩展和内存查找显著提升了性能,但也面临重启时数据加载耗时和大规模增长处理的挑战。第三代系统进一步优化,采用堆外内存存储数据,减少垃圾回收(GC)事件对性能的影响。同时,引入Venice和DaVinci框架,通过预加载限制数据到内存并使用高效的bitset数据结构,实现了更快的启动过程和更强的弹性。
LinkedIn用户限制系统的演变展示了其在技术创新和架构设计上的持续努力。通过从简单开始、主动识别问题、跨团队协作、基准测试和持续改进等原则,LinkedIn成功应对了用户增长和恶意活动带来的挑战,确保了平台的安全性和可靠性。
大模型综述
本文是一篇关于大模型的综述文章,介绍了大模型的背景、涌现能力、对NLP的影响、机制、预训练、高效训练、适配以及研究方向等内容。大模型在NLP任务中表现出色,展现出上下文学习、按指令执行、逐步推理等涌现能力,但也存在幻觉等问题。其发展经历了从深度学习到预训练模型,再到通用人工智能的范式转变,对NLP领域产生了深远影响,如中间任务消亡、技术路线统一等。大模型的可解释性、知识定位与修改、上下文学习等机制是研究重点。预训练包括数据收集、模型架构设计、任务设计等环节,高效训练技术如并行训练对大模型至关重要。大模型可通过指令微调、对齐微调等方式进行适配,以提升性能和符合人类价值观。未来研究方向涵盖大模型适配、网络架构探索、多模态融合、推理能力提升、规模天花板探索、数据工程、稀疏化等方面。
开源项目
site-status:检测站点状态
基于UptimeRobot API的在线状态面板,用于监测网站的在线状态。
shadPS4:PS4模拟器
开源的PlayStation 4(PS4)模拟器。
review-2024:年终总结汇总
收集和展示不同个人或团队在2024年的年终总结。
工具推荐
Trae:AI代码编辑器
字节跳动推出的免费AI IDE,对标Cursor。支持原生中文,集成了Claude3.5和GPT-4o等主流Al模型,完全免费使用。Trae的主要功能包括Builder模式和Chat模式,其中Builder模式可帮助开发者从零开始构建项目,Chat模式支持对代码库或编程问题进行提问和优化。
wewe-rss:微信公众号RSS生成
用于微信公众号订阅的工具,支持私有化部署和微信公众号RSS生成,基于微信读书实现。
Wechatsync:文章多平台同步工具
浏览器插件,帮助自媒体创作者将文章一键同步到多个内容平台,以提高生产力并简化发布流程。
学习资源
llm-cookbook:面向开发者的 LLM 入门教程
面向开发者的 LLM 入门教程,吴恩达大模型系列课程中文版。
build-your-own-x:造轮子指南
集合了众多从零开始构建各种技术项目的教程的仓库。这些技术项目包括3D渲染器、区块链、数据库、操作系统、编程语言等众多领域,旨在通过实践学习帮助人们深入理解这些技术的内部原理和实现过程。
LangChain 的中文入门教程
LangChain 是一个用于开发由语言模型驱动的应用程序的框架,项目提供了中文入门教程。
随便看看
编写软件教程的规则(英文)
文章的核心内容是为软件开发者提供撰写高质量教程的指导原则,强调以初学者为受众,确保教程清晰、实用且易于跟随。这些规则包括写给初学者、在标题中承诺明确的结果、在引言中解释目标、展示最终结果、使代码片段可复制粘贴、使用命令行标志的长版本、区分用户定义的值和可重用逻辑、避免繁琐的任务、保持代码处于可工作状态、教授一件事、不要追求外表美观、最小化依赖、明确指定文件名、使用一致且描述性的标题、展示解决方案的有效性以及链接到完整示例。通过遵循这些规则,开发者可以提高教程的质量,帮助读者更有效地学习新技术。