肖恩技术周刊(第 54 期):芯片简史
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
最近在读《芯片简史》,非常推荐!全书用 60 余年芯片进化的大叙事,串起科学原理、工程狂想、商业暗战与人性挣扎,既是一本技术史,也是一份数字时代的生存指南。
业界资讯
OpenAI发布ChatGPT agent
7 月 18 日,OpenAI 推出 ChatGPT Agent,ChatGPT Agent 是一款具备虚拟计算机能力的 AI 工具,能够代表用户完成多步骤、复杂任务。该代理由 OpenAI 全新模型驱动,可访问文本浏览器、视觉浏览器与终端,通过强化学习完成诸如查看日程、规划家庭早餐、生成商业分析报告等任务,且支持用户在执行过程中调整需求,例如更改餐厅类型等。
Agent 整合了 Operator 与 Deep Research 两大平台的技术优势,适用于自动化办公、网购、日程安排等多种场景。目前已向 Pro、Plus 与 Team 用户推送,企业与教育版本将于今夏稍后开放。
为确保安全,Agent 在执行如预订或发送邮件等不可逆操作前会请求用户确认,并对财务交易设置限制。此外,OpenAI 引入了「观察模式」以提升操作透明度,并启用了针对生物与化学等高风险能力的防护机制,以应对模型能力增强带来的潜在风险。
技术博客
利用 Finch 解锁金融洞察:Uber的对话式数据AI智能体
Uber开发了一款名为Finch的会话式AI数据代理工具,集成于Slack,旨在简化财务团队的数据检索流程。传统数据访问方式涉及复杂的SQL查询和跨平台操作,效率低下且容易出错。Finch通过自然语言处理技术,将用户的自然语言查询转化为结构化的数据检索,提供实时、安全且准确的财务洞察。
Finch的核心优势包括:自然语言接口,用户可在Slack中直接提问;对Uber特定财务术语的理解;自查询代理功能,自动选择最佳数据源并执行SQL查询;内置安全和访问控制,确保数据安全;以及自动导出数据至Google Sheets,方便进一步分析。其架构基于模块化设计,结合了生成式AI、检索增强生成(RAG)和自查询代理技术,确保高效、准确的数据检索。
Finch通过优化SQL查询、并行任务执行和预取机制,提升了查询速度和系统可扩展性。此外,Finch还通过持续评估和基准测试,确保其准确性和可靠性。未来,Finch计划进一步扩展与Uber FinTech系统的集成,支持更多用户意图,并引入人工验证机制以提升关键决策的准确性。
腾讯 Oceanus 开创云原生流计算弹性新纪元
文章介绍了腾讯Oceanus在云原生流计算弹性方面的创新技术,旨在解决实时计算中资源浪费、超用及分布不均衡等问题。Oceanus通过主动式机器学习预测、跨层原地资源调整机制和标准异常解决流程,实现云原生流服务的自动化垂直弹性伸缩。具体而言,Oceanus利用多维指标和机器学习模型(如LightGBM)进行资源需求预测,结合特征工程和在线学习增强模型效果;通过Flink、Kubernetes和JVM的跨层调整机制,实现资源动态调整而无需重启服务;并设计标准化异常处理流程,快速检测、诊断并解决弹性扩缩异常。在腾讯大数据生产环境中,Oceanus显著提升了资源利用率(CPU利用率从20%提升至60%,内存利用率从45%提升至70%),并大幅降低了不稳定事件(降低近70%)。未来,腾讯将继续优化Oceanus的弹性能力,推动云原生流计算技术向智能化、全自动化发展。
流媒体背后:网飞三年直播历程
回顾了Netflix过去三年在直播领域的发展历程。从最初的喜剧特别节目开始,逐步扩展到数百场直播活动,涵盖喜剧、体育赛事和WWE等。详细介绍了Netflix直播架构的四个关键支柱:专用广播设施、基于云的冗余转码和封装管道、通过Open Connect CDN扩展内容分发以及优化直播播放体验。
此外,Netflix通过云服务协调直播流程,实时监控系统和用户体验,并从实践中总结了广泛测试、定期实践、观众预测、优雅降级、重试策略和应急计划等关键经验教训。尽管已经取得显著进展,但Netflix表示其直播之旅才刚刚开始,未来将继续扩展直播内容和提升用户体验。
开源项目
ODH:浏览器词典插件
在线词典助手是一个Chrome插件。用于浏览网页时查询在线词典,并将查询内容显示在单词旁的小弹窗里。
opencode:终端编码智能体
AI编码助手,专注于终端使用。
markitdown:文档转Markdown工具
MarkItDown是一个轻量级的Python工具,专注于将文件转换为Markdown格式,同时保留文档结构和内容。它支持多种文件格式,包括PDF、PowerPoint、Word、Excel、图像(EXIF元数据和OCR)、音频(EXIF元数据和语音转录)、HTML、基于文本的格式(CSV、JSON、XML)、ZIP文件(迭代内容)、YouTube URL和EPub等。它特别适用于与LLM(如OpenAI的GPT-4o)一起使用,因为这些模型通常能够很好地理解和生成Markdown格式的文本。
工具推荐
交互式世界天气图
交互式世界天气图,通过雨量、风力、温度、压力等交互式地图探索当前天气并查看所在位置的天气预报。可以跟踪台风和风暴发展、监测野火和烟雾,查看近乎实时更新的卫星图像。
学习资源
电子屏幕是如何工作的?
文章深入探讨了屏幕的发展历程与工作原理。早期的阴极射线管(CRT)显示器通过电子束击中荧光粉点发光,奠定了像素显示的基础。然而,CRT体积大、功耗高,逐渐被现代显示技术取代。现代显示技术主要分为LCD和OLED两种。LCD采用背光源,通过液晶层调节光的强度和颜色,具有亮度高、成本低的优点,但对比度较低、视角较窄。OLED则是自发光技术,每个像素独立发光,无需背光源,具有出色的对比度、低功耗和快速响应时间,但亮度有限且有机材料寿命较短。制造商通过技术改进,如提高光提取效率和结合量子点滤光片,来提升OLED的性能。下一代显示技术包括串联OLED和MicroLED,其中串联OLED通过堆叠面板提高亮度和寿命,MicroLED则以更高的亮度和更长的使用寿命为特点,但目前仍面临成本和像素密度的挑战。
随便看看
创始人分享Django框架的起源
Simon Willison为庆祝Django 20周年而发表的回顾性博客文章,内容围绕Django的起源、早期开发历程以及他个人使用Django构建的一些项目。文章提到,Django最初由Simon和Adrian Holovaty在2003年开发,目的是为了快速开发新闻网站,他们放弃了PHP,选择了Python,并在Lawrence Journal World工作期间逐步构建了这个框架。Simon还分享了他使用Django构建的一些项目,包括6 News Lawrence网站、Lawrence.com的重写版本,以及在《卫报》的数据新闻项目等。此外,他提到了个人项目Django People和Wildlife Near You,以及他和妻子Natalie共同开发的Lanyrd项目,后者最终被Eventbrite收购。文章最后,Simon总结了Django的核心价值——让开发者能够快速构建和发布项目。
关于 OpenAI 的一些思考
文章是作者离开OpenAI后的反思。他见证了公司从1000多人增长到3000多人的快速扩张,OpenAI以快速决策、自下而上的创新和精英主义为文化特点,内部主要通过Slack沟通,采用单一代码库,主要用Python开发。
作者参与了Codex项目,这是一个仅用7周就从想法变为实际产品的编程AI智能体。团队成员包括工程师、研究员、设计师等,他们共同努力,最终成功发布产品。Codex采用异步形式,用户启动任务后,AI智能体在自己的环境中运行并返回PR结果。
作者认为加入OpenAI是其最好的决定之一,他在这里学习到很多,并与优秀的人一起工作。他认为OpenAI是实现通用人工智能(AGI)的领先竞争者之一。
当你感到AI编程无所不能时,也许正站在“愚昧之巅”
探讨了AI在软件开发和应用变革中的作用。作者认同AI推动了产品设计走向半开放式,加速了产品原型的开发效率,并强调使用AI仍需清晰逻辑,否则可能引发更多问题。然而,对于AI捕捉用户需求、SEO自动化、研发与测试角色模糊化以及内容自动化生产等观点,他认为这些趋势虽有一定合理性,但仍存在局限性和不确定性。
作者还反驳了一些过于乐观的预测,如普通开发者不会因AI而被淘汰,高质量代码无法仅靠逻辑文档生成,PRD撰写需多方协作,以及通才无法取代专才等。他指出,软件开发的速度不仅取决于编程效率,还受限于软件工程范式和基础设施。文章最后展望未来,认为上述变化趋势将在未来5年逐渐显现,但并非所有变化都会立刻发生。作者提醒读者,AI的“蜜月期”容易让人产生过度乐观的错觉,应理性看待AI带来的变革。