肖恩技术周刊(第 52 期):魔数0x5f3759df
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
本周开始重看《左耳听风》。上次阅读都是5年前了,那时刚开始工作,太多内容读不懂。这次感觉好很多,能快速get到不少重点,看来这五年没白过。想想左耳朵耗子去世都两年了,他18年写的内容在当前来看还十分有价值,一些趋势的预测也是很准确,真是大牛,可惜了。
其中有一篇讲魔数“0x5f3759df”,初次阅读惊为天人,看了很多遍。该魔数最早出现在 20 世纪 90 年代的 3D 图形编程领域,特别是在经典游戏《雷神之锤 3》(Quake III Arena)的源代码中。在游戏的 3D 渲染过程中,需要频繁计算向量的长度和方向,这涉及到大量的平方根和平方根倒数(即 1/√x)计算。而直接使用标准数学库中的sqrt()
函数计算效率较低,因此开发者采用了这个魔数(注意代码中注释 what the fuck? 那行 )来实现快速开平方算法,大幅提升了计算性能。
float Q_rsqrt( float number )
{
long i;
float x2, y;
const float threehalfs = 1.5F;
x2 = number * 0.5F;
y = number;
i = * ( long * ) &y; // evil floating point bit level hacking
i = 0x5f3759df - ( i >> 1 ); // what the fuck?
y = * ( float * ) &i;
y = y * ( threehalfs - ( x2 * y * y ) ); // 1st iteration
// 2nd iteration, this can be removed
// y = y * ( threehalfs - ( x2 * y * y ) );
return y;
}
它将复杂的浮点运算转化为高效的位操作,体现了算法优化中 “效率与精度平衡” 的智慧。而且其推导过程在当时充满神秘色彩,如今已被数学理论所解释,成为计算机科学中兼具实用性和传奇性的经典案例。想了解整个推导过程可以阅读 魔数0x5f3759df。
技术博客
GitOps
GitOps是一种由Weaveworks于2017年提出的云原生应用持续部署方法,通过将基础设施的声明式描述存储在Git仓库中,并利用自动化流程确保生产环境与仓库描述一致,从而实现快速、频繁且可靠的部署。其核心优势包括快速部署、错误恢复、简化凭证管理、自文档化部署以及团队知识共享。GitOps支持推送式和拉取式两种部署策略,分别通过CI/CD工具和操作符实现,后者更安全且能自动纠正环境偏差。GitOps不仅适用于Kubernetes,还支持其他可声明式管理的基础设施,但目前大多数工具以Kubernetes为主。它还提供多应用和多环境管理能力,通过分支区分不同环境。尽管GitOps与DevOps有交集,但GitOps更侧重于技术实现,而DevOps强调文化变革。GitOps并非角色,而是一套实践,开发者可通过现有工具或自定义实践来实现。
人工智能领域没有新观点,只有新的数据集
本文探讨了人工智能进步的真正驱动力,指出AI的重大突破并非来自新想法,而是源于对新数据源的利用。文章回顾了AI发展的四个关键阶段:深度神经网络的兴起(2012年)解锁了ImageNet图像数据库;Transformer架构和大型语言模型(2017-2018年)开启了基于互联网文本的训练时代;基于人类反馈的强化学习(2022年)使模型能够学习人类标注的“好文本”;以及推理能力的提升(2024年)引入了“验证器”数据。作者认为,数据才是AI进步的关键,因为对于给定的数据集,模型性能的上限是固定的。未来AI的突破可能不会来自训练方法的改进,而是来自解锁新的数据源,例如YouTube上的视频数据或机器人收集的物理世界数据。
开源项目
RAG-Anything:统一RAG
RAG-Anything 是一个功能强大的多模态 RAG 系统,能够处理多种文件格式和内容类型。它提供了一个统一的解决方案,适用于需要处理复杂多模态文档的场景。通过其灵活的配置和强大的功能,RAG-Anything 为用户提供了高效的内容处理和查询能力。
mindsdb:人工智能查询引擎
MindsDB 使人类、人工智能、智能体和应用程序能够从分散的大规模数据源中获得高度准确的答案。
nginx-proxy-manager:Nginx管理器
无需深入了解 Nginx 或 Let's Encrypt 就能轻松实现网站的转发和免费 SSL 配置。
工具推荐
中国部分城市地铁线路可视化
展示中国部分城市地铁线路的可视化应用,使用现代 Web 技术栈构建,提供交互式的地铁网络浏览体验。
开源健身指导平台
现代化的开源健身指导平台,旨在帮助用户创建健身计划、跟踪进度,并提供全面的健身动作数据库。
学习资源
数据密集型应用系统设计
《Designing Data-Intensive Application》DDIA中文翻译。
12个构建智能体的原则
介绍了12个构建智能体的原则,用以提高软件的可靠性、可扩展性和可维护性。
机器学习新手入门
微软的《机器学习新手入门》是一个全面且结构化的入门课程,适合初学者系统学习机器学习的基础知识和技能。通过项目导向的学习方法,学生可以在实践中加深对机器学习概念的理解。
随便看看
每个计算机科学专业的学生都应该知道的事
本文为计算机科学专业学生梳理了必备的知识体系,强调构建全面技能的重要性。学生应建立作品集展示项目和成就,而非仅依赖简历。技术沟通能力至关重要,需掌握演示工具和文档撰写技能。在技术层面,学生需掌握Unix哲学、系统管理、多种编程语言、离散数学、数据结构与算法、计算机架构、操作系统、网络、安全、密码学、软件测试、用户体验设计、可视化、并行计算、软件工程、形式化方法、图形学与模拟、机器人学、人工智能、机器学习和数据库等核心领域。这些知识不仅涵盖理论基础,还强调实践能力,如实现编译器、配置操作系统、设计安全系统等。此外,学生还需具备团队协作和版本控制等软件工程技能。这些知识将帮助学生在就业市场中脱颖而出,为未来的职业发展和研究生学习奠定坚实基础,同时为社会贡献高质量的技术解决方案。
AI 构建者手册
这份 2025 年 AI 构建者手册聚焦 AI 产品落地全流程。调研显示,AI 原生企业产品成熟度更高,47% 已规模化,远超 AI 赋能企业的 13%。模型使用上,第三方 API 仍是主流,但高增长企业更倾向微调或自研模型,准确性与成本成选型核心。定价以 “订阅 + 用量 / 结果” 混合模式为主,40% 企业将 AI 功能嵌入高级套餐,未来或向用量定价转型。组织方面,收入超 1 亿美元企业中 61% 设专职 AI 领导,人才短缺致 46% 企业招聘慢。成本上,AI 研发占 R&D 预算 10-20%,API 费用成最难控成本,41% 企业靠开源模型优化。内部应用上,研发与营销是主力场景,编码辅助提升生产力最显著,但 46% 企业难寻合适场景。技术栈中,PyTorch、TensorFlow、LangChain 等成开发核心,NVIDIA 主导推理优化。手册为企业从产品架构到成本管理提供实操框架,助力 AI 商业化落地。