肖恩技术周刊(第 33 期):泼天流量?
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“学习资源”等。
更新时间: 周一
历史收录: 技术周刊合集
订阅方式: 微信公众号“肖恩聊技术”,除周刊外还有更多原创技术博文,欢迎关注👏🏻~
开篇图
这周瓜还挺多,TikTok难民涌入小红书、TikTok宣布停止运营。虽说次元壁是破了,但事实上可能并没有媒体宣称的那么其乐融融,毕竟两国民众的意识形态和社会潜意识差太多了。放任发展可能会出现冲突(其实已经有不少了,幸好审核很严格),后续就看小红书的应对手段了。能否接住这波流量,拭目以待。
业界资讯
字节跳动多个应用随TikTok在美同步停运
字节跳动旗下短视频平台TikTok因美国“不卖就禁”法案,于2025年1月19日正式关闭在美服务,旗下剪映海外版CapCut、Lemon8、Gauth和Hypic等应用也同步停运,游戏子公司沐瞳科技下架两款手游。此前,特朗普曾主张禁TikTok,但因TikTok对其再次当选有功,他可能上任后为其争取时间或推替代方案。受此影响,大量美国用户涌入小红书,使其下载量飙升。
“TikTok 难民” 突然涌入小红书
TikTok“禁令”倒计时,许多美国网友涌入小红书,使其登顶美区App Store下载榜榜首,但小红书内部对此次事件观点不一,认为全球化挑战大于流量承接喜悦。此前小红书承接TikTok流量时DAU带动不明显,目前尚不清楚海外用户涌入数量及笔记量。国内互联网公司借机发英文贴揽客,如阿里巴巴、携程等。
支付宝回应重大 Bug:不会向用户追款
支付宝在1月16日出现重大Bug,用户支付时可享受20%“政府补贴”减免。经确认,这是支付宝测试“国补”功能时误将测试环境部署到正常环境所致。支付宝表示不会追回已发出的营销优惠金,并提醒用户谨防资金追回诈骗短信。
技术博客
海外泼天流量|浅谈全球化技术架构
本文聚焦于国内企业在出海过程中构建全球化技术架构的挑战与应对策略。文章指出,全球化给企业带来了运营和技术上的双重挑战。在运营方面,企业需严格遵守不同国家和地区的法律法规,升级内容审核与推荐算法,并支持多语言、多时区、多币种等功能。在技术层面,企业面临网络延迟、数据一致性、数据主权、高可用性、成本控制和安全防护等挑战。
为应对这些挑战,云原生技术发挥了重要作用。企业通过应用高可用架构设计、容量管控、容错设计、容灾架构、灰度发布和可观测性等策略,提升系统的稳定性和可靠性。例如,全链路压测可模拟真实高峰流量,帮助识别系统瓶颈;混沌工程用于验证系统的容错能力;灰度发布则通过流量控制和监控,降低新版本发布的风险。
在安全防护方面,企业需应对DDoS攻击、API滥用、爬虫攻击等威胁,通过流量清洗、限流、监控和数据合规性措施,保障系统的安全性。文章强调,全球化技术架构的构建需要综合考虑运营和技术的复杂性,通过云原生技术的应用和安全能力的提升,企业能够更好地应对全球化带来的挑战,实现业务的稳定发展。
AI Agent初体验:变革正悄然发生
本文聚焦于AI Agent的发展与应用。自ChatGPT推出后,众多AI工具涌现,涵盖写作、图像、视频等领域。文章首先介绍了大模型的特点,如参数众多、计算资源需求大、数据需求量大、复杂性与泛化能力强、可扩展性与成本高、环境影响大等,同时也指出了大模型存在的缺陷,包括信息偏差、知识更新滞后、内容不可追溯、领域专业知识欠缺、推理能力限制、应用场景受限、长文本处理弱等问题,并提出了缓解方法,如提示工程、模型开发等。
接着,文章重点阐述了智能体(AI Agent)的概念,其是能感知环境并行动实现目标的系统,大模型智能体基于LLM构建,具备环境感知、自主理解、决策制定及执行行动的能力。智能体的技术架构从面向过程转向面向目标,紧密结合感知、思考与行动完成任务。其核心组成部分包括感知系统、认知系统、记忆系统、决策系统、行动系统、学习系统、交互系统、伦理和安全系统、用户界面、硬件平台等。
文章还介绍了智能体的应用场景,如搜索智能体可自动检索总结内容,问答智能体基于本地知识库打造问答机器人,核心技术有提示词和RAG,可通过Ollama + AnythingLLM搭建本地知识库。编程智能体则辅助编程,提供代码自动生成等多功能,如Cline是开源编程智能体插件,Cursor是AI代码编辑器。最后,文章强调了拥抱AI的重要性。
开源项目
resume-design:开源简历设计生成器
猫步简历是一个开源免费的简历设计制作平台,提供多种免费模板,支持自定义模板和主题,可导出PDF和JSON数据。
anything-llm:一体化AI桌面应用
AnythingLLM是一个全栈AI应用,它集成了多种功能,如内置RAG(检索增强生成)、AI代理等,支持桌面和Docker部署,旨在让用户能够轻松地将任何文档、资源或内容转化为聊天时的上下文参考。
wechat-article-exporter:批量下载微信公众号文章
在线批量下载微信公众号文章,并支持导出阅读量、评论以及内嵌音视频等内容。
工具推荐
staying:数据结构与算法可视化工具
平台涵盖递归、二维数组、链表、队列、栈、二叉树、哈希表等数据结构与算法,通过交互式可视化帮助用户理解复杂问题的解决过程。
bestblogs:精选技术文章
汇集顶级编程、人工智能、产品、科技文章,大语言模型摘要评分辅助阅读,探索编程和技术未来。
学习资源
1000 行代码实现操作系统(英文)
介绍了如何从零开始构建一个小型操作系统。尽管操作系统开发听起来复杂,但其基本功能其实相对简单。作者将指导读者使用C语言实现上下文切换、分页、用户模式、命令行外壳、磁盘驱动程序和文件读写操作,总共仅需1000行代码。
llm-course:大型语言模型课程
使用 roadmaps 和 Colab 学习大型语言模型(LLM)。
domain-driven-hexagon:学习领域驱动设计
结合DDD、六边形架构和其他设计原则,提供了一套完整的软件设计指南。
随便看看
自洽的程序员
一本聚焦于程序员情绪管理和心态调整的书籍,旨在帮助程序员解决工作中的焦虑、倦怠、迷茫、抑郁等情绪问题,实现内心的自洽。
为什么AI编程能快速落地?
2024年,AI编程工具在编程领域迅速发展,成为大模型落地的典型代表。市场表现突出,如Cursor的开发商Anysphere完成超1亿美元B轮融资,硅心科技也完成B轮融资。实际应用中,谷歌超25%新代码由AI生成,Github 30%新代码在Copilot辅助下完成,个人开发者借助AI工具显著提升开发效率。
AI编程工具的发展呈现出从辅助到自主的自动化演进路径,可分为代码补全工具、半自动编程工具和全自动编程工具。尽管编程语言关键字少,规则固定,但代码生成难度并不低,因为代码要么能跑通,要么跑不通,对精确性要求极高。
AI编程成功的核心在于其可信验证机制,具备客观性、即时性和确定性三个关键特征。这种机制从应用端为AI应用创造了近乎完美的用户体验闭环,从模型端保证了代码合成数据质量的下限,形成了良性循环,确保了模型在代码领域能持续提升。
然而,AI编程仍存在问题,如代码生成质量有待提高,对语言支持不平衡,批处理式开发模式削弱了用户对代码变更的实时把控等。未来,随着技术发展,会出现更高级的可信验证方法,考虑更多因素,如性能隐患、安全漏洞等,将DevOps实践等现代化的软件工程实践方案引入AI辅助开发流程,建立更完善的代码质量保障体系。
AI编程领域的成功经验启示我们,任何领域要想成功应用AI,都必须建立起有效的可信验证机制,借鉴编程领域的思路,建立适合各自领域特点的验证体系。
未来 1 年、3 年和 6 年的 AI / LLM 预测(英文)
在未来一年,他认为AI智能体技术不会实现,因为当前的LLM技术不可靠且易轻信,但代码助手和研究助手会取得进展。三年内,他预测有人会凭借AI辅助的调查性报道获得普利策奖,同时隐私法规将加强,以应对数据隐私和广告定位问题。六年后,他既期待AI在艺术创作上的突破,也担忧AGI/ASI可能导致的社会动荡。Simon强调自己对未来预测持谨慎态度,希望这些预测能引发对AI技术发展的深入思考。