上下文窗口的大小一直是大型语言模型在处理长文本任务时的关键瓶颈。近日,初创公司Subquadratic宣布推出一款全新的AI模型,其上下文窗口达到了惊人的1200万token(约合1200万个单词或代码标记),远超过当前主流模...
Read More支付巨头Stripe在官方技术博客中分享了一则引人注目的工程案例:他们使用自研的代码格式化工具Rubyfmt,在一夜之间将内部庞大的2500万行Ruby代码库全面格式化。这项工作不仅展示了自动化代码格式化在大型项目中的巨...
Read More在大型语言模型(LLM)和视觉语言模型(VLM)部署中,模型量化是降低计算和存储成本的关键技术。然而,传统量化方法往往需要在模型大小和推理精度之间做出艰难取舍,尤其是在超低位宽(如2-bit、3-bit)下,精度损失...
Read MorePyTorch官方博客近日发布了一项名为AutoSP的创新技术,该技术旨在自动化地将标准Transformer训练代码转换为序列并行代码,用于长上下文大语言模型(LLM)的训练。AutoSP已与微软的DeepSpeed框架深度集成,使得开发者...
Read MoreNVIDIA日前发布了名为Nemotron 3 Nano Omni的全新多模态模型,标志着其在长上下文多模态智能领域的重要进展。该模型专为文档、音频和视频分析设计,在MMlongbench-Doc和VoiceBench等多个权威基准测试中均取得了业界...
Read MoreReact Native新架构在Discord安卓端曾遭遇严重的动画卡顿问题,根源在于Reanimated动画库每帧会克隆数百个Fabric Shadow Tree节点,导致性能严重下降。Margelo团队通过深入分析Reanimated内部机制和Fabric Shadow Tr...
Read MoreOpenAI正在其ChatGPT内部开发一个代号为“Hermes”的常驻智能体平台,该平台允许用户创建并持续运行自定义智能体。这一创新功能集成了工作流创建、技能整合与任务调度等核心能力,使得智能体能够独立运作,而无需等待...
Read More中国人工智能公司月之暗面(Moonshot AI)近日正式推出其新一代大模型系列Kimi K2.6,并已在Kimi Chat对话平台及API接口上线。该系列模型的核心突破在于强化了长上下文编程能力与智能体(Agent)执行支持,旨在为开...
Read More