漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-06 talkingdev

12百万token上下文窗口被打破:Subquadratic发布超长上下文AI模型

上下文窗口的大小一直是大型语言模型在处理长文本任务时的关键瓶颈。近日,初创公司Subquadratic宣布推出一款全新的AI模型,其上下文窗口达到了惊人的1200万token(约合1200万个单词或代码标记),远超过当前主流模...

Read More
2026-05-05 talkingdev

一夜格式化2500万行代码:Stripe开源Rubyfmt工具的故事

支付巨头Stripe在官方技术博客中分享了一则引人注目的工程案例:他们使用自研的代码格式化工具Rubyfmt,在一夜之间将内部庞大的2500万行Ruby代码库全面格式化。这项工作不仅展示了自动化代码格式化在大型项目中的巨...

Read More
2026-05-04 talkingdev

开源|AutoRound:10分钟单GPU搞定7B大模型量化,极致压缩精度不减

在大型语言模型(LLM)和视觉语言模型(VLM)部署中,模型量化是降低计算和存储成本的关键技术。然而,传统量化方法往往需要在模型大小和推理精度之间做出艰难取舍,尤其是在超低位宽(如2-bit、3-bit)下,精度损失...

Read More
2026-04-30 talkingdev

DeepSpeed整合AutoSP:自动序列并行技术,轻松训练超长上下文LLM

PyTorch官方博客近日发布了一项名为AutoSP的创新技术,该技术旨在自动化地将标准Transformer训练代码转换为序列并行代码,用于长上下文大语言模型(LLM)的训练。AutoSP已与微软的DeepSpeed框架深度集成,使得开发者...

Read More
2026-04-29 talkingdev

NVIDIA发布Nemotron 3 Nano Omni:多模态AI新突破,长上下文处理能力引领文档、音频与视频智能分析

NVIDIA日前发布了名为Nemotron 3 Nano Omni的全新多模态模型,标志着其在长上下文多模态智能领域的重要进展。该模型专为文档、音频和视频分析设计,在MMlongbench-Doc和VoiceBench等多个权威基准测试中均取得了业界...

Read More
2026-04-23 talkingdev

Discord安卓性能问题解决:Reanimated与React Native新架构深度优化,帧率提升26%

React Native新架构在Discord安卓端曾遭遇严重的动画卡顿问题,根源在于Reanimated动画库每帧会克隆数百个Fabric Shadow Tree节点,导致性能严重下降。Margelo团队通过深入分析Reanimated内部机制和Fabric Shadow Tr...

Read More
2026-04-22 talkingdev

OpenAI研发代号“Hermes”的常驻智能体平台,ChatGPT将能自主执行任务

OpenAI正在其ChatGPT内部开发一个代号为“Hermes”的常驻智能体平台,该平台允许用户创建并持续运行自定义智能体。这一创新功能集成了工作流创建、技能整合与任务调度等核心能力,使得智能体能够独立运作,而无需等待...

Read More
2026-04-21 talkingdev

月之暗面发布Kimi K2.6系列模型,宣称多项基准超越GPT-5.4与Claude Opus

中国人工智能公司月之暗面(Moonshot AI)近日正式推出其新一代大模型系列Kimi K2.6,并已在Kimi Chat对话平台及API接口上线。该系列模型的核心突破在于强化了长上下文编程能力与智能体(Agent)执行支持,旨在为开...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page