漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-28 talkingdev

OpenAI与五角大楼达成合作,将AI模型部署至美军涉密网络

据多方信源证实,人工智能领域的领军企业OpenAI已与美国国防部(五角大楼)达成一项重要协议,计划将其先进的人工智能模型部署至美国军方的涉密网络环境中。这一合作标志着生成式AI技术正加速进入国家级安全与国防应...

Read More
2026-02-25 talkingdev

通义千问Qwen3.5-35B-A3B模型发布:支持26万超长上下文,集成多模态与强化学习突破

近日,通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破,旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...

Read More
2026-02-25 talkingdev

Claude Opus 4.6实现“智能产出比”突破,以更少算力解决更复杂任务

近日,一篇关于AI模型“智能产出比”的分析引发行业关注。该分析指出,评估AI模型性能不应仅关注其最终能解决多难的任务,更应关注模型为达到该性能水平所需的计算资源,即“智能产出比”。文章重点介绍了Anthropic公司...

Read More
2026-02-25 talkingdev

推理速度新标杆:Inception Labs发布Mercury 2,号称全球最快推理大语言模型

人工智能初创公司Inception Labs近日正式发布了其新一代大语言模型Mercury 2,并宣称该模型是“全球最快的推理语言模型”。其核心目标是让生产环境中的AI应用响应达到“瞬时”体验。Mercury 2的技术亮点在于其采用了创新...

Read More
2026-02-23 talkingdev

开源|突破显存限制:开发者实现单张RTX 3090运行Llama 3.1 70B,NVMe直连GPU绕过CPU

近日,在GitHub上开源名为“ntransformer”的高效大语言模型推理引擎项目,其核心创新在于探索并实现了通过NVMe存储设备直接与GPU通信,绕过CPU和系统内存的传统数据路径,从而在消费级显卡RTX 3090上成功运行了参数量...

Read More
2026-02-21 talkingdev

印度AI创企Sarvam发布Indus聊天应用Beta版,专为本地语言打造,搭载1050亿参数大模型

总部位于印度班加罗尔的AI初创公司Sarvam,于近日正式推出了其名为“Indus”的聊天应用程序Beta版本,该应用面向网页和移动端用户开放。Sarvam的核心战略聚焦于为印度本土语言及用户构建定制化的人工智能模型,此次发...

Read More
2026-02-13 talkingdev

开源模型+Blackwell架构:头部推理服务商实现AI成本骤降10倍

近日,多家领先的AI推理服务提供商,包括Baseten、DeepInfra、Fireworks AI和Together AI,宣布通过在其服务中部署基于NVIDIA Blackwell架构的GPU并运行开源模型,成功将每次推理的令牌成本大幅降低了高达10倍。这一...

Read More
2026-02-12 talkingdev

智谱发布GLM-5:7540亿参数开源巨兽,引领智能体工程新范式

智谱AI正式发布了其新一代开源大模型GLM-5,该模型以MIT许可证开源,参数量达到惊人的7540亿,是前代GLM-4.7(3680亿参数)规模的两倍以上。在技术性能上,GLM-5在广泛的学术基准测试中相比GLM-4.7实现了显著提升,...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page