大模型的相关内容 - 漫话开发者

2026-02-28 talkingdev

OpenAI与五角大楼达成合作，将AI模型部署至美军涉密网络

据多方信源证实，人工智能领域的领军企业OpenAI已与美国国防部（五角大楼）达成一项重要协议，计划将其先进的人工智能模型部署至美国军方的涉密网络环境中。这一合作标志着生成式AI技术正加速进入国家级安全与国防应...

2026-02-25 talkingdev

近日，通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破，旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...

2026-02-25 talkingdev

近日，一篇关于AI模型“智能产出比”的分析引发行业关注。该分析指出，评估AI模型性能不应仅关注其最终能解决多难的任务，更应关注模型为达到该性能水平所需的计算资源，即“智能产出比”。文章重点介绍了Anthropic公司...

2026-02-25 talkingdev

人工智能初创公司Inception Labs近日正式发布了其新一代大语言模型Mercury 2，并宣称该模型是“全球最快的推理语言模型”。其核心目标是让生产环境中的AI应用响应达到“瞬时”体验。Mercury 2的技术亮点在于其采用了创新...

2026-02-23 talkingdev

近日，在GitHub上开源名为“ntransformer”的高效大语言模型推理引擎项目，其核心创新在于探索并实现了通过NVMe存储设备直接与GPU通信，绕过CPU和系统内存的传统数据路径，从而在消费级显卡RTX 3090上成功运行了参数量...

2026-02-21 talkingdev

总部位于印度班加罗尔的AI初创公司Sarvam，于近日正式推出了其名为“Indus”的聊天应用程序Beta版本，该应用面向网页和移动端用户开放。Sarvam的核心战略聚焦于为印度本土语言及用户构建定制化的人工智能模型，此次发...

2026-02-13 talkingdev

近日，多家领先的AI推理服务提供商，包括Baseten、DeepInfra、Fireworks AI和Together AI，宣布通过在其服务中部署基于NVIDIA Blackwell架构的GPU并运行开源模型，成功将每次推理的令牌成本大幅降低了高达10倍。这一...

2026-02-12 talkingdev

智谱AI正式发布了其新一代开源大模型GLM-5，该模型以MIT许可证开源，参数量达到惊人的7540亿，是前代GLM-4.7（3680亿参数）规模的两倍以上。在技术性能上，GLM-5在广泛的学术基准测试中相比GLM-4.7实现了显著提升，...