漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-23 talkingdev

开源|突破显存限制:开发者实现单张RTX 3090运行Llama 3.1 70B,NVMe直连GPU绕过CPU

近日,在GitHub上开源名为“ntransformer”的高效大语言模型推理引擎项目,其核心创新在于探索并实现了通过NVMe存储设备直接与GPU通信,绕过CPU和系统内存的传统数据路径,从而在消费级显卡RTX 3090上成功运行了参数量...

Read More
2026-02-21 talkingdev

印度AI创企Sarvam发布Indus聊天应用Beta版,专为本地语言打造,搭载1050亿参数大模型

总部位于印度班加罗尔的AI初创公司Sarvam,于近日正式推出了其名为“Indus”的聊天应用程序Beta版本,该应用面向网页和移动端用户开放。Sarvam的核心战略聚焦于为印度本土语言及用户构建定制化的人工智能模型,此次发...

Read More
2026-02-13 talkingdev

开源模型+Blackwell架构:头部推理服务商实现AI成本骤降10倍

近日,多家领先的AI推理服务提供商,包括Baseten、DeepInfra、Fireworks AI和Together AI,宣布通过在其服务中部署基于NVIDIA Blackwell架构的GPU并运行开源模型,成功将每次推理的令牌成本大幅降低了高达10倍。这一...

Read More
2026-02-12 talkingdev

智谱发布GLM-5:7540亿参数开源巨兽,引领智能体工程新范式

智谱AI正式发布了其新一代开源大模型GLM-5,该模型以MIT许可证开源,参数量达到惊人的7540亿,是前代GLM-4.7(3680亿参数)规模的两倍以上。在技术性能上,GLM-5在广泛的学术基准测试中相比GLM-4.7实现了显著提升,...

Read More
2026-02-11 talkingdev

开源|AIRS-Bench:Meta发布首个端到端AI研究能力基准,量化大模型代理的科研潜力

Meta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...

Read More
2026-02-08 talkingdev

Claude Code推出快速模式,显著提升Opus 4.6代码助手响应速度

近日,Anthropic公司为其代码助手Claude Code推出了一项名为“快速模式”的新功能,旨在显著提升其旗舰模型Opus 4.6的响应速度。该功能允许用户在Claude Code界面中通过切换开关,在需要快速获取代码建议或解释时,获...

Read More
2026-02-06 talkingdev

Anthropic发布Claude Opus 4.6:旗舰模型全面升级,推理与编程能力再攀高峰

人工智能公司Anthropic正式发布了其旗舰模型Claude Opus的最新版本——Claude Opus 4.6。此次升级标志着大模型在智能体能力、任务持久性和复杂场景应用上取得了显著进步。该模型在智能体编码、计算机使用、工具调用、...

Read More
2026-02-05 talkingdev

OpenClaw:开源AI自动化框架,或成苹果智能战略的“错失良机”

近期,一个值得关注的现象是Mac Mini在全球多地售罄,其背后驱动力并非传统创意软件需求,而是用户将其作为运行AI智能体(Agent)的无头(headless)服务器,以实现工作流程自动化。这一趋势的核心是开源框架OpenCla...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page