漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-22 talkingdev

AI基准测试的真相:如何解读前沿模型发布的SOTA分数?

在人工智能领域,基准测试分数已成为衡量模型性能和市场宣传的核心指标,但其解读却普遍存在误区。当前行业叙事往往暗示模型智能水平呈现普遍性提升,然而单一的基准分数可能具有误导性,无法全面反映模型在真实、复...

Read More
2025-12-18 talkingdev

xAI开放Grok语音代理API,成本仅为OpenAI Realtime API一半

埃隆·马斯克旗下的人工智能公司xAI近日宣布,将向所有开发者开放其驱动特斯拉汽车内Grok语音助手的语音技术栈。这一举措标志着xAI正加速其尖端AI技术的商业化与生态构建。新开放的Grok Voice Agent API在性能与成本...

Read More
2025-12-16 talkingdev

英伟达发布Nemotron 3开源模型家族,以开放生态挑战OpenAI等巨头

英伟达近日正式发布了Nemotron 3系列开源模型,该家族包含Nano(300亿参数,30亿活跃参数)、Super(1000亿参数)和Ultra(5000亿参数)三个版本,其中Super和Ultra型号计划于2026年初推出。尤为引人注目的是,当前...

Read More
2025-12-12 talkingdev

谷歌发布Gemini深度研究交互API,AI代理自主驾驭复杂信息搜索

谷歌近日正式向开发者开放了其强大的Gemini深度研究(Gemini Deep Research)功能,通过全新的交互API(Interactions API)提供服务。这一举措标志着AI在复杂信息处理与综合能力方面迈出了重要一步。Gemini深度研究...

Read More
2025-12-05 talkingdev

OpenRouter发布《AI现状》报告:基于超100万亿真实交互令牌的深度洞察

OpenRouter平台近期发布了一份名为《AI现状》的实证研究报告,该研究标志着大语言模型(LLM)在实际应用中的一个关键转折点。报告指出,过去一年,该领域已从传统的单次模式生成,迅速转向多步骤的深思熟虑式推理。...

Read More
2025-12-05 talkingdev

OpenRouter发布《AI现状》报告:基于100万亿真实交互令牌的实证研究

近日,AI模型聚合平台OpenRouter发布了一份名为《State of AI》的深度实证研究报告。该研究基于对超过100万亿(100T)真实世界大语言模型交互令牌的分析,覆盖了不同任务类型、地理区域和时间跨度,为当前AI技术的实...

Read More
2025-12-04 talkingdev

英伟达发布性能数据:GB200 Blackwell AI服务器对月之暗面Kimi K2、深度求索R1等MoE模型推理性能提升高达10倍

英伟达于近日公布了其最新一代GB200 Blackwell AI服务器的性能基准测试数据,结果显示,相较于前代H100/H200平台,该服务器在运行特定类型的混合专家模型时,性能提升高达10倍。此次测试重点针对中国AI公司月之暗面...

Read More
2025-12-03 talkingdev

Perplexity推出BrowseSafe:为AI浏览器智能体构建实时防护盾,抵御提示注入攻击

人工智能研究公司Perplexity近日开源了其最新研究成果“BrowseSafe”,这是一个专门为保护AI浏览器智能体(AI Browser Agents)而设计的实时内容检测模型与基准测试套件。在开放世界的网页环境中,AI智能体在执行网页...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page