OpenAI近日正式推出两款开源权重推理模型gpt-oss-120b和gpt-oss-20b,标志着其在开放生态建设上的重大进展。这两款模型采用Apache 2.0许可证,允许用户自由定制并应用于商业场景,其显著特性包括支持智能体任务处理...
Read MoreMetaStone AI近日在GitHub上发布了其第四代开源模型XBai o4,该模型在复杂推理任务上表现出色,并在Medium模式下性能超越了OpenAI的o3-mini模型。XBai o4不仅优化了推理能力,还引入了一个可扩展的并行测试时推理框...
Read MoreElevenLabs近日发布了一款创新的命令行界面(CLI)工具,该工具允许开发者将对话式AI代理作为代码进行管理。这一突破性工具为语音和聊天代理工作流带来了版本控制、自动化部署和环境一致性等关键功能。该CLI工具支持多...
Read MoreDaily Bench是一个开源的仪表盘项目,专注于监控Anthropic、Google和OpenAI等主流AI提供商的模型性能表现。该项目旨在检测模型在官方发布版本之间可能出现的质量退化问题,这些问题通常由推理过程变更、知识蒸馏或量...
Read More阿里巴巴最新开源的Qwen3-235B思维模型在技术领域取得重大突破,该模型在AIME25数学竞赛中达到92.3%的准确率,与OpenAI的O4-mini性能相当,并在编码基准测试中以74.1%的LiveCodeBench得分实现超越。这一2350亿参数的...
Read More通义千问团队正式发布Qwen3-Coder,这是迄今为止最先进的智能编码代理模型。该模型采用4800亿参数的混合专家架构(Mixture-of-Experts),其中激活参数达350亿,并支持超长上下文处理。在智能编码、浏览器操作和工具...
Read More阿里云旗下通义千问(Qwen)团队近日宣布对Qwen3-235B-A22B模型进行重大更新,新版本编号为Qwen3-235B-A22B-2507。此次更新的核心变化是取消了原先的混合思维模式(hybrid thinking mode),转而采用将指令模型(Instruct...
Read More谷歌宣布为其AI Pro和AI Ultra订阅用户推出搜索功能的重大升级,集成Gemini 2.5 Pro模型并引入深度搜索(Deep Search)技术。这一更新标志着搜索引擎正式进入多轮复杂交互时代,支持用户提交更长查询语句及连续追问...
Read More