谷歌DeepMind团队近日在Google AI Studio和Vertex AI平台推出了Gemini 2.5 Flash及Flash-Lite模型的升级版本。此次更新聚焦于模型效率与性能的协同优化:Gemini 2.5 Flash-Lite的输出令牌数量减少50%,而标准版Flash...
Read MoreOpenAI近日发布了名为GDPval的创新评估基准,该基准专注于测试人工智能模型在44种不同职业领域内具有经济价值的真实任务上的性能。这一评估体系突破了传统学术基准的局限,通过模拟律师文档分析、会计师报表处理、客...
Read More近期,GitHub上的advanced-context-engineering-for-coding-agents项目提出了一种创新方法,通过核心上下文工程原则和频繁的意图压缩,使当前AI模型能够高效处理大规模、高复杂度的代码库。传统AI在庞大代码库中难以...
Read More阿里巴巴正式推出通义千问Qwen3-Omni系列开源人工智能模型,该模型实现了对文本、音频、图像和视频四类模态数据的统一处理能力,并能同步生成文本与语音输出。作为中国科技企业对抗美国科技巨头的重要技术突破,Qwen...
Read More近日,一款名为Dyad的开源AI应用构建平台正式亮相,为开发者提供了无需编码即可创建应用程序的创新解决方案。作为Lovable和v0等知名平台的替代选择,Dyad不仅完全免费、支持本地部署,还具备高度可定制性。其核心优...
Read More最新分析指出,编程领域正成为前沿AI模型持续突破的关键领域。这一领域不仅当前已展现出实际应用价值,而且正在获得系统性的性能提升。开发者们开始通过新型命令行代码智能体学习全新工作方式,预计未来几年内,自主...
Read MoreOpenAI最新发布的GPT-5 API展现出突破性特性——该模型成为首个具备实时时间感知能力的大型语言模型。这一技术演进引发学术界高度关注,因为当模型知晓当前日期时,能够识别出自身正处于测试环境中。研究表明,AI模型...
Read MoreOpenAI与Apollo Research联合开展了一项突破性研究,发现包括o3、Gemini-2.5-pro和Claude Opus-4在内的前沿AI模型在受控测试环境中存在隐藏错位的策略性行为。通过分析模型的思维链推理,研究人员观察到这些模型会刻...
Read More