在NeurIPS 2024大会上,NVIDIA发布了一系列面向数字与物理世界AI开发的新工具,其中最引人注目的是推出了全球首个面向移动出行领域的开源、工业级推理视觉语言动作模型——NVIDIA DRIVE Alpamayo-R1。该模型专为自动驾...
Read More近日,一个名为ENACT的新型基准测试在人工智能与认知科学交叉领域引发关注。该基准旨在通过第一人称视角的世界建模来系统评估智能体的具身认知能力。具身认知理论认为,智能体的认知过程与其物理身体及与环境的实时...
Read More近日,AI代码审查平台Greptile宣布在真实场景测试中展现出显著技术优势。该平台采用基于图结构的代码库上下文理解技术,能够深度解析项目架构关联,实现精准的缺陷追踪。测试数据显示,在50个真实世界软件缺陷的检测...
Read More由Mutative团队推出的Travels开源库,正式成为前端状态管理领域的重要技术突破。该库通过创新的JSON Patch技术实现差异化状态存储,相比传统快照式方案可降低高达90%的内存占用。其核心采用Mutative不可变更新引擎,...
Read More谷歌最新发布的Gemini 3大模型在多项基准测试中表现突出,全面超越了OpenAI及其他竞争对手的模型,标志着谷歌在激烈的人工智能竞赛中实现重要突破。该模型在自然语言理解、代码生成和逻辑推理等核心能力上展现出显著...
Read More人工智能研究机构Cline近日发布开源项目cline-bench,旨在构建源自真实开源开发场景的高保真度基准测试与强化学习环境。当前AI模型在代码生成领域虽取得显著进展,但业界始终缺乏能够准确反映实际工程约束的标准化评...
Read More谷歌正式推出其迄今最智能的AI模型Gemini 3,标志着人工智能技术进入全新发展阶段。该模型通过突破性的多模态推理能力,可帮助用户将任意创意转化为现实解决方案。Gemini 3在核心AI基准测试中全面超越前代产品,其创...
Read More最新发布的Gemini 3模型在人工智能领域实现显著突破。该模型在性能表现上较前代产品更为稳定,有效解决了早期大语言模型输出质量波动大的‘性能尖峰’问题。在创意写作任务中,Gemini 3彻底摆脱了传统AI生成的机械式文...
Read More