多模态的相关内容 - 漫话开发者

2026-06-18 talkingdev

TREX：AI代码审查进入“可执行”时代，沙盒运行捕获运行时错误

AI代码审查工具Greptile近日发布了TREX，这是一个突破性的代码审查执行层，将静态代码分析与动态代码执行相结合，能够发现传统静态分析难以察觉的运行时错误。TREX采用多智能体架构，核心由一个Greptile审查者协调多...

2026-06-18 talkingdev

NVIDIA近日宣布其XR AI平台进入公开测试阶段，为增强现实（AR）眼镜和扩展现实（XR）头显开发者提供了一个关键的底层基础设施。该平台是一个开源库，旨在填补当前硬件就绪但缺乏集成本地AI体验的空白。它允许开发者...

2026-06-11 talkingdev

HelixDB 是一个基于 Rust 语言开发的开源在线事务处理（OLTP）图向量数据库，旨在将向量、图、关系型和文档数据统一到一个系统中，从而简化人工智能（AI）的记忆管理。Rust 语言以其高性能和内存安全性著称，为 Heli...

2026-06-10 talkingdev

Anthropic近日正式推出了两款全新的模型：Claude Fable 5和Claude Mythos 5。其中，Claude Fable 5是一款经过安全适配、面向大众场景的“Mythos级”模型，标志着Anthropic在强化模型能力与可控性之间取得了关键平衡。...

2026-06-03 talkingdev

中国AI创企MiniMax近日正式推出了其最新一代的M3大语言模型，并通过API和Token计划向开发者开放。该模型最引人注目的特点之一是拥有高达100万token的超长上下文窗口，并且官方承诺API至少保证提供51.2万个token的处...

2026-06-02 talkingdev

英伟达今日正式发布Cosmos 3，这是一款面向物理AI的开源世界基础模型，标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器（Mixture-of-Transformers）架构，将视觉推理、世界生成...

2026-06-02 talkingdev

在生成式AI的激烈竞争中，视频生成与世界模型正成为下一个前沿战场。Ethan He，这位曾领导NVIDIA Cosmos世界模型项目的核心人物，在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...

2026-06-02 talkingdev

阿里巴巴通义千问团队近日发布了其最新的多模态智能体模型Qwen3.7-Plus，标志着通用人工智能在感知与行动融合层面迈出了重要一步。该模型将视觉识别与语言理解能力深度融合，构建了一个单一、通用的多模态智能体基础...