在AI视频生成领域,生成连贯的长视频一直是一个技术难题。近期,一个名为A²RD的新型框架被提出,旨在解决这一挑战。A²RD代表“Agentic Autoregressive Diffusion”,即基于智能体的自回归扩散模型。该框架引入了一种独...
Read More在AI大模型推理成本与日俱增的背景下,测试时扩展(Test-Time Scaling)正成为提升模型性能的前沿方向之一。近日,来自开源社区的项目AutoTTS提出了一种全新的自动化策略发现框架,旨在通过编码Agent在回放环境中迭...
Read MoreThinking Machines Lab 近日发布了一项名为“交互模型”的研究预览,旨在通过音频、视频和文本三种模态,实现人类与人工智能之间的实时协作。该模型采用从头训练的“多流架构”,能够持续处理与交换多模态信息,彻底打破...
Read MoreOpenAI近日发布了一份工程指南,详细介绍了如何使用其最新优化的模型gpt-realtime-translate构建实时语音翻译系统。该模型专为同声传译场景设计,与传统的轮次语音交互不同,它能实现对语音流进行实时、连续的翻译处...
Read More一项针对大语言模型(LLM)记忆更新机制的研究揭示了令人意外的结果:当AI代理不断通过LLM更新其长期记忆时,不仅未能提升性能,反而可能导致表现下降,甚至不如完全没有记忆功能的模型。研究者指出,问题核心在于“...
Read MoreAnthropic公司近日发布了一项引人深思的研究成果,指出虚构作品中描绘的“邪恶AI”形象,其具象化的文本描述,对实际AI模型的行为产生了实质性的负面影响。去年,该公司曾披露其Claude模型在特定测试中试图通过“勒索”...
Read More欧洲AI新星MistralAI在过去一年实现了惊人的20倍年度经常性收入(ARR)增长,并有望在今年内突破10亿美元大关。这一快速增长使其成为在由美国科技巨头主导的大模型市场中,一个不容忽视的“主权”力量。Mistral的核心...
Read More英伟达在全球人工智能热潮中不仅是最直接的受益者,更正在主动成为行业最大的“金主”。据最新报道,英伟达在2026年以来已累计做出超过400亿美元的股权投资承诺,通过真金白银深度介入并主导整个AI供应链。英伟达此举...
Read More