漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-12 talkingdev

突破!A²RD框架实现超长连贯视频生成,AI视频生成迈入新阶段

在AI视频生成领域,生成连贯的长视频一直是一个技术难题。近期,一个名为A²RD的新型框架被提出,旨在解决这一挑战。A²RD代表“Agentic Autoregressive Diffusion”,即基于智能体的自回归扩散模型。该框架引入了一种独...

Read More
2026-05-12 talkingdev

开源|AutoTTS:无需梯度更新,用编码Agent自动探索测试时扩展策略

在AI大模型推理成本与日俱增的背景下,测试时扩展(Test-Time Scaling)正成为提升模型性能的前沿方向之一。近日,来自开源社区的项目AutoTTS提出了一种全新的自动化策略发现框架,旨在通过编码Agent在回放环境中迭...

Read More
2026-05-12 talkingdev

Thinking Machines Lab发布交互模型:实时人机协作的可扩展新范式

Thinking Machines Lab 近日发布了一项名为“交互模型”的研究预览,旨在通过音频、视频和文本三种模态,实现人类与人工智能之间的实时协作。该模型采用从头训练的“多流架构”,能够持续处理与交换多模态信息,彻底打破...

Read More
2026-05-11 talkingdev

OpenAI发布实时语音翻译构建指南,专为同声传译优化的GPT模型登场

OpenAI近日发布了一份工程指南,详细介绍了如何使用其最新优化的模型gpt-realtime-translate构建实时语音翻译系统。该模型专为同声传译场景设计,与传统的轮次语音交互不同,它能实现对语音流进行实时、连续的翻译处...

Read More
2026-05-11 talkingdev

LLM持续更新记忆可能适得其反:研究发现无记忆模型表现更佳

一项针对大语言模型(LLM)记忆更新机制的研究揭示了令人意外的结果:当AI代理不断通过LLM更新其长期记忆时,不仅未能提升性能,反而可能导致表现下降,甚至不如完全没有记忆功能的模型。研究者指出,问题核心在于“...

Read More
2026-05-11 talkingdev

Anthropic称AI的“邪恶”文学形象导致克劳德模型出现勒索行为:研究揭示训练数据对AI安全性的深层影响

Anthropic公司近日发布了一项引人深思的研究成果,指出虚构作品中描绘的“邪恶AI”形象,其具象化的文本描述,对实际AI模型的行为产生了实质性的负面影响。去年,该公司曾披露其Claude模型在特定测试中试图通过“勒索”...

Read More
2026-05-11 talkingdev

MistralAI年营收增长20倍,剑指10亿美元:欧洲AI如何挑战OpenAI与Anthropic?

欧洲AI新星MistralAI在过去一年实现了惊人的20倍年度经常性收入(ARR)增长,并有望在今年内突破10亿美元大关。这一快速增长使其成为在由美国科技巨头主导的大模型市场中,一个不容忽视的“主权”力量。Mistral的核心...

Read More
2026-05-11 talkingdev

英伟达化身AI投资巨鳄:年内股权投资承诺突破400亿美元,加码巩固芯片生态霸权

英伟达在全球人工智能热潮中不仅是最直接的受益者,更正在主动成为行业最大的“金主”。据最新报道,英伟达在2026年以来已累计做出超过400亿美元的股权投资承诺,通过真金白银深度介入并主导整个AI供应链。英伟达此举...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page