音频生成的相关内容 - 漫话开发者

2025-09-29 talkingdev

Inception Point AI CEO无视争议，誓言继续大规模发布AI生成播客

Inception Point AI联合创始人兼CEO Jeanine Wright在近期接受彭博社专访时表示，尽管面临行业争议，公司仍将坚持大规模生产AI生成播客内容。Wright预测，在未来12至24个月内，人工创作内容反而将成为市场中的异类。...

2025-06-13 talkingdev

字节跳动旗下TikTok母公司最新发布的Seedance 1.0模型在文本生成视频（text-to-video）和图像生成视频（image-to-video）两项核心任务中均位列榜首，其性能表现超越谷歌Veo 3与OpenAI Sora等业界标杆。该模型仅需41...

2025-05-15 talkingdev

Stability AI近日开源了名为Stable Audio Open Small的文本转音频模型，该模型拥有3.41亿参数，专为在Arm架构的CPU上高效运行而优化。这一突破性技术使得在智能手机上生成11秒的音频片段仅需不到8秒的时间，极大地提...

2025-03-04 talkingdev

Stability AI与Arm近日宣布合作，成功将实时生成音频技术引入智能手机。通过结合Stable Audio Open和Arm KleidiAI库，双方在移动设备上实现了音频生成速度的30倍提升。这一突破性进展不仅展示了生成式AI在音频领域的...

2025-02-14 talkingdev

Adobe近日发布了其最新的Firefly Video Model，这是一款专为视频和音频创作设计的生成式AI工具。该模型不仅提供了IP友好的解决方案，还确保了商业使用的安全性，使得创作者能够在保护知识产权的同时，高效地生成高质...

2025-01-23 talkingdev

MMAudio 是一个创新的视频到音频生成系统，能够以视频作为输入，并根据视频内容生成与之配对的音频。该系统在处理合成视频和真实视频时均表现出色。通过先进的算法和模型，MMAudio 能够捕捉视频中的关键视觉信息，并...

2024-10-31 talkingdev

随着人工智能技术的不断进步，音频生成领域正在迎来前所未有的突破。最新的研究成果显示，通过结合LLM和embedding技术，研究人员能够生成更加自然和富有表现力的音频内容。这一进展不仅为音乐创作、声音模拟等应用带...

2024-07-08 talkingdev

近日，Tongyi语音团队发布了他们的最新成果，一套超强的音频理解与生成模型。这套模型的发布，无疑将大大推动音频技术的发展与进步。模型的理解部分，能够准确分析出音频中的各种元素和信息，包括但不限于音质、音色...