生成技术的相关内容 - 漫话开发者

2025-03-17 talkingdev

[开源]HiRAG：为大型语言模型检索引入分层知识增强生成方法

HiRAG（Hierarchical Retrieval-Augmented Generation）是一种创新的分层知识增强生成方法，旨在提升检索增强生成（RAG）技术在特定领域任务中的语义理解和索引能力。RAG技术通过将外部知识库与大型语言模型（LLM）...

2025-03-13 talkingdev

近期，Motion Anything项目通过引入基于注意力的掩码建模（Attention-based Mask Modeling）技术，显著提升了条件运动生成的能力。这项技术不仅在空间控制上实现了更精细的调节，还在时间维度上提供了更高的灵活性，...

2025-03-12 talkingdev

近日，一项名为MovieAgent的创新技术引起了广泛关注。该系统通过结合多种生成模态，利用基于角色的提示（persona-based prompting）来确保生成内容的一致性和准确性。MovieAgent进一步使用Stable Diffusion视频模型...

2025-03-06 talkingdev

近日，Kiss3DGen技术引起了广泛关注，该技术通过重新利用2D扩散模型，实现了高效的3D对象生成。Kiss3DGen利用多视角图像和法线贴图，能够生成高质量的3D网格和纹理。这一创新不仅简化了3D生成流程，还显著提升了生成...

2025-03-05 talkingdev

近日，一项名为DiffRhythm的技术引起了广泛关注。该技术利用Latent Diffusion模型实现了端到端的全长度歌曲生成，尽管其生成效果尚未达到顶尖闭源模型的水平，但其速度和简洁性令人印象深刻。DiffRhythm的核心优势在...

2025-03-04 talkingdev

大多数文本到图像生成模型依赖于从网络上抓取的大量自定义数据。然而，一项最新研究探讨了仅使用ImageNet数据集训练图像生成模型的可能性。研究发现，通过合成生成的密集标注（dense captions）能够显著提升模型性能...

2025-02-14 talkingdev

Adobe近日发布了其最新的Firefly Video Model，这是一款专为视频和音频创作设计的生成式AI工具。该模型不仅提供了IP友好的解决方案，还确保了商业使用的安全性，使得创作者能够在保护知识产权的同时，高效地生成高质...

2025-02-14 talkingdev

YouTube近日宣布，已将DeepMind的Veo 2技术整合至其Dream Screen功能中。这一创新举措使得用户能够通过简单的文本提示生成高质量的AI视频片段。Veo 2的加入不仅提升了视频生成的质量和效率，还为用户提供了更加丰富...