StableVSR是一种新颖的视频超分辨率(VSR)方法,利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比,StableVSR可以更好地处理不同的噪声和失真情况,并且在不需要额外训练数据的情况下也...
Read More稳定AI发布了一款新模型SDXL Turbo,可以在207ms内生成高分辨率图像。该模型不使用LCM,而是采用一种称为对抗扩散蒸馏的新颖蒸馏技术。该模型的权重和代码已被用于研究中。
Read MoreStability AI宣布其开源模型组合中将新增稳定视频传输技术Stable Video Diffusion。其AI模型组合已经涵盖了图像、语言、音频、3D和代码等多种模态。
Read More针对LLM(语言模型)的指令数据集,CoachLM引入了一种新型AI技术,通过修改而非删除低质量样本独特地改进了数据集,从而显著提高了LLM遵循指令的效果。
Read MoreInsanely Fast Whisper with Speaker Diarization是一款针对音频文件的命令行工具,具有较强的自动转录能力。该工具还包括说话人分割和区分(例如,识别说话人1与说话人2)。该工具声称即使在一些最大的模型上,也能...
Read More伯克利的一组研究人员使用合成偏好数据训练了一个新的最先进的7B参数模型。本文讨论了训练奖励模型的新挑战(例如,示例在列表中的位置会改变其排名)以及他们如何克服这些挑战。结果模型可与经过训练的奖励模型一起...
Read More研究人员已经设计出一种独特的圆形混合方法来解决创建无缝360度全景图像的长期难题。这种技术是他们从文本和单张图像生成全景图像的创新模型的关键特征。
Read More近日,由研究人员开发的基于基因组数据的人工智能模型GenSLMs,准确地生成了类似最近COVID-19变种的基因序列,尽管它只是在早期疫情数据上进行的训练,这展示了它预测病毒进化和辅助研究的潜力。GenSLMs是一种基于序...
Read More