Stability AI宣布其开源模型组合中将新增稳定视频传输技术Stable Video Diffusion。其AI模型组合已经涵盖了图像、语言、音频、3D和代码等多种模态。
Read More针对LLM(语言模型)的指令数据集,CoachLM引入了一种新型AI技术,通过修改而非删除低质量样本独特地改进了数据集,从而显著提高了LLM遵循指令的效果。
Read MoreInsanely Fast Whisper with Speaker Diarization是一款针对音频文件的命令行工具,具有较强的自动转录能力。该工具还包括说话人分割和区分(例如,识别说话人1与说话人2)。该工具声称即使在一些最大的模型上,也能...
Read More伯克利的一组研究人员使用合成偏好数据训练了一个新的最先进的7B参数模型。本文讨论了训练奖励模型的新挑战(例如,示例在列表中的位置会改变其排名)以及他们如何克服这些挑战。结果模型可与经过训练的奖励模型一起...
Read More研究人员已经设计出一种独特的圆形混合方法来解决创建无缝360度全景图像的长期难题。这种技术是他们从文本和单张图像生成全景图像的创新模型的关键特征。
Read More近日,由研究人员开发的基于基因组数据的人工智能模型GenSLMs,准确地生成了类似最近COVID-19变种的基因序列,尽管它只是在早期疫情数据上进行的训练,这展示了它预测病毒进化和辅助研究的潜力。GenSLMs是一种基于序...
Read More视觉上下文提示(Visual In-Context Prompting)是一种创新的方法,能适应各种提示和上下文,极大地提高了分割任务的性能,并在开放式挑战中展示了令人印象深刻的结果。该方法为深度学习模型提供了更多的信息,从而...
Read MoreSegVol的问世,标志着临床分析迎来了新时代。SegVol是一种用于医学图像分割的通用模型。它在大量CT扫描的基础上进行训练,能够优秀地完成各种各样的解剖类别分割。
Read More