漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-29 talkingdev

Stable Video Diffusion发布,AI模型全面升级

Stability AI宣布其开源模型组合中将新增稳定视频传输技术Stable Video Diffusion。其AI模型组合已经涵盖了图像、语言、音频、3D和代码等多种模态。

Read More
2023-11-29 talkingdev

CoachLM引入新型AI技术可提高指令质量

针对LLM(语言模型)的指令数据集,CoachLM引入了一种新型AI技术,通过修改而非删除低质量样本独特地改进了数据集,从而显著提高了LLM遵循指令的效果。

Read More
2023-11-29 talkingdev

InsanelyFastWhisper即时音频转录工具

Insanely Fast Whisper with Speaker Diarization是一款针对音频文件的命令行工具,具有较强的自动转录能力。该工具还包括说话人分割和区分(例如,识别说话人1与说话人2)。该工具声称即使在一些最大的模型上,也能...

Read More
2023-11-29 talkingdev

Berkeley的研究人员通过RLAIF提高Starling-7B模型的帮助性和无害性

伯克利的一组研究人员使用合成偏好数据训练了一个新的最先进的7B参数模型。本文讨论了训练奖励模型的新挑战(例如,示例在列表中的位置会改变其排名)以及他们如何克服这些挑战。结果模型可与经过训练的奖励模型一起...

Read More
2023-11-29 talkingdev

360度全景成像混合技术实现开源

研究人员已经设计出一种独特的圆形混合方法来解决创建无缝360度全景图像的长期难题。这种技术是他们从文本和单张图像生成全景图像的创新模型的关键特征。

Read More
2023-11-28 talkingdev

LLM成功预测COVID变异特征

近日,由研究人员开发的基于基因组数据的人工智能模型GenSLMs,准确地生成了类似最近COVID-19变种的基因序列,尽管它只是在早期疫情数据上进行的训练,这展示了它预测病毒进化和辅助研究的潜力。GenSLMs是一种基于序...

Read More
2023-11-28 talkingdev

论文:视觉上下文提示:AI视觉任务的新时代

视觉上下文提示(Visual In-Context Prompting)是一种创新的方法,能适应各种提示和上下文,极大地提高了分割任务的性能,并在开放式挑战中展示了令人印象深刻的结果。该方法为深度学习模型提供了更多的信息,从而...

Read More
2023-11-28 talkingdev

医疗图像分割技术有了新突破

SegVol的问世,标志着临床分析迎来了新时代。SegVol是一种用于医学图像分割的通用模型。它在大量CT扫描的基础上进行训练,能够优秀地完成各种各样的解剖类别分割。

Read More
  1. Prev Page
  2. 329
  3. 330
  4. 331
  5. Next Page