漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-03 talkingdev

多视角扩散技术提供全景图像生成能力

这项工作允许您使用一张单一的图像和一个预训练的生成模型来生成全景图像或图像的多个视角。

Read More
2023-07-03 talkingdev

百万上下文token助力DNA任务

最近,状态空间模型引起了广泛关注。它们作为一种潜在有用的模型替代方案而出现,通过避开Transformer的一些挑战性方面,同时保持性能。在这项工作中,Hyena模型被应用于DNA序列建模,并在23个任务中取得了改进。

Read More
2023-07-03 talkingdev

Filtered Guided Diffusion:高效的图生成图方法(GitHub仓库)

这项研究提出了一种名为滤波引导扩散(FGD)的方法,可以在不需要额外训练或更改底层模型的情况下增强图像翻译。FGD根据先前步骤调整扩散过程,并在结构指导和性能方面提供了显著的改进。

Read More
2023-07-03 talkingdev

精准医疗成像新方法:有限数据下的更好医学成像(GitHub Repo)

该研究介绍了一种新的方法称为'体积融合'(Volume Fusion,VF),它可以在不需要大量预标注数据的情况下训练三维医学成像模型。研究表明,结合新的网络结构,VF能够提高不同身体部位医学图像解读的准确性。

Read More
2023-06-30 talkingdev

Boba AI-如何构建基于LLM的生成应用程序

这是一个有趣的案例研究,介绍了如何构建一个基于LLM技术的生成应用程序。在这个案例中,开发团队使用了先进的自然语言处理技术,通过训练模型来生成波霸奶茶相关的内容。他们通过收集大量的波霸奶茶相关数据,并使...

Read More
2023-06-30 talkingdev

ChatLaw:开源的中文法律语言模型

本研究介绍了ChatLaw,这是一个专门为中国法律语言设计的开源语言模型,旨在助力该领域的数字化转型。ChatLaw基于深度学习技术,经过大量的法律文本训练,能够理解和生成法律相关的语言。它可以帮助律师、法官和学者...

Read More
2023-06-30 talkingdev

MusicGen: 简化音乐生成的一种新方法开源

Audiocraft推出MusicGen,这是一种简化和增强音乐生成的模型。这种单阶段的自回归Transformer模型不需要像之前的方法那样进行自监督语义表示,通过并行预测所有码本,它更高效地生成音乐,从而每秒音频的步骤更少。

Read More
2023-06-30 talkingdev

XrayGPT:一种用于放射图像分析的对话式医疗AI开源

XrayGPT是一种开创性的人工智能模型,可以以对话的方式解释胸部X射线,并回答相关问题。它将视觉理解与文本知识相结合,并通过真实放射学报告的摘要进行增强。XrayGPT为自动化X射线分析提供了新的可能性。

Read More
  1. Prev Page
  2. 398
  3. 399
  4. 400
  5. Next Page