漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-04 talkingdev

一种更真实的三维运动分析新方法(GitHub仓库)

该研究介绍了一种新方法,改进了对环境中三维运动的理解,相比现有技术产生了更真实的姿势。

Read More
2023-07-03 talkingdev

精准医疗成像新方法:有限数据下的更好医学成像(GitHub Repo)

该研究介绍了一种新的方法称为'体积融合'(Volume Fusion,VF),它可以在不需要大量预标注数据的情况下训练三维医学成像模型。研究表明,结合新的网络结构,VF能够提高不同身体部位医学图像解读的准确性。

Read More
2023-06-30 talkingdev

MusicGen: 简化音乐生成的一种新方法开源

Audiocraft推出MusicGen,这是一种简化和增强音乐生成的模型。这种单阶段的自回归Transformer模型不需要像之前的方法那样进行自监督语义表示,通过并行预测所有码本,它更高效地生成音乐,从而每秒音频的步骤更少。

Read More
2023-06-27 talkingdev

一站式图像修复解决方案(GitHub仓库)

“PromptIR”是一种新方法,使用提示信息从退化版本中恢复高质量图像,无论退化的类型或严重程度如何。这种先进技术适用于各种图像问题,如噪声、模糊和雾霾。

Read More
2023-06-23 talkingdev

Tart: 提升LLMs推理能力的新方法

这项研究揭示了大型语言模型(LLMs)在处理不同任务时可以胜任,但在概率推理方面存在困难,从而限制了它们的性能。作者提出了一种名为Tart的解决方案 - 一种在通用方式下训练的推理模块,当与任何现有模型结合时,...

Read More
2023-06-21 talkingdev

LOMO:高效的LLM训练(GitHub开源)

这项研究介绍了LOw-Memory Optimization(LOMO),这是一种旨在显著减少大型语言模型(LLM)训练所需资源的优化器,目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU(每个具有24...

Read More
2023-06-13 talkingdev

揭秘大型语言模型中的偏见

近日,研究人员提出了一种名为“对比输入解码(CID)”的新方法,旨在通过生成反映两个略有不同输入的独特特征的文本来揭示AI语言模型对微小变化的反应,从而使其响应更加易于理解和管理。这对于确保公平性和实用性至...

Read More
2023-06-05 talkingdev

新技术:使用极端表情塑造更真实面部模型

近日,研究人员开发了一种新方法,名为BlendFields,旨在更精确地模拟出人脸的表情细节。该方法借鉴了传统计算机图形学技术,通过使用一些极端的面部表情来重新塑造新的表情,从而达到更细致、更真实的面部细节。...

Read More
  1. Prev Page
  2. 29
  3. 30
  4. 31
  5. Next Page