漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-21 talkingdev

LOMO:高效的LLM训练(GitHub开源)

这项研究介绍了LOw-Memory Optimization(LOMO),这是一种旨在显著减少大型语言模型(LLM)训练所需资源的优化器,目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU(每个具有24...

Read More
2023-06-13 talkingdev

揭秘大型语言模型中的偏见

近日,研究人员提出了一种名为“对比输入解码(CID)”的新方法,旨在通过生成反映两个略有不同输入的独特特征的文本来揭示AI语言模型对微小变化的反应,从而使其响应更加易于理解和管理。这对于确保公平性和实用性至...

Read More
2023-06-05 talkingdev

新技术:使用极端表情塑造更真实面部模型

近日,研究人员开发了一种新方法,名为BlendFields,旨在更精确地模拟出人脸的表情细节。该方法借鉴了传统计算机图形学技术,通过使用一些极端的面部表情来重新塑造新的表情,从而达到更细致、更真实的面部细节。...

Read More
2023-05-31 talkingdev

Github项目ProlificDreamer提升文本到3D图像生成效果

ProlificDreamer是一种提高文本到3D图像生成效果的新方法。它通过将3D参数视为随机变量来解决文本到3D生成中早期Score Distillation Sampling(SDS)方法中存在的过度饱和和低多样性等问题。这种变分Score Distillat...

Read More
2023-05-29 talkingdev

论文介绍新方法:提高文本转SQL的准确性

近日,有一篇论文提出了一种新的方法,旨在改进计算机理解和将日常语言转换为SQL的能力。该方法通过查看代码的整个部分而非单个单词来纠正错误,并使用一种新的SQL查询表示法,更接近于现有代码语言模型的工作方式,...

Read More
2023-05-26 talkingdev

技术新闻:使用文本预热启动来提高语音语言模型性能

TWIST是一种新的训练语音语言模型(SpeechLMs)的方法,它使用预先训练的文本模型来进行热启动。该方法优于从头开始训练,经验分析强调了模型和数据集规模的重要性。这项研究介绍了迄今为止最大的SpeechLM,并引入了...

Read More
2023-05-22 talkingdev

利用真实世界知识提升语言模型表现:新的微调方法

研究人员设计了一种新方法,使用虚拟模拟器为语言模型提供“具身体验”,以培养其对真实世界的理解和规划能力。这种新方法显著提高了模型的能力,使得小型模型的表现与 ChatGPT 等大型模型相当甚至更好。 ## 三个核心...

Read More
2023-05-19 talkingdev

FastComposer:高效个性化的多主题文本到图像生成技术

近日,研究人员开发出一种名为FastComposer的新方法,能够快速创建个性化的多主题图像,避免了其他方法中耗时的微调。不仅如此,FastComposer还能够处理多主题生成中的混合问题,并且可以更快地生成不同风格、动作和...

Read More
  1. Prev Page
  2. 32
  3. 33
  4. 34
  5. Next Page