漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-12 talkingdev

论文:TechGPT-2.0在知识图谱构建中的应用

近日,技术领域的新闻人士表示,TechGPT-2.0在知识图谱构建中的应用取得了重大进展。该项目专注于命名实体识别和关系三元组提取,为大型语言模型的特定任务增添了新的功能。该项目的成功也标志着中国开源人工智能社...

Read More
2024-01-12 talkingdev

单个非自回归Transformer实现掩码音频生成

大多数音频生成技术使用扩散或自回归模型来生成声音。而这项研究并不使用多步骤或复杂的Transformer。相反,它使用了一个掩码语言模型来生成音频令牌。

Read More
2024-01-12 talkingdev

Unsloth轻量化库加速TRL上的模型

Unsloth是一个轻量化库,可加速语言模型的微调。它现在可以轻松地与TRL在常见的模型架构上配合使用。Unsloth库通过一个简单的API使得模型训练和微调更快速。它可以帮助从训练数据中自动学习、优化和微调模型,使得模...

Read More
2024-01-11 talkingdev

谷歌开源1.6T MoE模型

谷歌的开关Transformer是最早成功的专家混合模型之一。现在,该模型的代码已经在HuggingFace平台上发布,供人们使用。

Read More
2024-01-11 talkingdev

人体姿态与身形编辑技术取得新突破

该项目介绍了一种一次性编辑人类图像的方法,可以在保留人的身份的同时,对姿势和身形进行重大变化。该技术基于深度学习模型,利用对抗生成网络 (GAN) 和条件生成网络 (CGAN) 的方法,用户只需提供一张人体图像,就...

Read More
2024-01-11 talkingdev

医学领域的LLM技术专家Agent开源

研究人员开发了一种新的多学科协作框架,以提高大型语言模型在医学领域的理解和推理能力。这种方法涉及到AI代理,扮演一起分析、讨论和达成共识的医学主题的角色扮演游戏。

Read More
2024-01-11 talkingdev

STL-开源自我涌现令牌标记的视觉转换器,提高稳定性

对于视觉转换器(ViTs)的显著进展,研究人员使用一种新的自我涌现令牌标记(STL)框架,提高了完全注意力网络(FAN)模型的鲁棒性。这种方法涉及训练FAN令牌标记器来创建有意义的补丁令牌标记,然后训练FAN学生模型

Read More
2024-01-11 talkingdev

文本到3D模型的评估指标

研究人员开发了一种新的文本到3D生成模型的评估指标,解决了当前单一标准指标的局限性。这种先进的方法使用GPT-4V来创建提示并比较3D资产。它与人类偏好密切相关,并通过适应各种用户定义的标准来提供多样性。

Read More
  1. Prev Page
  2. 307
  3. 308
  4. 309
  5. Next Page