漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-28 talkingdev

FlowMDM实现长时间人体动作生成

FlowMDM是一种新的模型,用于从文本描述生成长时间连续的人体运动序列。这种首创的扩散模型使用混合位置编码进行逼真的运动创建,无需额外的去噪步骤,在关键数据集上表现出卓越的准确性和逼真度。

Read More
2023-09-29 talkingdev

谷歌发布SigLIP的checkpoints

联合嵌入模型将两种数据类型整合到一个空间中。CLIP是将图像和文本结合的热门方法之一。近期,谷歌研究员提出了一个表现优秀并且基于视觉变压器的Sigmoid CLIP模型。他们现在已经发布了关于模型的更多信息,并更新了...

Read More
2023-09-26 talkingdev

Odin开源:使用GPT-4从您的数据生成知识图谱

最近,GitHub Repo上的一个新项目Odin引起了业界的广泛关注。Odin的主要功能是利用GPT-4技术从用户的数据中生成知识图谱。知识图谱是一种以图形方式表示知识的方法,能够帮助用户更好地理解数据,并从中提取有价值的...

Read More
2023-09-04 talkingdev

用WASM打造生成式AI插件

WASM,全称Web Assembly,是现代浏览器内置的编译器目标。它的运行速度几乎与本地代码一样快,近期引起了大量的关注。本文将详细介绍如何使用WASM为生成式应用构建一个插件系统。WASM的优势在于,它可以在各种设备上...

Read More
2023-09-01 talkingdev

Duic开源-智能解码技术提升图像质量

本项目研发了一种调整图像解码方式的方法,特别适用于处理不熟悉的数据集。该过程更新解码器中的某些设置,确保在不消耗大量数据的情况下,依然能够获得高质量的图像。此外,该系统还能根据图像的类型实时适应,以获...

Read More
2023-08-11 talkingdev

论文:利用DETR改进3D物体检测的新方法

当前的3D物体检测器常常会误解数据,使其关注点距离目标物体较远。为了解决这个问题,一种名为“3D顶点相对位置编码”的新方法已经被开发出来。这种新方法可以引导检测器的注意力集中于靠近目标物体的点。这不仅提高了...

Read More
2023-06-23 talkingdev

MPT 30B发布:具备编码能力的巨型语言模型

MPT是MosaicML推出的一系列语言模型。仅在推出几周内,其7B模型已经被下载了数百万次。这款全新的30B模型是在H100s上进行训练的,具备8000个上下文长度。它经过商业授权,甚至可以进行编码!该模型可以在单个A100上...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13