漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-17 talkingdev

论文:SupFusion提高LiDAR和相机检测能力

一篇发表在arXiv上的论文介绍了一种新技术SupFusion,它能够使激光雷达(LiDAR)和相机系统更好地协同工作,用于检测汽车或行人等物体。这项技术使用多任务学习方法,同时考虑激光雷达和相机的输出,将它们融合成更...

Read More
2023-10-13 talkingdev

whispering-llama:最新开源多模态融合技术以增强语音识别

研究人员开发了一种新技术,将声音信息和语言数据结合起来,纠正自动语音识别系统中的错误。该技术基于交叉模态融合,使用视觉和语言信息来提供更准确的识别结果。此外,该技术还可以提供更好的语音合成能力。研究人...

Read More
2023-10-11 talkingdev

提升文本生成中扩散模型的速度

研究人员推出了一种用于文本生成中的扩散模型的新技术。通过使用软吸收状态,他们改善了模型处理离散文本变化的方式,从而加快了学习速度和采样速度。扩散模型是一种能够模拟物质扩散过程的数学模型,能够以一种高效...

Read More
2023-10-06 talkingdev

牛津大学科学家开发 3D 打印技术为脑损伤修复带来希望

英国牛津大学的科学家使用人类干细胞通过 3D 打印技术创建了大脑组织。他们能够使用这种技术来复制大脑的海马体结构。这项技术将为研究人员提供探索大脑工作的新方法。同时,证明该打印组织可以与活体大脑融合,为脑...

Read More
2023-10-05 talkingdev

Claude推出新技术提升技术文档索引能力

Claude最近推出了一项新技术,该技术将其记忆库的容量提高到了100,000个令牌。此次技术升级主要通过两种技术实现了对技术文档的索引能力的提升。Anthropic公司也对此进行了全面的发布,并推出了名为'Anthropic Cookb...

Read More
2023-10-05 talkingdev

MiniGPT-5:一种全新的图文生成方式

试想一下,如果有一个模型既能理解和撰写文本,同时也能创作出匹配的图片,那将是多么的神奇。这就是新模型MiniGPT-5所能做到的。MiniGPT-5采用了一种被称为“生成vokens”的特殊技术来实现这一目标。所谓的“生成voken...

Read More
2023-10-03 talkingdev

高斯注意力(Gaussian Attention)改进光流的研究进展(GitHub Repo)

光流技术是帮助我们理解图像中物体运动的重要技术。一项新的研究利用高斯注意力(Gaussian Attention),专注于更细微的细节并更好地将它们匹配起来,从而研发出了一个名为GAFlow的模型。高斯注意力的使用,可以使光流...

Read More
2023-09-29 talkingdev

论文:VQ-VAE的简化,新方案提出简易量化计划

向量量化变分自编码器(VectorQuantized-VAEs)通常被视为在学习特定离散表示(例如,令牌或代码)时的最新技术。然而,它们通常复杂且脆弱。一篇新的论文提出了一种简单的量化方案,消除了代码本崩溃和复杂的设备,...

Read More
2023-09-28 talkingdev

Llava-RLHF视觉对齐模型的全新技术突破

Llava是一种将视觉能力插入语言模型的方法。现在,它已经通过指令调整,并运行了RLHF(强化学习和直觉推理)过程。Llava大大提高了指令遵循和推理能力。这种新方法将人工智能技术推向了一个新的高度,使得计算机不仅...

Read More
2023-09-27 talkingdev

改善虚拟图像视角的新方法:折射-反射场

神经辐射场(NeRF)在创建虚拟视图方面表现出色,但对于光滑或透明的物体则力不从心。一种新的方法,被称为折射-反射场,通过更好地处理光变化和产生更清晰的复杂物体图像,解决了这个问题。这一新技术的采用,将极大...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page