漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-21 talkingdev

智能机器人3D扩散器

智能机器人的应用已经越来越广泛,但是如何让机器人更好地理解和与环境互动仍然是一个挑战。最近,一项名为3D Diffuser Actor的技术被开发出来,它结合了扩散策略和3D场景表示,可以提高机器人的操作效率。这一技术...

Read More
2024-02-21 talkingdev

SpLiCE:让CLIP的视觉数据更易理解

新的SpLiCE方法使得CLIP的复杂视觉数据更易于理解。CLIP是一种先进的人工智能模型,它可以在不需要人工标注的情况下学习视觉概念。然而,由于CLIP的视觉数据非常复杂,很难解释和理解。SpLiCE通过使用可解释的特征来...

Read More
2024-02-19 talkingdev

RoCo-开源高效LLM新策略

GitHub近日开源了一项名为RoCo的新策略,该策略旨在提高LLM在有限资源环境下的效率。RoCo是一种强大的缓存遗漏策略,可以帮助用户更好地使用LLM。该政策的发布将有助于优化机器学习应用的性能,提高效率。RoCo的开源...

Read More
2024-02-19 talkingdev

论文:跨越多个受试者的脑电活动解码技术

研究人员引入了一种新的方法CLIP-MUSED,可以跨越不同个体解码脑电信号中的视觉信息。该方法结合了神经图像和机器学习技术,可以为研究人员提供更深入的理解不同个体之间的脑电活动差异。研究人员表示,该技术的应用...

Read More
2024-02-19 talkingdev

论文:如何使用扩散模型进行视频压缩

研究人员开发了一种新的视频压缩方法,使用扩散模型生成高质量的视频帧,同时保持低数据速率。该方法将视频压缩与机器学习相结合,能够在保持视频质量的同时减少数据传输的成本。研究人员在测试中发现,这种方法能够...

Read More
2024-02-19 talkingdev

Lambda Labs完成3.2亿美元C轮融资,将继续构建强大的GPU云

Lambda Labs最近完成了3.2亿美元的C轮融资,以继续推进其强大的GPU云技术。该公司的GPU云可以为用户提供高性能计算和机器学习服务。Lambda Labs计划利用这笔融资来扩大其研发团队和全球业务,以加速其在云计算领域的...

Read More
2024-02-16 talkingdev

VideoAnnotator开源:结合人类专业知识的注释方法提高视频分类精度

近日,一种名为Video Annotator的框架已经在GitHub上发布。该框架通过将领域专家直接融入注释过程中,利用零样本学习和主动学习技术提高模型的精度和效率。这种注释方法不仅提高了模型的分类准确度,而且可以更好地...

Read More
2024-02-16 talkingdev

Google发布Lumiere文本到视频模型

Google最近推出了一种新的文本到视频模型Lumiere,该模型可以将图像和风格作为输入,并使用一种新颖的“空时UNet”同时扩散所有内容。该模型采用了深度学习技术,可以将文本内容转换为相对应的视频,并且不需要任何人...

Read More
  1. Prev Page
  2. 95
  3. 96
  4. 97
  5. Next Page