漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-25 talkingdev

论文:谷歌新推视频生成基准测试工具,助力自动视频生成领域研究

自动视频生成作为一个新兴的研究领域,已经引起了广泛的关注。其中,故事延续、故事混搭等任务的衡量标准十分复杂。谷歌最新推出的视频生成基准测试工具,希望能帮助这一领域取得进一步的进展。通过这个基准测试,研...

Read More
2023-08-24 talkingdev

TOPIC开源,多目标跟踪新突破并发布复杂动作数据集BEE23

近日,一群研究者开发出一套名为TOPIC的新系统,能够通过运动和外观线索有效地在视频中跟踪多个对象。TOPIC系统不仅能够处理复杂的运动,而且还可以有效处理对象的外观变化,显著提高了多目标跟踪的准确性和效率。为...

Read More
2023-08-24 talkingdev

Roboflow-最新开源的视觉模型推理工具

Roboflow推理是一种在最先进的计算机视觉模型上运行推理的工具。它可以在各种设备和环境上部署,无需机器学习的先验知识。Roboflow推理支持目标检测、分类、实例分割模型以及基础模型。有一个展示Roboflow推理在足球...

Read More
2023-08-23 talkingdev

CodiumAI:能在IDE中生成测试代码的AI工具

CodiumAI是一款强大的人工智能工具,它通过分析您的代码、文档字符串和注释,并与您进行交互,可以在您编写代码的同时建议进行测试。您只需要接受并提交这些测试即可。CodiumAI支持JetBrains或VS Code,只需简单设置...

Read More
2023-08-23 talkingdev

HuggingFace发布视觉/语言模型IDEFICS:复制并优化Flamingo模型

人工智能公司HuggingFace近日发布了IDEFICS,这个名字是一个复杂的缩写,全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本,Flamingo...

Read More
2023-08-22 talkingdev

AlphaZero棋艺创新之路:深度学习为象棋游戏带来新的变革

Deepmind的研究人员在最新的研究中,试图提升他们的AlphaZero象棋智能体的玩耍能力,以减少幻觉并提高广泛的创造力。他们发现,这个智能体所下的棋步类型更加多样化,能解决一些真正具有挑战性的位置谜题。看到其如...

Read More
2023-08-22 talkingdev

StableVideo:使用扩散方法编辑视频

虽然扩散方法在创作图片和视频方面表现出色,但在编辑视频时往往难以在不改变物体随时间变化的外观的情况下进行。StableVideo使用一种特殊的技术,确保编辑后的物体在整个视频中看起来保持一致。这项技术主要利用扩...

Read More
2023-08-18 talkingdev

DDPM:一种新的视网膜图像创建方式,改进眼部图像分析

在研究眼部疾病时,专家们会使用眼部内部的详细图片,但是创建这些图像既困难又耗时。本文提出了一种新的方法(DDPM)和一个数据集(ReTree),使得创建和分析这些图像比以前更加简单和快速。DDPM方法和ReTree数据集...

Read More
  1. Prev Page
  2. 35
  3. 36
  4. 37
  5. Next Page