漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-21 talkingdev

通用一致性轨迹模型(GCTMs)助力提升图像编辑效率

近期,一项名为Generalized Consistency Trajectory Models(GCTMs)的新项目在GitHub上发布,该项目致力于通过引入一致性模型来增强扩散模型在图像编辑和恢复等任务上的能力。GCTMs通过简化处理流程,实现了通过单...

Read More
2024-03-21 talkingdev

VITON-利用预训练扩散模型提升虚拟试穿体验

StableVITON是一种全新的基于图像的虚拟试穿技术。该方法专注于在利用预训练扩散模型的生成能力的同时,保持服装细节的真实性。StableVITON学习预训练模型潜在空间中衣物与人体之间的语义对应关系,从而实现更加准确...

Read More
2024-03-21 talkingdev

交互式推理技术助力大型视觉语言模型更精准理解图像

Chain-of-Spot(CoS)技术近日提出了一种交互式推理方法,该方法大幅提升了大型视觉语言模型(LVLMs)处理和理解图像的能力。CoS通过识别图像中对于特定问题或指令的关键区域,使得LVLMs能够在不损失图像分辨率的前...

Read More
2024-03-21 talkingdev

论文:DreamDA利用扩散模型开创数据增强新方法

DreamDA提出了一种全新的数据增强技术,该技术通过扩散模型合成多样化、高质量的图像,这些图像与原始数据分布极为相似。数据增强在机器学习和深度学习领域中扮演着至关重要的角色,尤其在训练模型时,能够提高模型...

Read More
2024-03-21 talkingdev

Stable Diffusion 主创离开 Stability AI 引发行业关注

Stability AI 公司的研究科学家 Robin Rombach,作为开发 Stable Diffusion 模型的关键人物,近日宣布离开公司。这一消息在技术团队经历了一年变革之后引起了业界的广泛关注。Rombach 在公司所扮演的角色及其对模型...

Read More
2024-03-21 talkingdev

Waabi推出Copilot4D:自动驾驶的前沿基础模型

Waabi公司近日发布了名为Copilot4D的创新基础模型,这一模型通过利用激光雷达(LiDAR)数据,能够理解和预测环境随时间变化的三维动态,从而显著提升了自动驾驶机器的能力。Copilot4D的核心优势在于其对环境的深度学习...

Read More
2024-03-21 talkingdev

英伟达宣布“登月计划”:打造具备人类智能的机器人

英伟达近日宣布了名为Project GR00T的宏伟计划,旨在为仿人机器人创建一个通用的基础模型。该模型将赋予机器人实时学习技能和解决各种任务的能力。这一创新项目被视为人工智能和机器人技术领域的一次“登月计划”,预...

Read More
2024-03-21 talkingdev

Quora首席执行官Adam D'Angelo谈如何将AI普及化

在这次采访中,Quora的首席执行官Adam D'Angelo探讨了如何通过为内容创作者建立基础设施来实现人工智能的民主化。采访涵盖了社交网络如何补充AI、多模型和多模态AI的概念、如何将AI技术普及给大众、为创作者提供AI基...

Read More
  1. Prev Page
  2. 286
  3. 287
  4. 288
  5. Next Page