漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-21 talkingdev

VITON-利用预训练扩散模型提升虚拟试穿体验

StableVITON是一种全新的基于图像的虚拟试穿技术。该方法专注于在利用预训练扩散模型的生成能力的同时,保持服装细节的真实性。StableVITON学习预训练模型潜在空间中衣物与人体之间的语义对应关系,从而实现更加准确...

Read More
2024-03-21 talkingdev

交互式推理技术助力大型视觉语言模型更精准理解图像

Chain-of-Spot(CoS)技术近日提出了一种交互式推理方法,该方法大幅提升了大型视觉语言模型(LVLMs)处理和理解图像的能力。CoS通过识别图像中对于特定问题或指令的关键区域,使得LVLMs能够在不损失图像分辨率的前...

Read More
2024-03-21 talkingdev

论文:DreamDA利用扩散模型开创数据增强新方法

DreamDA提出了一种全新的数据增强技术,该技术通过扩散模型合成多样化、高质量的图像,这些图像与原始数据分布极为相似。数据增强在机器学习和深度学习领域中扮演着至关重要的角色,尤其在训练模型时,能够提高模型...

Read More
2024-03-21 talkingdev

NLX完成1500万美元A轮融资,推动企业级对话AI平台发展

NLX,一家致力于企业级对话人工智能平台的公司,近日宣布从Cercano、Comcast等投资方获得了额外的资金支持。该公司的平台被广泛用于构建聊天、语音、视频以及对话系统等多种交互形式。随着人工智能技术的不断进步,N...

Read More
2024-03-21 talkingdev

Stable Diffusion 主创离开 Stability AI 引发行业关注

Stability AI 公司的研究科学家 Robin Rombach,作为开发 Stable Diffusion 模型的关键人物,近日宣布离开公司。这一消息在技术团队经历了一年变革之后引起了业界的广泛关注。Rombach 在公司所扮演的角色及其对模型...

Read More
2024-03-21 talkingdev

Waabi推出Copilot4D:自动驾驶的前沿基础模型

Waabi公司近日发布了名为Copilot4D的创新基础模型,这一模型通过利用激光雷达(LiDAR)数据,能够理解和预测环境随时间变化的三维动态,从而显著提升了自动驾驶机器的能力。Copilot4D的核心优势在于其对环境的深度学习...

Read More
2024-03-21 talkingdev

英伟达宣布“登月计划”:打造具备人类智能的机器人

英伟达近日宣布了名为Project GR00T的宏伟计划,旨在为仿人机器人创建一个通用的基础模型。该模型将赋予机器人实时学习技能和解决各种任务的能力。这一创新项目被视为人工智能和机器人技术领域的一次“登月计划”,预...

Read More
2024-03-21 talkingdev

DocuSign的7000名员工与B2B SaaS销售的铁律

DocuSign拥有超过7000名员工,其中大部分从事销售工作。大约24%的员工致力于工程、产品开发和客户运营。该公司的销售和工程人员比例并不罕见。即使公司在一个领域中地位稳固,其未来和利润也总是充满不确定性——因此...

Read More
  1. Prev Page
  2. 661
  3. 662
  4. 663
  5. Next Page