漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-21 talkingdev

论文:DreamDA利用扩散模型开创数据增强新方法

DreamDA提出了一种全新的数据增强技术,该技术通过扩散模型合成多样化、高质量的图像,这些图像与原始数据分布极为相似。数据增强在机器学习和深度学习领域中扮演着至关重要的角色,尤其在训练模型时,能够提高模型...

Read More
2024-02-27 talkingdev

谷歌承认AI生成图像失控

谷歌承认其AI模型Gemini存在问题。该模型会向历史图像中注入不适当的多样性,反映出训练数据中存在偏见的问题。这个缺陷引发了有关科技领域中多样性、公平性和包容性的讨论。谷歌暗示将来会做出改进,但没有就AI在生...

Read More
2024-01-31 talkingdev

基于Transformer的大词汇量3D扩散模型

3D对象生成的一个关键挑战是可以创建的物品的多样性。本研究使用修改后的架构来提高样本效率,并将系统扩展到可以处理每个3D类别中更大的对象集。

Read More
2024-01-29 talkingdev

AgentBoard提升模型评估能力,多轮LLM评估升级

近日,研发团队宣布推出了AgentBoard,一款专为多轮LLM代理设计的基准测试工具。AgentBoard不仅可以评估LLM代理的最终成功率,还提供了分析评估板以进行更详细的模型评估。这款工具可以更全面地评估LLM代理,为LLM代...

Read More
2024-01-11 talkingdev

文本到3D模型的评估指标

研究人员开发了一种新的文本到3D生成模型的评估指标,解决了当前单一标准指标的局限性。这种先进的方法使用GPT-4V来创建提示并比较3D资产。它与人类偏好密切相关,并通过适应各种用户定义的标准来提供多样性

Read More
2023-12-13 talkingdev

论文:探索空间-时间多样性,STDN视频分类技术

空间-时间多样化网络(STDN)是一种新型模型,通过探索帧内的空间特征和时间上的关联关系来捕捉视频中的多种线索。STDN模型可以同时捕捉视频中的动作、外观、场景和对象等多种信息,从而实现更准确的视频分类。此技...

Read More
2023-12-12 talkingdev

LSDM-多条件扩散模型实现场景合成

本项目引入了一种新颖的方法——多条件扩散模型,通过高效地将文本、动作和现有物体融合起来,为人体运动或房间设计等因素引导的场景创作带来了新的视角。该方法将不同条件下的扩散算法结合起来,以生成高质量的合成场...

Read More
2023-12-07 talkingdev

AI联盟成立,为安全和开放AI的国际社区

IBM和Meta领导的AI联盟,汇聚了50多个全球组织,旨在促进开放、负责任的AI发展。它的重点是制定AI标准、推进硬件发展、促进AI教育和技能。成员包括主要的技术公司、大学和研究机构。该联盟强调安全、多样性和平等获...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page