漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-28 talkingdev

[开源]测量视觉模型内部偏差的新方法(GitHub Repo)

近日,一项利用注意力图量化视觉模型内部偏差的新指标在GitHub上开源。该技术通过分析模型在识别过程中的注意力分布,能够有效识别出导致偏差的混淆特征,突破了传统基于群体准确率差异的评估局限。这项名为Attentio...

Read More
2025-03-28 talkingdev

[开源]PET-MAD:基于MAD数据集训练的通用原子间势能模型

PET-MAD是一种基于MAD数据集训练的通用原子间势能模型,能够预测复杂材料建模中的能量和力,适用于元素周期表中的各种元素。这一模型的开发标志着计算材料科学领域的重要突破,为材料模拟和设计提供了更高效、更准确...

Read More
2025-03-28 talkingdev

[论文推荐]Guidance-Free Training:无需分类器引导的视觉生成模型训练新方法

近日,一项名为Guidance-Free Training(GFT)的技术突破引发计算机视觉领域关注。该技术通过完全消除对Classifier-Free Guidance(CFG)的依赖,在保持生成质量的同时显著降低计算成本。与传统基于蒸馏的方法不同,...

Read More
2025-03-28 talkingdev

Bria AI在NVIDIA GTC 2025大放异彩:构建可预测、可控的视觉生成AI内容

上周,超过2万名与会者齐聚圣何塞市中心参加2025年NVIDIA GTC大会。AI开发者们从Bria.ai了解到如何大规模构建可预测、可控且符合品牌形象的视觉内容,同时尊重艺术家的权利。Bria.ai在大会上展示了几个关键主题:基...

Read More
2025-03-28 talkingdev

[论文推荐]基于扩散模型的反事实图像解释方法研究

最新发表于arXiv的论文提出两种利用扩散模型生成图像回归任务中反事实解释的创新方法。研究团队通过对比像素空间和潜在空间两种技术路径,系统性地揭示了不同方法在解释稀疏性和生成质量之间的权衡关系。该方法突破...

Read More
2025-03-28 talkingdev

[论文推荐]Mixture-of-Mamba:多模态预训练新突破,计算成本显著降低

近期,一项名为Mixture-of-Mamba的创新研究在人工智能领域引起广泛关注。该研究通过将模态感知稀疏性引入状态空间模型(SSMs),实现了高效的多模态预训练。与传统Transformer模型相比,Mixture-of-Mamba在文本、图像...

Read More
2025-03-27 talkingdev

Qwen发布全新多模态模型Qwen Omni 7B,支持文本与语音响应

近日,Qwen发布了一款名为Qwen Omni 7B的多模态模型,该模型能够原生理解多种不同的模态数据,并以文本或语音的形式进行响应。这一技术的推出标志着人工智能在多模态处理领域迈出了重要一步。Qwen Omni 7B不仅能够处...

Read More
2025-03-27 talkingdev

[论文推荐] 模块化RAG框架:为图结构数据优化检索增强生成流程

近日,一项名为RGL的模块化框架在arXiv上发布,专为图结构数据的检索增强生成(RAG)流程提供了全新的解决方案。RGL通过其模块化设计和性能优化,显著提升了传统方法的效率,据称其速度提升了高达143倍。这一突破性...

Read More
  1. Prev Page
  2. 147
  3. 148
  4. 149
  5. Next Page