漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-25 talkingdev

[论文推荐] LLaVA-MORE:多模态大语言模型的系统性评估框架

LLaVA-MORE 是一项关于多模态大语言模型(Multimodal Large Language Models, MLLMs)的系统性研究,旨在评估不同语言模型和视觉骨干网络在 MLLMs 中的表现,并提供一个可复现的框架来比较这些架构。通过该研究,研...

Read More
2025-03-25 talkingdev

[论文推荐] UniHDSA:统一关系预测方法助力分层文档结构分析

近日,一篇发表在arXiv上的论文介绍了一种名为UniHDSA的统一关系预测方法,用于分层文档结构分析。该方法的核心创新在于通过一个单一模块同时处理多项任务,显著提高了文档结构分析的效率和准确性。UniHDSA技术的应...

Read More
2025-03-25 talkingdev

[论文推荐]TRG-Net:基于文本关系图的骨架动作分割技术

近日,一项名为TRG-Net的创新技术在动作分割领域取得了突破性进展。该技术通过利用文本衍生的关系图(Text-Derived Relational Graphs)来增强动作分割的精度,特别是在空间-时间建模和监督方面表现出色。动作分割是...

Read More
2025-03-25 talkingdev

Reve图像生成器以低价挑战MidJourney和Flux,每张仅需1美分

Reve Image 1.0 是一款AI图像生成器,其定价策略和生成质量在市场上具有显著竞争力,甚至可能超越Midjourney和Ideogram等行业巨头。该工具以5美元提供500次生成额度,每张图像的成本仅为1美分,使得高质量图像生成变...

Read More
2025-03-25 talkingdev

Roblox开源Cube 3D AI模型,文本生成3D对象助力创作效率提升

Roblox近日开源了其最新的AI模型Cube 3D,该模型能够通过文本提示生成3D对象,旨在提升创作效率。Cube 3D采用了先进的标记化技术,并通过授权和公开可用的数据集,以及Roblox自身的体验数据进行训练。未来,Cube 3D...

Read More
2025-03-20 talkingdev

[论文推荐]AI完成长任务能力的“摩尔定律”:任务时长每7个月翻倍

近期,一项关于智能体任务时长能力的研究揭示了一个新的“摩尔定律”现象:智能体能够完成的任务长度每7个月翻倍。这一发现意味着,在未来的两年内,智能体将能够完成包含多个复杂步骤、时长达到数小时的任务。这一进...

Read More
2025-03-20 talkingdev

[论文推荐] KoLMogorov 测试:通过代码生成实现压缩

Meta 最近引入了一种新的基准测试,用于评估语言模型的推理能力和知识水平。该测试向语言模型提供一个长序列数据,并要求模型输出能够重新生成该序列并停止运行的最短程序。这一过程被称为 Kolmogorov 压缩,且在多...

Read More
2025-03-20 talkingdev

微软推出KBLAM:为LLM引入即插即用的外部知识

微软研究院最近推出了一项名为KBLAM的创新技术,旨在为大型语言模型(LLMs)引入即插即用的外部知识。这项技术的主要亮点在于,它无需重新训练模型即可实现知识的无缝集成,从而支持在线和实时学习。KBLAM的核心优势...

Read More
  1. Prev Page
  2. 122
  3. 123
  4. 124
  5. Next Page