漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-25 talkingdev

[开源] Baichuan Omni 1.5:开源全模态基础模型支持多模态输入输出

Baichuan Omni 1.5 是一款支持文本、图像、视频和音频输入以及文本和音频输出的开源全模态基础模型。该模型采用任意到任意(any-to-any)的设计风格,属于原生多模态模型的一种典型代表。其核心技术在于使用了交错的...

Read More
2025-03-25 talkingdev

[开源] Awesome MRI Reconstruction:深度学习在MRI重建中的前沿应用

随着深度学习技术的迅猛发展,其在医学影像处理领域的应用也日益广泛。最近,一个名为“Awesome MRI Reconstruction”的开源项目在GitHub上引起了广泛关注。该项目精心收集了大量关于深度学习在磁共振成像(MRI)重建...

Read More
2025-03-25 talkingdev

[论文推荐] LLaVA-MORE:多模态大语言模型的系统性评估框架

LLaVA-MORE 是一项关于多模态大语言模型(Multimodal Large Language Models, MLLMs)的系统性研究,旨在评估不同语言模型和视觉骨干网络在 MLLMs 中的表现,并提供一个可复现的框架来比较这些架构。通过该研究,研...

Read More
2025-03-24 talkingdev

[开源] 高效遥感模型:DynamicVis

DynamicVis 是一种用于遥感动态视觉感知的基础模型,能够高效解析超大型图像,同时显著降低内存和计算需求。该模型通过先进的算法优化,使得处理大规模遥感数据变得更为经济和高效,因此在遥感技术领域具有重要的应...

Read More
2025-03-24 talkingdev

[开源] 探索潜在多跳推理:大语言模型的多知识连接能力研究

近期,一项关于大语言模型(LLMs)的研究揭示了其在处理复杂提示时是否具备多跳推理能力——即连接多个知识片段的推理过程。研究发现,这种潜在的推理过程确实存在,尤其在初始步骤中表现明显。然而,模型对连接知识的...

Read More
2025-03-24 talkingdev

[开源]Tokenize an Image as a Set:基于集合标记化的图像生成新框架

近日,GitHub上发布了一个名为“Tokenize an Image as a Set”的开源项目,该项目提出了一种全新的图像生成框架。该框架通过集合标记化(set-based tokenization)和新型离散扩散方法(discrete diffusion method),...

Read More
2025-03-24 talkingdev

[开源]LHM模型:单张图像秒速生成可动画的3D人体模型

近日,GitHub上发布了一个名为LHM(Large Animatable Human Reconstruction Model)的开源项目,该项目展示了如何通过单张图像快速生成一个完全可动画的3D人体模型。这一技术突破不仅展示了计算机视觉领域的重大进展...

Read More
2025-03-24 talkingdev

Hugging Face 实时终端分析功能全新升级

Hugging Face近期对其分析仪表盘进行了重大升级,新增了实时更新的AI推理终端监控功能。这一改进不仅显著加快了数据加载速度,还提供了关于请求延迟、错误率和性能指标的即时洞察。此次升级将使开发者能够更高效地监...

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20
  5. Next Page