漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-24 talkingdev

[开源] 高效遥感模型:DynamicVis

DynamicVis 是一种用于遥感动态视觉感知的基础模型,能够高效解析超大型图像,同时显著降低内存和计算需求。该模型通过先进的算法优化,使得处理大规模遥感数据变得更为经济和高效,因此在遥感技术领域具有重要的应...

Read More
2025-03-24 talkingdev

[开源] 探索潜在多跳推理:大语言模型的多知识连接能力研究

近期,一项关于大语言模型(LLMs)的研究揭示了其在处理复杂提示时是否具备多跳推理能力——即连接多个知识片段的推理过程。研究发现,这种潜在的推理过程确实存在,尤其在初始步骤中表现明显。然而,模型对连接知识的...

Read More
2025-03-19 talkingdev

[开源] MaTVLM:融合Mamba-2层的混合视觉语言模型

MaTVLM是一个创新的混合视觉语言模型,通过将Mamba-2层集成到预训练的视觉语言模型(VLM)中,显著提升了其收敛速度与整体性能。这一技术突破不仅在学术界引起了广泛关注,也为工业界的应用带来了新的可能性。视觉语...

Read More
2025-03-19 talkingdev

[论文推荐]SmolDocling:极小型高效文档OCR模型

近日,一款名为SmolDocling的新型文档OCR(光学字符识别)模型引发广泛关注。该模型以其极小的规模和高效的性能脱颖而出,成为文档处理领域的最新突破。SmolDocling不仅能够实现闪电般的处理速度,还具备足够的准确...

Read More
2025-03-18 talkingdev

小红书接入DeepSeek大模型,AI搜索产品“点点”推出“深度思考”功能

近日,钛媒体AGI独家获悉,小红书即将接入DeepSeek-R1开源模型,其AI搜索产品“点点”App将推出“深度思考”功能,目前该功能正处于内测体验阶段。这一举措标志着小红书在AI技术应用领域的进一步深化。截至2024年6月,小...

Read More
2025-03-18 talkingdev

[开源] CSM语音模型在MLX上的高效运行

近日,Sesame发布了一款1B规模的对话语音生成模型,并在GitHub上开源了其Apple原生MLX版本。该版本专为在MacBook等苹果设备上高效运行而优化,展示了机器学习在移动设备上的应用潜力。MLX是苹果公司推出的机器学习框...

Read More
2025-03-17 talkingdev

[论文推荐] DiLoCo跨数据中心训练算法的扩展定律

DeepMind近日发布了一篇详细介绍DiLoCo跨数据中心训练算法扩展定律的论文。DiLoCo是一种强大的训练算法,能够在全球范围内同步梯度,确保模型训练的稳定性。该算法通过在多个数据中心之间进行分布式训练,有效提升了...

Read More
2025-03-17 talkingdev

Baseten推出生产级AI推理平台,助力AI初创企业规模化应用

在大规模运行推理任务时,将AI转化为产品的过程中,这既是最大的挑战,也是最关键的一环。Baseten通过结合软件、专业知识和研究成果,推出了一个全面的推理平台,为生产级AI原生产品提供所需的一切支持。该平台涵盖...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page