规模的相关内容 - 漫话开发者

2025-03-24 talkingdev

[开源] 高效遥感模型：DynamicVis

DynamicVis 是一种用于遥感动态视觉感知的基础模型，能够高效解析超大型图像，同时显著降低内存和计算需求。该模型通过先进的算法优化，使得处理大规模遥感数据变得更为经济和高效，因此在遥感技术领域具有重要的应...

2025-03-24 talkingdev

近期，一项关于大语言模型（LLMs）的研究揭示了其在处理复杂提示时是否具备多跳推理能力——即连接多个知识片段的推理过程。研究发现，这种潜在的推理过程确实存在，尤其在初始步骤中表现明显。然而，模型对连接知识的...

2025-03-19 talkingdev

MaTVLM是一个创新的混合视觉语言模型，通过将Mamba-2层集成到预训练的视觉语言模型（VLM）中，显著提升了其收敛速度与整体性能。这一技术突破不仅在学术界引起了广泛关注，也为工业界的应用带来了新的可能性。视觉语...

2025-03-19 talkingdev

近日，一款名为SmolDocling的新型文档OCR（光学字符识别）模型引发广泛关注。该模型以其极小的规模和高效的性能脱颖而出，成为文档处理领域的最新突破。SmolDocling不仅能够实现闪电般的处理速度，还具备足够的准确...

2025-03-18 talkingdev

近日，钛媒体AGI独家获悉，小红书即将接入DeepSeek-R1开源模型，其AI搜索产品“点点”App将推出“深度思考”功能，目前该功能正处于内测体验阶段。这一举措标志着小红书在AI技术应用领域的进一步深化。截至2024年6月，小...

2025-03-18 talkingdev

近日，Sesame发布了一款1B规模的对话语音生成模型，并在GitHub上开源了其Apple原生MLX版本。该版本专为在MacBook等苹果设备上高效运行而优化，展示了机器学习在移动设备上的应用潜力。MLX是苹果公司推出的机器学习框...

2025-03-17 talkingdev

DeepMind近日发布了一篇详细介绍DiLoCo跨数据中心训练算法扩展定律的论文。DiLoCo是一种强大的训练算法，能够在全球范围内同步梯度，确保模型训练的稳定性。该算法通过在多个数据中心之间进行分布式训练，有效提升了...

2025-03-17 talkingdev

在大规模运行推理任务时，将AI转化为产品的过程中，这既是最大的挑战，也是最关键的一环。Baseten通过结合软件、专业知识和研究成果，推出了一个全面的推理平台，为生产级AI原生产品提供所需的一切支持。该平台涵盖...