基础模型的相关内容 - 漫话开发者

2025-02-27 talkingdev

Magma：多模态AI agent的基础模型在Hugging Face Hub发布

近日，Hugging Face Hub发布了一款名为Magma的新型基础模型，专为视觉agent任务设计，尤其在视频理解和UI导航方面表现出色。Magma模型以其易于调优的特性，为开发者提供了强大的工具，以应对复杂的多模态AI任务。该...

2025-01-28 talkingdev

本文综述了基础模型的参数高效微调技术，深入探讨了在保持多样化任务性能的同时，如何最小化计算成本的方法。随着基础模型（如LLM）的广泛应用，参数高效微调技术（如LoRA、RAG等）成为研究热点。这些技术通过减少需...

2025-01-22 talkingdev

近日，GitHub上发布了一款名为SurgeNet的创新性手术基础模型，该模型在外科计算机视觉领域树立了新的标杆。SurgeNet通过先进的深度学习技术，能够高效处理复杂的手术场景数据，为外科医生提供更精准的视觉辅助。该模...

2025-01-22 talkingdev

近日，Hugging Face Hub发布了全新的Dolphin 3.0模型，该模型基于Llama 3.1 8B架构开发，专注于通过系统提示接受指令。Dolphin 3.0在保持Llama基础模型强大性能的同时，展现了在多角色扮演和个性化任务中的卓越表现...

2025-01-22 talkingdev

NVIDIA近日发布了一项创新技术FoundationStereo，该技术将基础模型与立体匹配技术相结合，旨在提升机器人和自动驾驶车辆的3D感知能力。通过这一技术，设备能够更精确地理解和处理三维环境中的信息，从而提高导航和操...

2024-09-19 talkingdev

Moshi 是一款专注于实时对话的语音文本基础模型，旨在提升人机交互的流畅性和自然性。该模型结合了先进的 LLM 技术和高效的文本处理能力，能够在多种应用场景中实现即时的语音转文本功能。Moshi 的独特之处在于其低...

2024-09-19 talkingdev

Qwen2.5 是一款全新的基础模型，旨在推动人工智能技术的快速发展。该模型在多种任务中展现出卓越的性能，尤其是在自然语言处理和机器学习领域。Qwen2.5 采用了先进的 LLM 技术，并结合了多种嵌入技术、LoRA 和 RAG...

2024-07-15 talkingdev

ViTime是一种用于时间序列预测的基础模型，它利用的是视觉智能而非传统的数值数据拟合。与传统的时间序列预测模型不同，ViTime通过视觉智能来捕捉数据的模式和趋势，从而提供更准确的预测。这种新颖的方法为时间序列...