漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-01-28 talkingdev

论文:基础模型参数高效微调技术综述

本文综述了基础模型的参数高效微调技术,深入探讨了在保持多样化任务性能的同时,如何最小化计算成本的方法。随着基础模型(如LLM)的广泛应用,参数高效微调技术(如LoRA、RAG等)成为研究热点。这些技术通过减少需...

Read More
2025-01-22 talkingdev

SurgeNet:开创性手术基础模型引领外科计算机视觉新标杆

近日,GitHub上发布了一款名为SurgeNet的创新性手术基础模型,该模型在外科计算机视觉领域树立了新的标杆。SurgeNet通过先进的深度学习技术,能够高效处理复杂的手术场景数据,为外科医生提供更精准的视觉辅助。该模...

Read More
2025-01-22 talkingdev

Dolphin 3.0发布:基于Llama 3.1 8B的指令驱动模型

近日,Hugging Face Hub发布了全新的Dolphin 3.0模型,该模型基于Llama 3.1 8B架构开发,专注于通过系统提示接受指令。Dolphin 3.0在保持Llama基础模型强大性能的同时,展现了在多角色扮演和个性化任务中的卓越表现...

Read More
2025-01-22 talkingdev

NVIDIA推出FoundationStereo技术,革新3D感知能力

NVIDIA近日发布了一项创新技术FoundationStereo,该技术将基础模型与立体匹配技术相结合,旨在提升机器人和自动驾驶车辆的3D感知能力。通过这一技术,设备能够更精确地理解和处理三维环境中的信息,从而提高导航和操...

Read More
2024-09-18 talkingdev

Moshi:开源实时对话的语音文本基础模型

Moshi 是一款专注于实时对话的语音文本基础模型,旨在提升人机交互的流畅性和自然性。该模型结合了先进的 LLM 技术和高效的文本处理能力,能够在多种应用场景中实现即时的语音转文本功能。Moshi 的独特之处在于其低...

Read More
2024-09-18 talkingdev

Qwen2.5:基础模型的盛宴

Qwen2.5 是一款全新的基础模型,旨在推动人工智能技术的快速发展。该模型在多种任务中展现出卓越的性能,尤其是在自然语言处理和机器学习领域。Qwen2.5 采用了先进的 LLM 技术,并结合了多种嵌入技术、LoRA 和 RAG...

Read More
2024-07-15 talkingdev

ViTime:利用视觉智能进行时间序列预测的开源模型

ViTime是一种用于时间序列预测的基础模型,它利用的是视觉智能而非传统的数值数据拟合。与传统的时间序列预测模型不同,ViTime通过视觉智能来捕捉数据的模式和趋势,从而提供更准确的预测。这种新颖的方法为时间序列...

Read More
2024-07-09 talkingdev

SenseVoice开源:具有多重语音情感理解能力的基础模型

近日,GitHub发布了一款名为SenseVoice的语音基础模型。这款模型拥有多重语音理解能力,包括自动语音识别、口语语言识别、语音情感识别以及音频事件检测。自动语音识别技术可以实现对人类语音的智能理解;口语语言识...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page