"深度学习"的相关内容 - 漫话开发者

2023-11-17 talkingdev

阿里云发布Qwen Audio通用音频转语言模型

阿里云近日发布了Qwen Audio模型，该模型是一款通用的音频转语言模型，能够用于音乐、语音等多种任务。该模型基于深度学习技术，经过大量数据训练，能够准确地识别语音，并将其转化为对应的语言文字，为用户提供更加...

2023-11-15 talkingdev

在深度学习领域中，视觉语言模型（VLM）越来越受到重视。由于Embedding as a Service Vision-Language Pre-Trained Models（VLPM）中的预训练模型包含了大量的视觉和语言信息，因此这种模型很容易成为恶意攻击的目标...

2023-11-07 talkingdev

最近，一项名为HelixNet的新研究显示，如果微调Mistral基础架构的三个任务特定模型，一个用于生成，一个用于批判，最后一个用于再生，则整个系统的生成性能显着提高。该研究使用合成数据来调整这些模型。HelixNet的...

2023-11-02 talkingdev

Mistral是一种基于深度学习的自然语言处理模型，其7B模型是目前最大的公开模型之一。现在，您可以使用Jupyter笔记本，根据自己的数据集对Mistral的7B模型进行微调，并仅需1美元的计算费用。微调Mistral模型可以提高...

2023-10-27 talkingdev

研究介绍了RGM（Robust Generalist Matching）,这是一种专为图像中的稀疏和密集像素匹配而设计的深度学习模型。该方法利用了一种独特的级联GRU模块和一个新的大规模数据集。该模型可以应用于多种场景，具有广泛的适...

2023-10-27 talkingdev

近日，一项名为‘Real-Time Depth Estimation for Underwater Vehicles’的研究成果在GitHub上发布。该研究提出了一种针对水下车辆的模型，可以通过结合稀疏深度细节从单个图像中实时估计深度。该模型是通过深度学习框...

2023-10-26 talkingdev

该项目介绍了RLMRec，一个将LLMs与推荐系统相结合的框架，捕捉用户行为和偏好的更深层含义，提高推荐的质量。

2023-10-20 talkingdev

XAgent是一个开源的实验性LLM驱动的自主代理工具，可以自动解决各种任务。该工具利用深度学习算法，训练出一个自主学习的模型，可以在不同的环境中自动适应并完成任务。XAgent提供了丰富的API接口，可以与其他工具无...