漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-15 talkingdev

ViT-CoMer:新神经网络模型增强Vision Transformers的密集预测任务能力

近日,一项名为ViT-CoMer的神经网络模型问世,增强了Vision Transformers(ViT)在密集预测任务中的表现,而无需预训练。这项研究由卡内基梅隆大学的学者领导,他们在GitHub上公开了相关代码和数据集。ViT-CoMer能够...

Read More
2024-03-14 talkingdev

MoAI:整合视觉任务信息的增强型语言模型

MoAI是一种新型的大型语言和视觉模型,它通过整合专门的计算机视觉任务的辅助视觉信息来增强当前模型。该模型在 GitHub 上发布,旨在改善自然语言处理和计算机视觉任务之间的互动。MoAI使用了一种新的训练方法,可以...

Read More
2024-03-07 talkingdev

从零开始培训LLMs的初创公司

一家名为LLMify的初创公司正在推出一种新的方法来训练语言模型,他们将在没有预训练模型的情况下从零开始培训LLMs。该公司的创始人表示,这种方法可以提高模型的准确性和适用性,并加快训练时间。该公司已经引起了一...

Read More
2024-02-28 talkingdev

LazyA一键微调语言模型的Colab Notebook

Axolotl是一款用于Fine-tuning语言模型的强大库。最近,开发者推出了Lazy Axolotl,一款Colab Notebook,它可以帮助用户轻松地进行Fine-tuning操作。Lazy Axolotl提供了丰富的预训练模型和Fine-tuning脚本,用户只需...

Read More
2024-02-22 talkingdev

谷歌推出Gemma—免费的开源AI聊天机器人家族

谷歌推出了一系列新的AI语言模型Gemma,这些模型是基于类似Gemini的技术构建的免费开源模型。Gemma模型可在桌面或笔记本电脑上本地运行,有两个模型,一个有20亿个参数,另一个有70亿个参数。每个模型都有经过预训练...

Read More
2024-02-14 talkingdev

Lag-Llama:基于Transformer的概率时间序列预测基础模型

Lag-Llama是一种基于Transformer的模型,可在零样本和少样本泛化方面表现出色,并在广泛的时间序列数据上进行了预训练。通过对少量数据进行微调,它超越了现有深度学习方法的最新性能,标志着时间序列分析基础模型的...

Read More
2024-02-13 talkingdev

Phidata-构建AI助手工具包开源

Phidata是一个使用函数调用构建AI助手的工具包。它不仅可以帮助开发者更快地构建AI助手,还可以通过模块化设计轻松扩展其功能。Phidata基于Python语言,支持各种功能,包括自然语言处理、语音识别和图像识别。它还提...

Read More
2024-02-13 talkingdev

RLX: 基于MLX的强化学习框架

RLX是一个基于MLX的强化学习框架,旨在为研究人员和工程师提供一个易于使用的平台,以便开发和实现强化学习算法。 RLX提供了一组易于使用的API和工具,可以帮助用户轻松地构建和训练强化学习模型。此外,RLX还提供了...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page