漫话开发者 - UWL.ME

2024-02-12 talkingdev

CogCoM开源新视觉语言模型，增强视觉推理能力

CogCoM是一种全新的通用视觉语言模型，它具有独特的操作链机制。这使得它能够通过主动调整输入图像来处理多轮视觉推理。该模型已经在GitHub上发布。

2024-02-12 talkingdev

RAG系统是一种广泛应用于数据分析和机器学习中的工具，但是许多人都不知道如何在本地构建和使用它。现在，使用Ollama、pgvector和本地数据，您可以构建一个功能强大的RAG系统，将其部署在您自己的硬件上。这本本地RA...

2024-02-12 talkingdev

HuggingFace发布了一个轻量级的评估库lighteval，用于基于HELM和Eluther AI评估工具的语言模型训练。该评估库专注于提供高效易用的评估方法和指标，帮助用户快速准确地评估模型性能。同时，lighteval还提供了丰富的...

2024-02-12 talkingdev

FunSearch是一种新的AI驱动方法，它将大型语言模型与评估算法相结合，已经在数学科学领域做出了可验证的发现，包括解决了长期存在的cap set问题和更高效的bin-packing问题算法。它引入了演化方法来生成和评估代码，...

2024-02-12 talkingdev

近日，一种名为MetaTree的新型决策树算法在GitHub上公开发布。与传统的决策树算法不同，MetaTree采用Transformer模型进行学习，从而提高了泛化能力。根据开发者的介绍，MetaTree在多个数据集上进行了测试，结果表明...

2024-02-12 talkingdev

本文探讨了开发一种通用的AI代理的能力，能够理解和遵循游戏玩法指令的步骤，这是迈向“准备好玩”的能力的一步。研究人员通过将多模态游戏指令集成到决策转换器中，增强了代理的多任务和泛化能力。

2024-02-12 talkingdev

1X是一家机器人公司，通过视频输入控制模型取得了进展。该公司展示了其机器人执行许多任务，所有任务都由神经网络驱动，从视频输入发出10hz控制信号。1X机器人演示了通过视频输入和神经网络控制的机器人的潜力，这是...

2024-02-12 talkingdev

谷歌推出了一项新服务，允许您最终与Gemini Ultra 1.0交互 - 它将收取月费以提供对该模型的访问。此外，还提供了一个配套的移动应用程序。