漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-12 talkingdev

CogCoM开源新视觉语言模型,增强视觉推理能力

CogCoM是一种全新的通用视觉语言模型,它具有独特的操作链机制。这使得它能够通过主动调整输入图像来处理多轮视觉推理。该模型已经在GitHub上发布。

Read More
2024-02-12 talkingdev

本地RAG Cookbook开源

RAG系统是一种广泛应用于数据分析和机器学习中的工具,但是许多人都不知道如何在本地构建和使用它。现在,使用Ollama、pgvector和本地数据,您可以构建一个功能强大的RAG系统,将其部署在您自己的硬件上。这本本地RA...

Read More
2024-02-12 talkingdev

HF开源轻量级评估库 lighteval

HuggingFace发布了一个轻量级的评估库lighteval,用于基于HELM和Eluther AI评估工具的语言模型训练。该评估库专注于提供高效易用的评估方法和指标,帮助用户快速准确地评估模型性能。同时,lighteval还提供了丰富的...

Read More
2024-02-12 talkingdev

FunSearch:利用LLM在数学科学领域的新发现

FunSearch是一种新的AI驱动方法,它将大型语言模型与评估算法相结合,已经在数学科学领域做出了可验证的发现,包括解决了长期存在的cap set问题和更高效的bin-packing问题算法。它引入了演化方法来生成和评估代码,...

Read More
2024-02-12 talkingdev

MetaTree:基于Transformer的决策树算法

近日,一种名为MetaTree的新型决策树算法在GitHub上公开发布。与传统的决策树算法不同,MetaTree采用Transformer模型进行学习,从而提高了泛化能力。根据开发者的介绍,MetaTree在多个数据集上进行了测试,结果表明...

Read More
2024-02-12 talkingdev

利用任务指导提升Agent的游戏玩法

本文探讨了开发一种通用的AI代理的能力,能够理解和遵循游戏玩法指令的步骤,这是迈向“准备好玩”的能力的一步。研究人员通过将多模态游戏指令集成到决策转换器中,增强了代理的多任务和泛化能力。

Read More
2024-02-12 talkingdev

1X机器人演示

1X是一家机器人公司,通过视频输入控制模型取得了进展。该公司展示了其机器人执行许多任务,所有任务都由神经网络驱动,从视频输入发出10hz控制信号。1X机器人演示了通过视频输入和神经网络控制的机器人的潜力,这是...

Read More
2024-02-12 talkingdev

谷歌推出Gemini Advanced和移动应用程序

谷歌推出了一项新服务,允许您最终与Gemini Ultra 1.0交互 - 它将收取月费以提供对该模型的访问。此外,还提供了一个配套的移动应用程序。

Read More
  1. Prev Page
  2. 734
  3. 735
  4. 736
  5. Next Page