漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-15 talkingdev

OpenGPTs:自定义的语言模型、工具和检索算法

OpenGPTs是一个开源项目,构建在LangChain、LangServe和LangSmith之上,提供可定制的语言模型、提示、工具、向量数据库、检索算法和聊天历史数据库。它具有沙盒环境、自定义操作和分析功能,类似于OpenAI的GPTs。Ope...

Read More
2023-11-14 talkingdev

基于RWKV可在本地运行的AI小镇开源

AI 小镇是一个令人惊叹的实验,在这里,数百个代理在语言模型的提示状态下过着日常生活。 RWKV 模型是一种线性语言模型,需要比标准 Transformer 更少的资源。此存储库使用这个更便宜的模型在您的本地计算机上运行 A...

Read More
2023-11-14 talkingdev

LLaVa Plus模型用于语言和视觉技能学习

LLaVa模型是一个开源模型,结合了语言和视觉。这个新版本允许使用图像编辑、生成等工具来进行指导,调整模型。LLaVa Plus模型提供了更高的精度和更好的性能。

Read More
2023-11-14 talkingdev

HuggingFace发布对齐手册:Zephyr语言模型实现个性化训练

随着最近发布的优秀Zephyr语言模型,HuggingFace团队展示了如何在少数强大的预训练开源模型基础上训练个性化模型。HuggingFace对齐手册提供了一系列对齐技术的详细解释,并介绍了如何在不同任务上使用预训练模型。此...

Read More
2023-11-14 talkingdev

Tarsier开源,基于视觉交互的Web Agent

随着强大的新视觉模型的出现,许多团队正在尝试构建使用视觉与Web元素交互的代理程序。Tarsier工具包介绍了一套标准工具(例如元素标记),您可以使用任何视觉系统来理解网页并执行操作。它还包括用于非视觉语言模型...

Read More
2023-11-14 talkingdev

开源的音频超分辨率技术

音频超分辨率是提高任何音频的质量和保真度的过程,无论是真实的还是合成的。大多数超分辨率系统都是针对特定任务而设计的,单个模型仅针对单个音频数据类型进行训练(如语音与音乐)。这项新工作是一个惊人的进步,...

Read More
2023-11-14 talkingdev

新注意力机制DG-SCT提升多模态任务音视频模型

近日,研究人员开源了一个名为Dual-Guided Spatial-Channel-Temporal(DG-SCT)的新型注意力机制,可用于增强预先训练的音频-视频模型,以用于多模态任务。该机制具有两个分支,一个是空间通道分支,另一个是时间分...

Read More
2023-11-14 talkingdev

开源GPTs:GitHub仓库OpenGPTs发布

OpenGPTs是一项旨在创建类似于OpenAI's GPTs的技术的仓库。它允许开发人员配置超过60个LLMs,提示,超过100个工具,向量数据库,检索算法和聊天历史数据库。该项目使用LangChain,LangServe和LangSmith。OpenGPTs的...

Read More
  1. Prev Page
  2. 243
  3. 244
  4. 245
  5. Next Page