漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-25 talkingdev

cheetah:开源的多模态语言模型,用于处理视觉-语言任务

近期的模型常常在处理复杂的视觉-语言任务上遇到困难,这主要是由于它们在理解混合的图像-文本上下文时存在限制。为了评估这些任务,研究人员引入了I4基准。结果显示,视觉提示生成器的注意力存在缺陷。为了解决这个...

Read More
2023-08-25 talkingdev

Meta发布自己的AI代码编写工具:Code Llama

Meta发布了Code Llama,这是一个建立在Llama 2之上的大型语言模型,专门用于生成和调试代码。它还发布了一个针对Python的特定版本,以及另一个可以理解自然语言指令的版本。这些模型不能互换使用。Meta声称Code Llam...

Read More
2023-08-24 talkingdev

Llama.cpp,新的GGML格式可支持更多模型

Llama.cpp是一个运行本地语言模型的简便方式。然而,它目前受到底层GGML格式的限制。为了解决这个问题,我们提出了一个新的格式,并开始进行集成。新的GGML格式将更加灵活,可以支持更多的模型,这将有助于推动机器...

Read More
2023-08-23 talkingdev

HuggingFace发布视觉/语言模型IDEFICS:复制并优化Flamingo模型

人工智能公司HuggingFace近日发布了IDEFICS,这个名字是一个复杂的缩写,全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本,Flamingo...

Read More
2023-08-22 talkingdev

FlexFlow,开源的LLM部署框架

Flex flow LLM部署框架是一款强大的软件,专门设计来支持语言模型在生产系统中的部署。它能够提供高效、灵活的解决方案,以满足各种复杂环境下的部署需求。此外,它还具有出色的兼容性和扩展性,可以与各种主流的语...

Read More
2023-08-21 talkingdev

你可能不需要微调大型语言模型

对于大多数大型语言模型(LLM)应用,微调并非必要。使用少量提示或检索增强生成(RAG)可能是更好的选择。少量提示是指向LLM提供期望输出的示例,而RAG则涉及查询向量数据库,获取LLM未经训练的信息。这意味着,我...

Read More
2023-08-21 talkingdev

开源txtai工具:集成语义搜索、LLM编排和工作流

GitHub近期发布了一款名为txtai的全新工具,这是一款集成语义搜索、LLM编排和语言模型工作流的全能型嵌入式数据库。这款工具能够将多种功能与应用集成在一起,为开发者提供了一个全新的、一体化的解决方案。通过txta...

Read More
2023-08-18 talkingdev

WizardLM,利用强化进化指令教大型语言模型进行推理

近期,WizardLM团队的研究进展备受关注。他们最新的论文探讨了用于指令调整的数据策划问题。WizardLM在强化学习部分做出了突破性的提升,成功超越了许多封闭源模型在数学和推理任务上的表现。他们的研究成果可能会对...

Read More
  1. Prev Page
  2. 140
  3. 141
  4. 142
  5. Next Page