漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-23 talkingdev

HuggingFace发布视觉/语言模型IDEFICS:复制并优化Flamingo模型

人工智能公司HuggingFace近日发布了IDEFICS,这个名字是一个复杂的缩写,全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本,Flamingo...

Read More
2023-08-22 talkingdev

FlexFlow,开源的LLM部署框架

Flex flow LLM部署框架是一款强大的软件,专门设计来支持语言模型在生产系统中的部署。它能够提供高效、灵活的解决方案,以满足各种复杂环境下的部署需求。此外,它还具有出色的兼容性和扩展性,可以与各种主流的语...

Read More
2023-08-21 talkingdev

你可能不需要微调大型语言模型

对于大多数大型语言模型(LLM)应用,微调并非必要。使用少量提示或检索增强生成(RAG)可能是更好的选择。少量提示是指向LLM提供期望输出的示例,而RAG则涉及查询向量数据库,获取LLM未经训练的信息。这意味着,我...

Read More
2023-08-21 talkingdev

开源txtai工具:集成语义搜索、LLM编排和工作流

GitHub近期发布了一款名为txtai的全新工具,这是一款集成语义搜索、LLM编排和语言模型工作流的全能型嵌入式数据库。这款工具能够将多种功能与应用集成在一起,为开发者提供了一个全新的、一体化的解决方案。通过txta...

Read More
2023-08-18 talkingdev

WizardLM,利用强化进化指令教大型语言模型进行推理

近期,WizardLM团队的研究进展备受关注。他们最新的论文探讨了用于指令调整的数据策划问题。WizardLM在强化学习部分做出了突破性的提升,成功超越了许多封闭源模型在数学和推理任务上的表现。他们的研究成果可能会对...

Read More
2023-08-17 talkingdev

强化学习:微型故事模型的对齐工具

强化学习可能是当前对齐大型语言模型(甚至视觉模型)最好的工具。然而,当你需要大量的人类数据来训练一个奖励模型时,这就成为了一项挑战。如果你可以只使用“提示”呢?这是RLCF(强化学习计算框架)趋势的又一绝佳...

Read More
2023-08-17 talkingdev

LLM研究中的十大挑战

出色的研究员Chip Huyen提出了LLM(语言模型)研究中的十大开放性挑战。首先,幻觉和上下文长度问题在当前讨论中频繁出现。然而,最有趣的可能是多模态、架构改进,以及对GPU的替代方案。目前,有许多聪明的研究人员...

Read More
2023-08-16 talkingdev

ChatGPT能成为内容审核员吗?

OpenAI,ChatGPT的创造者,一直在使用其最先进的大型语言模型来执行公司的内容政策。对于诸如令人不安的内容、欺诈以及滥用等问题,OpenAI正在使用ChatGPT来进行自动化处理。然而,该技术仍有其局限性。在某些情况下...

Read More
  1. Prev Page
  2. 147
  3. 148
  4. 149
  5. Next Page