漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-28 talkingdev

Llava-RLHF视觉对齐模型的全新技术突破

Llava是一种将视觉能力插入语言模型的方法。现在,它已经通过指令调整,并运行了RLHF(强化学习和直觉推理)过程。Llava大大提高了指令遵循和推理能力。这种新方法将人工智能技术推向了一个新的高度,使得计算机不仅...

Read More
2023-09-28 talkingdev

RL在扩散模型上的应用库

利用RL调整语言模型正逐渐成为模型部署流程中的标准步骤。现在,这将通过扩散模型以及DRLX的发布变得更加容易,DRLX允许用户指定奖励模型或使用预定义的模型。扩散模型通过简化了RL在语言模型调整中的实现,为AI技术...

Read More
2023-09-27 talkingdev

LAION推出OpenLM:中等规模模型的新选择

OpenLM是一个专为训练最多可达70亿参数的中等规模语言模型设计的库和框架。它的设计理念是注重GPU速度和可修改性。作为收敛性验证,已经有在1.25T标记上训练的模型可供使用。这种新型的框架和库能够更好地满足中等规...

Read More
2023-09-26 talkingdev

2027年语言模型用户体验展望

本文探讨了在中期未来,由大型语言模型驱动的软件可能会是什么样子。语言模型将会显著改变我们与计算机的交互方式。当前的技术状态看似初级,但越来越明显的是,生成型人工智能无法完全替代过去几十年里出现的其他用...

Read More
2023-09-26 talkingdev

深度评估:DeepEval帮助您安心部署LLM流水线

DeepEval是一个提供Pythonic方式进行离线评估的工具,专为LLM(语言模型)流水线设计。使用DeepEval,开发者能够在部署到生产环境之前,对其LLM流水线进行深度和全面的评估。这大大降低了生产环境中出现错误的风险,...

Read More
2023-09-25 talkingdev

一项新的研究结果对语言模型的理解产生了挑战

语言模型在训练过程中,通常会遇到一种情况,即当模型训练的内容是“A是B”时,它并不能自动推断出“B是A”。这一发现对当前的语言模型(LLMs)提出了挑战和质疑,因为我们通常会期待模型能够自动推断出这样的逻辑关系。...

Read More
2023-09-22 talkingdev

自动化知识图谱:一项只需50行代码的自然语言理解神器

从非结构化文本中生成知识图谱曾被视为自然语言理解的终极目标,现在,你只需50行代码和一个LLM便可实现。知识图谱是一种复杂的数据结构,可以以图形的形式表现出各种实体之间的关系。这样的结构有助于机器更好地理...

Read More
2023-09-21 talkingdev

论文:让大型语言模型在医学上发挥更大作用

这项研究的重点是使已经擅长理解和生成文本的大型语言模型,在回答医学问题方面表现得更好。大型语言模型(LLMs)已经在很多领域包括医学领域显示出了巨大的潜力,然而,尽管如此,它们在理解和回答具体的医学问题方...

Read More
  1. Prev Page
  2. 104
  3. 105
  4. 106
  5. Next Page