漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-25 talkingdev

人类反馈改善语言模型:DPO在Llama 2的应用

人类反馈在改善语言模型对齐和整体性能方面扮演着关键角色。然而,使用近端策略优化进行训练的过程中存在一些挑战。最近的研究表明,可以直接针对人类偏好进行优化,从而绕过奖励模型。借助基于文本的强化学习,你可...

Read More
2023-08-25 talkingdev

论文:LiDAR点追踪3D物体的新方法

大多数计算机视觉工具在使用LiDAR点追踪3D物体时,由于干扰或未注意到长期运动,常常遇到困难。为了解决这些问题,MTM-Tracker混合使用了两种方法,并分为两个阶段进行工作。在第一阶段,MTM-Tracker使用基于模型的...

Read More
2023-08-25 talkingdev

法律推理基准:测量语言模型在法律框架中的推理能力

在一个大规模的合作努力下,我们构建了一个基准,用于度量语言模型在法律框架中的推理能力。这项工作的关键在于,我们需要警惕已经训练过的模型中的污染。语言模型在训练过程中可能会被各种各样的数据源影响,这些数...

Read More
2023-08-25 talkingdev

cheetah:开源的多模态语言模型,用于处理视觉-语言任务

近期的模型常常在处理复杂的视觉-语言任务上遇到困难,这主要是由于它们在理解混合的图像-文本上下文时存在限制。为了评估这些任务,研究人员引入了I4基准。结果显示,视觉提示生成器的注意力存在缺陷。为了解决这个...

Read More
2023-08-25 talkingdev

Prompt2Model:使用简单指令创建更智能、更小型的模型

Prompt2Model为您提供了一种全新的方式,无需使用庞大且资源消耗重的AI模型,只需用简单的语言描述您想要的功能,Prompt2Model就能为该任务创建一个更小、更高效的AI模型。值得一提的是,它能创建出的模型甚至有可能...

Read More
2023-08-25 talkingdev

图灵深度训练的新突破:Unit Scaling低精度训练方案

英国的AI硬件公司Graphcore近日发布了一款优秀的Pytorch库,使得在fp8中进行训练变得异常简单且稳定。这只需要一个模型封装器和torch编译器。Graphcore以其创新的机器智能处理器(IPU)而闻名,现在他们在深度学习训...

Read More
2023-08-25 talkingdev

Meta发布自己的AI代码编写工具:Code Llama

Meta发布了Code Llama,这是一个建立在Llama 2之上的大型语言模型,专门用于生成和调试代码。它还发布了一个针对Python的特定版本,以及另一个可以理解自然语言指令的版本。这些模型不能互换使用。Meta声称Code Llam...

Read More
2023-08-24 talkingdev

Llama.cpp,新的GGML格式可支持更多模型

Llama.cpp是一个运行本地语言模型的简便方式。然而,它目前受到底层GGML格式的限制。为了解决这个问题,我们提出了一个新的格式,并开始进行集成。新的GGML格式将更加灵活,可以支持更多的模型,这将有助于推动机器...

Read More
  1. Prev Page
  2. 376
  3. 377
  4. 378
  5. Next Page