漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-31 talkingdev

优化后的Llama 2,上下文长度达到32k

最近获得2000万美元投资的together公司,已经对Llama 2进行了微调,通过在位置嵌入上进行线性扩展,使其在处理上下文时可以处理高达32k的token。他们在许多有趣的基准测试中进行了测试,但是他们警告说,现代语言模...

Read More
2023-07-27 talkingdev

GPT-4的性能是否随着时间的推移而下降?

最近一篇文献提出,GPT-4的性能降级问题已引起争议,人们将其性能下降归因于微调引起的行为改变,而非能力的丧失。这项研究强调了由于这些微调差异而导致量化评估语言模型的挑战性。虽然有研究暗示GPT-4性能出现退化...

Read More
2023-07-27 talkingdev

AI文本错误检测新工具:FacTool(GitHub Repo)

近日,新的框架FacTool在GitHub上开源,该框架专门设计用于检测大型语言模型生成的文本中的事实错误,无论任务或领域如何。这是一次重大突破,因为AI生成的文本往往包含事实上的错误或误导,这可能导致信息误解和混...

Read More
2023-07-26 talkingdev

Scale AI定制开源大型语言模型产品

Scale的LLM引擎包允许用户微调开源大型语言模型,以提高在特定领域用例上的性能。用户可以微调的模型之一是Llama 2,这是与Meta合作的结果。这种开源大型语言模型的优化,使其在特定领域用例上的性能得到提升,为行...

Read More
2023-07-26 talkingdev

大型语言模型的相关知识

这篇关于大型语言模型的入门文章反思了目前对LLM(Large Language Models)的具体了解。它解释了人工智能技术的某些发展如何引发了当前的人工智能热潮。这篇入门文章旨在帮助客观评估当前的研究努力以及它们可能带来...

Read More
2023-07-26 talkingdev

高通联手Meta,旨在将语言模型引入手机

高通作为移动处理器制造商,正准备将其旗舰人工智能Llama 2模型引入到智能手机中。这一举措旨在优化手机的语言处理能力,使其在没有网络连接的情况下仍能执行复杂的语言任务。高通和Meta的这次合作,预计将为移动端...

Read More
2023-07-24 talkingdev

StabilityAI发布指令调整语言模型

稳定性公司近日发布了一套经过指令调整的语言模型,专为研究用途而设计。这套模型采用了先进的人工智能技术,通过对大量数据进行深度学习,实现了在各种场景下的高效语言处理和理解。这将有助于推动人工智能领域的发...

Read More
2023-07-24 talkingdev

最新论文:将语言模型与规划系统相结合

近年来,语言被认为是规划的强大基础。通过将强大的语言模型与需要规划的系统相结合,可以提高这些系统的性能。在一种具有挑战性的稀疏奖励环境中,这一想法得到了验证。与基线相比,所提出的方法在数据效用、适应性...

Read More
  1. Prev Page
  2. 115
  3. 116
  4. 117
  5. Next Page