最近获得2000万美元投资的together公司,已经对Llama 2进行了微调,通过在位置嵌入上进行线性扩展,使其在处理上下文时可以处理高达32k的token。他们在许多有趣的基准测试中进行了测试,但是他们警告说,现代语言模...
Read More最近一篇文献提出,GPT-4的性能降级问题已引起争议,人们将其性能下降归因于微调引起的行为改变,而非能力的丧失。这项研究强调了由于这些微调差异而导致量化评估语言模型的挑战性。虽然有研究暗示GPT-4性能出现退化...
Read More近日,新的框架FacTool在GitHub上开源,该框架专门设计用于检测大型语言模型生成的文本中的事实错误,无论任务或领域如何。这是一次重大突破,因为AI生成的文本往往包含事实上的错误或误导,这可能导致信息误解和混...
Read MoreScale的LLM引擎包允许用户微调开源大型语言模型,以提高在特定领域用例上的性能。用户可以微调的模型之一是Llama 2,这是与Meta合作的结果。这种开源大型语言模型的优化,使其在特定领域用例上的性能得到提升,为行...
Read More这篇关于大型语言模型的入门文章反思了目前对LLM(Large Language Models)的具体了解。它解释了人工智能技术的某些发展如何引发了当前的人工智能热潮。这篇入门文章旨在帮助客观评估当前的研究努力以及它们可能带来...
Read More高通作为移动处理器制造商,正准备将其旗舰人工智能Llama 2模型引入到智能手机中。这一举措旨在优化手机的语言处理能力,使其在没有网络连接的情况下仍能执行复杂的语言任务。高通和Meta的这次合作,预计将为移动端...
Read More稳定性公司近日发布了一套经过指令调整的语言模型,专为研究用途而设计。这套模型采用了先进的人工智能技术,通过对大量数据进行深度学习,实现了在各种场景下的高效语言处理和理解。这将有助于推动人工智能领域的发...
Read More近年来,语言被认为是规划的强大基础。通过将强大的语言模型与需要规划的系统相结合,可以提高这些系统的性能。在一种具有挑战性的稀疏奖励环境中,这一想法得到了验证。与基线相比,所提出的方法在数据效用、适应性...
Read More