OpenAI训练了一个强大的模型,以便为弱模型输出更易读的文本,并发现这导致了LLM整体可读性的普遍提高。通过对弱模型进行精准评估,强模型的文本输出效果得到大幅提升。在日常实际应用中,这种提升将促进文本信息的...
Read MoreHugging Face近日推出了一套名为SmolLLM的小型语言模型套件,其性能超越许多大型模型。这主要得益于数据集的精心策划和管理。SmolLLM以其精细的设计和优化,展示出了小型语言模型的巨大潜力和价值。这种模型不仅在处...
Read More近日,一种名为解耦拒绝训练(DeRTa)的新方法被提出,这种新方法通过解决拒绝位置偏差问题,进一步提高了大型语言模型(LLMs)的安全性调优效果。LLMs在各类应用场景中起着重要作用,安全性问题也因此变得尤为重要...
Read More近日,一篇引人注目的论文详细介绍了如何将电子表格转化为现代LLM可以使用的表示方式。这种转换方法可以广泛应用于问答、格式化以及其他数据操作中。这篇论文为我们提供了一个全新的视角去思考如何更好地利用电子表...
Read MoreLookback Lens是一个直接的模型,用于检测大型语言模型中的上下文幻觉。它通过在预测过程中引入更多的上下文信息,来解决大型语言模型(LLM)在生成文本时可能出现的幻觉问题。这种新的方法旨在提高模型预测的准确性...
Read MoreRouteLLM是一个为LLM路由器提供服务和评估的框架,该框架已在GitHub Repo上发布。在现代技术世界中,路由器在网络连接和数据传输中扮演着至关重要的角色。然而,随着技术的快速发展,对路由器的需求和期望也在不断增...
Read More研究人员已经开发出一个新的框架,该框架将大型语言模型与强化学习相结合,以提高交通信号控制系统的性能。这种新的方法借助AI的能力,使交通信号控制系统能够更有效地管理交通流量,提高道路效率,降低交通拥挤,从...
Read MoreMobileLLM 是一款新的技术工具,专为设备使用情景优化具有数亿参数的语言模型。这款工具的出现,将大大提高设备上语言模型的效率和性能。其优化能力强大,可以处理具有高达数十亿参数的语言模型,这对于需要在设备上...
Read MoreSDXL是一款出色且开放的扩散模型,其搭载了全套LLM嵌入器(Hugging Face Hub),能够展现出强大的文本理解能力。这款模型的训练过程是从零开始的,开发者们通过将LLM嵌入到模型中,来增强其对文本内容的理解和解析能...
Read MoreKyutai,一家法国的开放研究实验室,成功地训练出一款具有极低延迟的纯音频LLM。他们成功地创建了一个令人印象深刻的演示,将在未来几个月内开源。Kyutai的这项工作表明,纯音频LLM的实现并不遥不可及,只是需要在技...
Read More