LLM的相关内容 - 漫话开发者

2024-07-18 talkingdev

Prover-Verifier改善LLM可读性

OpenAI训练了一个强大的模型，以便为弱模型输出更易读的文本，并发现这导致了LLM整体可读性的普遍提高。通过对弱模型进行精准评估，强模型的文本输出效果得到大幅提升。在日常实际应用中，这种提升将促进文本信息的...

2024-07-17 talkingdev

Hugging Face近日推出了一套名为SmolLLM的小型语言模型套件，其性能超越许多大型模型。这主要得益于数据集的精心策划和管理。SmolLLM以其精细的设计和优化，展示出了小型语言模型的巨大潜力和价值。这种模型不仅在处...

2024-07-17 talkingdev

近日，一种名为解耦拒绝训练（DeRTa）的新方法被提出，这种新方法通过解决拒绝位置偏差问题，进一步提高了大型语言模型（LLMs）的安全性调优效果。LLMs在各类应用场景中起着重要作用，安全性问题也因此变得尤为重要...

2024-07-16 talkingdev

近日，一篇引人注目的论文详细介绍了如何将电子表格转化为现代LLM可以使用的表示方式。这种转换方法可以广泛应用于问答、格式化以及其他数据操作中。这篇论文为我们提供了一个全新的视角去思考如何更好地利用电子表...

2024-07-12 talkingdev

Lookback Lens是一个直接的模型，用于检测大型语言模型中的上下文幻觉。它通过在预测过程中引入更多的上下文信息，来解决大型语言模型（LLM）在生成文本时可能出现的幻觉问题。这种新的方法旨在提高模型预测的准确性...

2024-07-11 talkingdev

RouteLLM是一个为LLM路由器提供服务和评估的框架，该框架已在GitHub Repo上发布。在现代技术世界中，路由器在网络连接和数据传输中扮演着至关重要的角色。然而，随着技术的快速发展，对路由器的需求和期望也在不断增...

2024-07-10 talkingdev

研究人员已经开发出一个新的框架，该框架将大型语言模型与强化学习相结合，以提高交通信号控制系统的性能。这种新的方法借助AI的能力，使交通信号控制系统能够更有效地管理交通流量，提高道路效率，降低交通拥挤，从...

2024-07-10 talkingdev

MobileLLM 是一款新的技术工具，专为设备使用情景优化具有数亿参数的语言模型。这款工具的出现，将大大提高设备上语言模型的效率和性能。其优化能力强大，可以处理具有高达数十亿参数的语言模型，这对于需要在设备上...