研究人员提出了针对大型语言模型(LLMs)的补丁级别训练,以提高训练效率。补丁级别训练是一种新的技术,目的是优化大型语言模型的处理能力。这种方法通过在训练过程中引入更精细的补丁级别,提高了模型的训练效率,...
Read More近日,一种名为解耦拒绝训练(DeRTa)的新方法被提出,这种新方法通过解决拒绝位置偏差问题,进一步提高了大型语言模型(LLMs)的安全性调优效果。LLMs在各类应用场景中起着重要作用,安全性问题也因此变得尤为重要...
Read MoreLookback Lens是一个直接的模型,用于检测大型语言模型中的上下文幻觉。它通过在预测过程中引入更多的上下文信息,来解决大型语言模型(LLM)在生成文本时可能出现的幻觉问题。这种新的方法旨在提高模型预测的准确性...
Read More研究人员已经开发出一个新的框架,该框架将大型语言模型与强化学习相结合,以提高交通信号控制系统的性能。这种新的方法借助AI的能力,使交通信号控制系统能够更有效地管理交通流量,提高道路效率,降低交通拥挤,从...
Read MoreLLaRA是一个使用大型语言模型(LLM)来通过对话式的指令-响应对提高机器人行动政策的框架。通过整合视觉输入,这些视觉语言模型(VLM)处理状态信息并生成最优的政策决策。LLM的使用增强了机器人的理解和应对能力,...
Read MoreNLUX是一个可为大型语言模型提供用户界面的交谈式AI JavaScript库。它极大地简化了将强大的大型语言模型集成到Web应用程序的过程。NLUX具有React组件和钩子,LLM适配器,流式LLM输出以及自定义渲染器。这些特性使得N...
Read MoreAutoCodeRover是一款新的工具,专门用于自动化软件改进,包括修复漏洞和添加功能。该工具结合了大型语言模型(LLM)和先进的代码搜索技术,以实现优化和提升。通过使用这款工具,开发者可以更有效地进行代码的修改和...
Read More科技巨头们正在将注意力从大型语言模型转移到更有效的小型语言模型(SLMs),苹果和微软引入的模型具有明显较少的参数,但在基准测试中的性能却相当甚至超越了大型语言模型。OpenAI的CEO建议,我们正在超越LLMs的时...
Read MoreSlack的工程师们采用了混合方法,结合了抽象语法树变换和AI大型语言模型,自动化地将超过15,000个Enzyme单元测试转化为React测试库。通过整合Anthropic的Claude 2.1 AI模型并捕获React组件的DOM树,团队在自动化转换...
Read MoreRES-Q是一个全新的评估工具,专门用来评估大型语言模型在根据自然语言指令编辑代码库的能力。这个评估标准的出现,为开发者提供了一个全新的工具,可以更准确地评估和比较不同语言模型在代码编辑方面的性能。RES-Q的...
Read More