漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-19 talkingdev

论文:补丁级别训练技术提高LLMs的效率

研究人员提出了针对大型语言模型(LLMs)的补丁级别训练,以提高训练效率。补丁级别训练是一种新的技术,目的是优化大型语言模型的处理能力。这种方法通过在训练过程中引入更精细的补丁级别,提高了模型的训练效率,...

Read More
2024-07-17 talkingdev

DeRTa-提升LLMs安全性,解耦拒绝训练方法

近日,一种名为解耦拒绝训练(DeRTa)的新方法被提出,这种新方法通过解决拒绝位置偏差问题,进一步提高了大型语言模型(LLMs)的安全性调优效果。LLMs在各类应用场景中起着重要作用,安全性问题也因此变得尤为重要...

Read More
2024-07-12 talkingdev

LookbackLens-解决LLM幻觉问题的最简方案

Lookback Lens是一个直接的模型,用于检测大型语言模型中的上下文幻觉。它通过在预测过程中引入更多的上下文信息,来解决大型语言模型(LLM)在生成文本时可能出现的幻觉问题。这种新的方法旨在提高模型预测的准确性...

Read More
2024-07-10 talkingdev

illm-tsc: 利用AI增强交通信号控制框架开源

研究人员已经开发出一个新的框架,该框架将大型语言模型与强化学习相结合,以提高交通信号控制系统的性能。这种新的方法借助AI的能力,使交通信号控制系统能够更有效地管理交通流量,提高道路效率,降低交通拥挤,从...

Read More
2024-07-03 talkingdev

LlaRA-大模型在机器人技术中的应用

LLaRA是一个使用大型语言模型(LLM)来通过对话式的指令-响应对提高机器人行动政策的框架。通过整合视觉输入,这些视觉语言模型(VLM)处理状态信息并生成最优的政策决策。LLM的使用增强了机器人的理解和应对能力,...

Read More
2024-07-02 talkingdev

NLUX:大型语言模型的新型交谈式AI JavaScript库

NLUX是一个可为大型语言模型提供用户界面的交谈式AI JavaScript库。它极大地简化了将强大的大型语言模型集成到Web应用程序的过程。NLUX具有React组件和钩子,LLM适配器,流式LLM输出以及自定义渲染器。这些特性使得N...

Read More
2024-07-02 talkingdev

AutoCodeRover-自动化软件改进工具开源

AutoCodeRover是一款新的工具,专门用于自动化软件改进,包括修复漏洞和添加功能。该工具结合了大型语言模型(LLM)和先进的代码搜索技术,以实现优化和提升。通过使用这款工具,开发者可以更有效地进行代码的修改和...

Read More
2024-06-28 talkingdev

苹果、微软缩小AI模型以提升性能

科技巨头们正在将注意力从大型语言模型转移到更有效的小型语言模型(SLMs),苹果和微软引入的模型具有明显较少的参数,但在基准测试中的性能却相当甚至超越了大型语言模型。OpenAI的CEO建议,我们正在超越LLMs的时...

Read More
2024-06-27 talkingdev

Slack利用AI技术将Enzyme单元测试转化为React测试库

Slack的工程师们采用了混合方法,结合了抽象语法树变换和AI大型语言模型,自动化地将超过15,000个Enzyme单元测试转化为React测试库。通过整合Anthropic的Claude 2.1 AI模型并捕获React组件的DOM树,团队在自动化转换...

Read More
2024-06-27 talkingdev

RES-Q-代码库编辑能力的新评估标准

RES-Q是一个全新的评估工具,专门用来评估大型语言模型在根据自然语言指令编辑代码库的能力。这个评估标准的出现,为开发者提供了一个全新的工具,可以更准确地评估和比较不同语言模型在代码编辑方面的性能。RES-Q的...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page