漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-02 talkingdev

AutoCodeRover-自动化软件改进工具开源

AutoCodeRover是一款新的工具,专门用于自动化软件改进,包括修复漏洞和添加功能。该工具结合了大型语言模型(LLM)和先进的代码搜索技术,以实现优化和提升。通过使用这款工具,开发者可以更有效地进行代码的修改和...

Read More
2024-06-28 talkingdev

论文:材料科学领域的语言模型

MatText是一套专为评估材料科学中语言模型性能的基准测试工具和数据集。这套工具和数据集的设计目标,是使研究者能够更有效地理解和评估语言模型在材料科学应用中的表现。语言模型在材料科学中的应用,可以帮助科学...

Read More
2024-06-28 talkingdev

Meta发布LLM编译器:性能优化至77%,反汇编性能达45%

近日,Meta发布了两款语言模型,旨在将代码编译成汇编语言并能够反编译至LLVM IR。这两款模型在5460亿个高质量数据标记上接受了训练,并进行了进一步的指令调优。Meta的这一创新实现了优化后的汇编性能达到77%,反汇...

Read More
2024-06-28 talkingdev

苹果、微软缩小AI模型以提升性能

科技巨头们正在将注意力从大型语言模型转移到更有效的小型语言模型(SLMs),苹果和微软引入的模型具有明显较少的参数,但在基准测试中的性能却相当甚至超越了大型语言模型。OpenAI的CEO建议,我们正在超越LLMs的时...

Read More
2024-06-27 talkingdev

Slack利用AI技术将Enzyme单元测试转化为React测试库

Slack的工程师们采用了混合方法,结合了抽象语法树变换和AI大型语言模型,自动化地将超过15,000个Enzyme单元测试转化为React测试库。通过整合Anthropic的Claude 2.1 AI模型并捕获React组件的DOM树,团队在自动化转换...

Read More
2024-06-27 talkingdev

RES-Q-代码库编辑能力的新评估标准

RES-Q是一个全新的评估工具,专门用来评估大型语言模型在根据自然语言指令编辑代码库的能力。这个评估标准的出现,为开发者提供了一个全新的工具,可以更准确地评估和比较不同语言模型在代码编辑方面的性能。RES-Q的...

Read More
2024-06-27 talkingdev

论文:利用检索增强指令调整进行命名实体识别

检索增强指令调整(RA-IT)通过大型语言模型对信息进行提取,从而提高了信息提取的效率。这种技术的出现,为我们理解和处理大量信息提供了新的可能。RA-IT不仅可以提高信息提取的速度,还可以提高提取信息的准确性,...

Read More
2024-06-26 talkingdev

Imbue公司以其训练出的70B模型匹敌GPT-4

Imbue公司成功训练并发布了一款极其强大的70B语言模型。这款模型采用了Imbue自家的优化器,以及一些出色的数据过滤技术,训练过程中没有出现任何损失峰值。这表明该公司在技术上取得了显著的突破,为人工智能语言模...

Read More
2024-06-26 talkingdev

苹果智能与AI极致主义:分化策略与新趋势

苹果正在对其人工智能(AI)进行细分处理,区分出'上下文'和'世界'模型。其中,像ChatGPT这样的'世界'模型,被用于处理开放式查询,但没有个人上下文。OpenAI的地位并不稳固,因为在大语言模型(LLMs)中缺乏防御壁...

Read More
2024-06-25 talkingdev

混合注意力MoA在大型语言模型中的应用

混合注意力(MoA)方法在大型语言模型中优化稀疏注意力,通过为不同的头部和层定制独特的稀疏注意力配置。该方法通过改变稀疏注意力的配置,使模型可以更有效地处理复杂的语言模型,从而提高模型的性能和效率。

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page