漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-25 talkingdev

混合注意力MoA在大型语言模型中的应用

混合注意力(MoA)方法在大型语言模型中优化稀疏注意力,通过为不同的头部和层定制独特的稀疏注意力配置。该方法通过改变稀疏注意力的配置,使模型可以更有效地处理复杂的语言模型,从而提高模型的性能和效率。

Read More
2024-06-24 talkingdev

NLUX:一种面向大语言模型的JavaScript对话AI库

NLUX是一种对话式人工智能JavaScript库,专为大型语言模型提供用户界面。它极大地简化了将强大的大型语言模型集成到Web应用中的过程。NLUX的特点包括React组件和钩子,大型语言模型的适配器,流式的大型语言模型输出...

Read More
2024-06-24 talkingdev

AutoCodeRover开源-自动化软件改进工具

近期,一款名为AutoCodeRover的新型工具引起了业界的关注。这款工具能够自动化进行软件的改进,包括修复缺陷和增加特性等。AutoCodeRover通过结合大型语言模型和先进的代码搜索技术,有效提升了软件改进的效率和质量...

Read More
2024-06-23 talkingdev

利用语义熵检测大型语言模型中的幻觉

随着大型语言模型的普及,越来越多的人开始依赖这些系统来生成语言内容。然而,这些系统可能会出现所谓的幻觉,即生成的内容与真实世界不符合。为了解决这个问题,研究人员提出了一种名为语义熵的新方法来检测幻觉。...

Read More
2024-06-21 talkingdev

苹果为提升文字与图像AI性能,开源了20个机器学习模型

苹果公司最近向Hugging Face开源AI仓库贡献了20个Core Machine Learning模型,以此来提升公有模型在图像分类和深度分割方面的性能。此举紧随苹果发布Ferret大型语言模型和四个OpenELMs到Hugging Face的步伐。这一举...

Read More
2024-06-20 talkingdev

Paramount开源,LLM Agent精度测量技术

近日,知名的开源平台GitHub上的Paramount项目公开了一项新的技术——LLMs(Large Language Models)的Agent精度测量。该技术旨在提升大型语言模型的代理精度,助力开发者更加准确地评估和优化模型性能。据了解,LLMs...

Read More
2024-06-20 talkingdev

TroL-高效大型语言和视觉模型开源

近日,一种名为TroL的新型高效大型语言和视觉模型 (LLVMs) 在GitHub上发布,其模型规模分别为18亿、38亿和70亿参数。这些模型能够精确地处理和理解大量的语言和图像信息,其性能和效率都达到了非常高的水平。这些模...

Read More
2024-06-19 talkingdev

Nvidia在最新AI测试中表现出色

在MLPerf的两项新测试中,由Nvidia的Hopper架构驱动的系统表现突出,这两项测试分别比较了大型语言模型的微调和图神经网络的训练。MLPerf是一个AI基准测试套件,用于比较不同系统在AI任务上的性能。Nvidia的Hopper架...

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page