漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-18 talkingdev

开发者的提示工程与大型语言模型指南

本文讲述了GitHub如何利用大型语言模型(LLMs)帮助其他开发者更好地利用这项技术的故事。文中从高层次上描述了LLMs的功能以及如何构建基于LLMs的应用。作为一个基于LLMs的应用案例,文章使用了GitHub Copilot代码补...

Read More
2023-07-17 talkingdev

FastEdit:一款帮助开发者高效注入知识的大型语言模型工具

FastEdit是一款旨在帮助开发者使用单一命令高效地向大型语言模型中注入新鲜和定制化知识的工具。这款工具已在GitHub上开源,可以让开发者在大型语言模型中更便捷地添加新知识,进而提高模型的性能和适用性。无论是进...

Read More
2023-07-11 talkingdev

个人设备上运行大型语言模型的开源模拟器INT-FP-QSim

本文介绍了一个名为INT-FP-QSim的开源模拟器。这款模拟器的主要功能是测试大型语言模型和视觉变换器在不同数值精度级别下的运行效果。大型语言模型和视觉变换器在AI领域具有广泛的应用,然而,由于其复杂的计算需求...

Read More
2023-07-10 talkingdev

美国国防部试验生成型AI 加快数据处理与创新解决方案

美国国防部正在成功地测试用于军事任务的大型语言模型(LLMs),旨在加速数据请求并生成新颖的解决方案。五角大楼正在与像Scale AI这样的科技初创公司合作,实验五个LLMs。这是他们在军事领域中更广泛的数据整合和数...

Read More
2023-07-08 talkingdev

提升LLMs问题解决能力的新技术——FLACUNA

最近一份技术报告详细介绍了FLACUNA,这是一种可以提高问题解决能力的语言模型。FLACUNA是通过使用一个名为FLANMINI的自定义指令数据集对VICUNA进行微调而创建的,VICUNA是另一种大型语言模型。FLACUNA的出现,对于...

Read More
2023-06-27 talkingdev

DeepMind声称其下一个聊天机器人将能与ChatGPT媲美

DeepMind的Gemini大型语言模型是使用AlphaGo的技术进行训练的,AlphaGo是第一个在围棋比赛中击败职业人类选手的AI系统。Gemini可以规划、解决问题和分析文本。它将AlphaGo类型系统的优势与大型语言模型的能力相结合...

Read More
2023-06-26 talkingdev

embedchain:一个用于创建基于大型语言模型的聊天机器人的框架

embedchain是一个用于创建基于大型语言模型的聊天机器人的框架。它抽象了加载数据集、分块、创建嵌入和存储到向量数据库的整个过程。用户可以通过链接到媒体文件,如视频、PDF、博客文章或网站,创建聊天机器人。这...

Read More
2023-06-23 talkingdev

Tart: 提升LLMs推理能力的新方法

这项研究揭示了大型语言模型(LLMs)在处理不同任务时可以胜任,但在概率推理方面存在困难,从而限制了它们的性能。作者提出了一种名为Tart的解决方案 - 一种在通用方式下训练的推理模块,当与任何现有模型结合时,...

Read More
2023-06-22 talkingdev

Wanda:一种用于大型语言模型的新剪枝方法(GitHub仓库)

该仓库介绍了Wanda,一种通过选择性地丢弃不太重要的网络权重来减少大型语言模型复杂性的独特方法。与其他方法不同,Wanda无需重新训练或大量计算,能够在保持性能的同时实现有效的模型剪枝。

Read More
2023-06-21 talkingdev

Autolabel:自动标注工具开源

Autolabel是一个Python库,可以使用你选择的任何大型语言模型(LLM)来标注、清理和丰富文本数据集。

Read More
  1. Prev Page
  2. 29
  3. 30
  4. 31
  5. Next Page