漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-14 talkingdev

SGLang:针对LLM设计的结构生成语言

SGLang是一种针对大型语言模型设计的结构生成语言。它的设计目标是使与语言模型的交互更快速、更可控。SGLang提供了一种基于结构的生成方法,使用户能够更好地控制生成的文本。此外,它还提供了一些实用工具,如生成...

Read More
2024-02-01 talkingdev

Lilac Garden快速聚类技术:将语言模型训练效率提高100倍

在训练语言模型时,一个挑战是为任务找到足够多样化的数据集。更难的是,将这些数据可视化。这个很酷的工具使用快速聚类和主题建模,使得可以探索数据,以改善过滤和整体质量。

Read More
2024-01-29 talkingdev

DittoGym:学习控制柔性变形机器人技术

柔性机器人由于其大量的控制空间而具有挑战性。这项工作引入了一个模拟器,其中包含用于操作柔性“Ditto”对象的各种任务。它包含实用程序、可视化和一些强大的基准。

Read More
2024-01-22 talkingdev

AI诚信之路

近期研究表明,控制人工智能诚信的方法包括识别和操作人工智能内部的诚信相关向量,或者通过与问题无关的问题来检测基于人工智能响应一致性的撒谎倾向。

Read More
2024-01-09 talkingdev

OpenInterpreter获得OS模式

OpenInterpreter是一个优秀的项目,它模拟了OpenAI的解释器。现在,它还拥有一个OS模式和一个可视化模式,因此它可以通过点击按钮和查看屏幕来使用语言模型控制您的计算机。

Read More
2024-01-09 talkingdev

Webassembly:将计算系统分割成基本抽象边界

Webassembly 是一种基本的抽象边界,将计算系统分割成片段。它提供了一种可以在 Web 浏览器中运行本机代码的方法,而无需使用插件和额外的安装。Webassembly 可以使开发者更轻松地编写高性能的 Web 应用程序,同时减...

Read More
2023-12-19 talkingdev

苹果开源防止熵崩溃的稳定训练方法

Transformer模型虽然强大,但是由于其不稳定性,训练起来常常会很困难。其中一个主要的问题是注意力矩阵的熵崩溃。本文介绍了一种通过简单的重新参数化来防止熵崩溃的方法。

Read More
2023-12-12 talkingdev

LLM原理的可视化呈现

LLM可视化是一个网站,用于展示nano-gpt模型如何将6个字母的序列按字母顺序排序。nano-gpt模型是由85,000个参数组成的模型,其基础是GPT-2,该模型可用于生成自然语言文本。该网站使用了交互式的可视化工具,用户可...

Read More
2023-12-05 talkingdev

LLM可视化(网站)

LLM可视化是一个展示nano-gpt模型的网站,该模型有85000个参数。它展示了该模型如何将一个包含6个字母的序列按字母顺序排列。此网站可以帮助人们更好地了解和理解自然语言处理中的模型和算法。

Read More
2023-11-07 talkingdev

xAI推出PromptIDE开发环境

xAI的PromptIDE是一个用于提示工程和可解释性研究的开发环境。PromptIDE是一个为AI开发人员和研究人员提供的全面的可解释性工具,旨在帮助他们更好地理解和管理AI系统。该工具包括强大的可视化和分析功能,可以帮助...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page