漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-28 talkingdev

VSP-LLM可视化语音识别框架开源

Visual Speech Recognition with Language Models(VSP-LLM)框架在视觉语音识别和翻译中引入了新的方法,通过集成LLMs来高效处理视频输入,通过去重嵌入视觉特征和使用低秩适配器进行成本效益训练。

Read More
2024-02-23 talkingdev

ChartX:测试多模态语言模型理解视觉数据的可视化工具

近日,一种名为ChartX的新工具发布在GitHub上,用于测试多模态大语言模型(MLLM)在解释和推理可视化图表方面的能力。ChartX通过评估模型对图表的理解能力来测试其多模态能力,包括语言和视觉。该工具可以评估多种不...

Read More
2024-02-19 talkingdev

NeuralFlow开源-神经流中间层输出的可视化

NeuralFlow神经流是一个Python脚本,用于绘制Mistral 7B的中间层输出。它产生一个512 x 256的图像,表示模型的每一层的输出。

Read More
2024-02-14 talkingdev

SGLang:针对LLM设计的结构生成语言

SGLang是一种针对大型语言模型设计的结构生成语言。它的设计目标是使与语言模型的交互更快速、更可控。SGLang提供了一种基于结构的生成方法,使用户能够更好地控制生成的文本。此外,它还提供了一些实用工具,如生成...

Read More
2024-02-01 talkingdev

Lilac Garden快速聚类技术:将语言模型训练效率提高100倍

在训练语言模型时,一个挑战是为任务找到足够多样化的数据集。更难的是,将这些数据可视化。这个很酷的工具使用快速聚类和主题建模,使得可以探索数据,以改善过滤和整体质量。

Read More
2024-01-29 talkingdev

DittoGym:学习控制柔性变形机器人技术

柔性机器人由于其大量的控制空间而具有挑战性。这项工作引入了一个模拟器,其中包含用于操作柔性“Ditto”对象的各种任务。它包含实用程序、可视化和一些强大的基准。

Read More
2024-01-22 talkingdev

AI诚信之路

近期研究表明,控制人工智能诚信的方法包括识别和操作人工智能内部的诚信相关向量,或者通过与问题无关的问题来检测基于人工智能响应一致性的撒谎倾向。

Read More
2024-01-09 talkingdev

OpenInterpreter获得OS模式

OpenInterpreter是一个优秀的项目,它模拟了OpenAI的解释器。现在,它还拥有一个OS模式和一个可视化模式,因此它可以通过点击按钮和查看屏幕来使用语言模型控制您的计算机。

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page