漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-13 talkingdev

Laion发布BUD-E助手,采用自然语言和极度优化的语言模型

Laion研究小组发布了一款开放式助手BUD-E,该助手采用自然语言和极度优化的语言模型,可在游戏笔记本电脑上运行。该项目旨在提供一种低资源的助手,易于安装且对个人使用功能强大。

Read More
2024-02-13 talkingdev

Chess-GPT:探索LLM的国际象棋AI内部世界

本研究着眼于一个基于大型语言模型的国际象棋AI是如何工作的。该AI使用了GPT-2和GPT-3模型,并通过对棋盘上的棋子和动作进行编码来训练自己。研究人员还探索了AI模型内部的世界,包括其理解和预测对手的能力,以及在...

Read More
2024-02-12 talkingdev

HF发布新基准数据集,用于评估语言模型表现

Hugging Face Hub推出了新的基准数据集,名为Anime Bench,该数据集包含有关各种动漫角色以及引用的事实,旨在评估语言模型的性能。该数据集包含了来自动漫作品的超过10,000个引用,可以用于测试语言模型的能力,评...

Read More
2024-02-12 talkingdev

CogCoM开源新视觉语言模型,增强视觉推理能力

CogCoM是一种全新的通用视觉语言模型,它具有独特的操作链机制。这使得它能够通过主动调整输入图像来处理多轮视觉推理。该模型已经在GitHub上发布。

Read More
2024-02-12 talkingdev

HF开源轻量级评估库 lighteval

HuggingFace发布了一个轻量级的评估库lighteval,用于基于HELM和Eluther AI评估工具的语言模型训练。该评估库专注于提供高效易用的评估方法和指标,帮助用户快速准确地评估模型性能。同时,lighteval还提供了丰富的...

Read More
2024-02-12 talkingdev

FunSearch:利用LLM在数学科学领域的新发现

FunSearch是一种新的AI驱动方法,它将大型语言模型与评估算法相结合,已经在数学科学领域做出了可验证的发现,包括解决了长期存在的cap set问题和更高效的bin-packing问题算法。它引入了演化方法来生成和评估代码,...

Read More
2024-02-09 talkingdev

AIFilter-本地 AI 过滤社交媒体无效信息

社交媒体平台上的信息泛滥,很多用户都会选择过滤掉自己不感兴趣或者不适合的内容,而这个 Chrome 扩展可以让你使用本地语言模型按照你选择的标准来过滤社交媒体帖子。这个扩展可以通过自定义正则表达式、关键词、情...

Read More
2024-02-09 talkingdev

论文:挑战多模态语言模型的新基准测试

一项新研究揭示了多模态大型语言模型(MLLMs)如GPT-4V的一个弱点:它们难以处理特定类型的图像-文本输入,从而导致错误。CorrelationQA是一个基准测试,旨在评估MLLM在图像可能会误导或与文本相矛盾的情况下的表现...

Read More
  1. Prev Page
  2. 64
  3. 65
  4. 66
  5. Next Page