漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-23 talkingdev

Mistral 发布最新 7B 模型,性能显著提升

Mistral 公司近日在 Hugging Face Hub 上发布了其 7B 模型的最新版本——Mistral 7B Instruct V3。该版本在上下文长度和性能方面都有显著提升。新的模型不仅能够处理更长的上下文,还在多个基准测试中表现出色,显示出...

Read More
2024-05-23 talkingdev

Tarsier:提升LLMs与网页交互的开源工具

Reworkd公司近日发布了一款名为Tarsier的新工具,旨在通过使用括号和ID对网页元素进行视觉标记,增强大语言模型(LLMs)的网页交互任务处理能力。Tarsier利用OCR生成的文本表示,使得没有视觉功能的LLM也能理解网页...

Read More
2024-05-16 talkingdev

Nous Hermes发布首款Theta模型,具有出色的函数调用能力

Nous Hermes发布了全新的Theta模型,该模型是Hermes 2 Pro和Llama 3 8B instruct的结合。它具有出色的函数调用能力,并在各种基准测试中表现强劲。Hermes 2 Pro是一款高性能的模型,而Llama 3 8B instruct则以其强大...

Read More
2024-05-07 talkingdev

Vibe-Eval开源:评估多模态聊天模型基准测试

Vibe-Eval是一个新推出的基准测试,专为测试多模态聊天模型而设计。它包含了269项视觉理解提示,其中包括100项特别具有挑战性的提示。这些视觉理解提示的设计,力求能够全面、深入地评估和测试多模态聊天模型的性能...

Read More
2024-05-06 talkingdev

基于Mistral的新型语言模型Prometheus评估GPT-4性能

在许多现代性能基准测试中,GPT-4被广泛用作生成质量的评判标准。现在,一种名为Prometheus的模型引起了人们的关注。这种模型是基于Mistral构建的,能够在这项任务上表现出色。Prometheus不仅在处理日常任务上有出色...

Read More
2024-05-02 talkingdev

神秘的AI模型gpt2-chatbot引发热议,OpenAI下一代产品的预告?

近日,一款名为gpt2-chatbot的神秘AI模型在lmsys.org网站上引发关注,其展示的能力类似于GPT-4.5,这引起了人们对其是否是OpenAI未公开的下一代产品测试的猜测。关键标识如响应质量、OpenAI特有的特征和频率限制等都...

Read More
2024-04-28 talkingdev

Llama3与SigLIP打造的多模态模型Bunny发布

多模态模型Bunny系列是一套强大的开放模型,尤其在MMMU基准测试中,其性能表现优秀。这是该团队基于Llama3 8B发布的首款开放模型。这个系列的模型采用了SigLIP与Llama3的技术,充分展示了其强大的性能和应用广泛性。...

Read More
2024-04-16 talkingdev

Eleuther发布Pile-T5:现代AI编码任务的升级版基础模型

Eleuther团队近期对T5模型进行了重新训练,采用了现代的分词器并延长了训练时间。T5作为现代AI领域的一匹黑马,此次升级后的Pile-T5模型在编码任务上表现出了显著的性能提升。经过持续的优化和调整,Pile-T5在多项基...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page