漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-07 talkingdev

Cohere的Command R模型系列现已在亚马逊Bedrock平台上线

Cohere的Command R和R+是针对长文本任务优化的最新LLM(Large Language Models)。这两款模型在关键的商业重要能力方面表现优异。它们都是目前市场上的技术先行者,并且已经在亚马逊Bedrock平台上进行发布。这无疑是...

Read More
2024-05-07 talkingdev

ml-rpm-bench: 视觉-语言模型在视觉推理方面的限制评估

像GPT-4V这样的视觉-语言模型在理解和与图像和文本交互方面正在快速发展。然而,最近的一项研究揭示了它们在视觉推理上的重大限制。研究人员使用复杂的视觉难题,如智商测试中的难题,来测试这些模型,并发现它们在...

Read More
2024-05-06 talkingdev

基于Mistral的新型语言模型Prometheus评估GPT-4性能

在许多现代性能基准测试中,GPT-4被广泛用作生成质量的评判标准。现在,一种名为Prometheus的模型引起了人们的关注。这种模型是基于Mistral构建的,能够在这项任务上表现出色。Prometheus不仅在处理日常任务上有出色...

Read More
2024-05-06 talkingdev

Mantis-训练视觉模型新进展,单图和多图指令调整

最近,科技领域出现了一种全新的数据集和训练视觉语言模型,它能够在多图之间实现更高质量的指令跟踪。这种新的训练模型采用先进的视觉语言处理技术,可以识别并理解图片中的信息,并根据这些信息生成相应的指令。这...

Read More
2024-05-03 talkingdev

开源实现扩展LLM大模型到128K上下文长度

一项最新的研究揭示了一种能够显著扩展语言模型上下文长度至128K的方法。这项研究强调了大量和多样性的训练数据的重要性。语言模型的上下文长度是语言模型理解和生成连贯文本的能力的一个重要因素。此项新的研究方法...

Read More
2024-05-03 talkingdev

InstructDr新模型开源:开创视觉文档理解纪元

近日,GitHub Repo发布了一款名为InstructDr的模型,该模型的设计目标是在各种视觉文档理解任务中表现优异,如问题回答和信息提取等。InstructDr能结合文档图片和大型语言模型,适应新的任务和数据集,其性能超过了...

Read More
2024-05-02 talkingdev

RAGs检索增强语言模型完全指南

本次调查报告深入探讨了检索增强语言模型(RALMs)的领域,重点展示了它们的演变过程、结构以及在NLP任务中的多样化应用,如翻译和对话系统。检索增强语言模型是一种新型的语言模型,不仅通过训练数据生成文本,还能...

Read More
2024-05-02 talkingdev

Anthropic发布Claude AI聊天机器人iOS应用

Anthropic近日推出了其Claude 3 AI语言模型的iOS移动应用,并且引入了一个为团队协作设计的新的订阅级别。Claude 3 AI是Anthropic的最新产物,它可以理解和生成自然语言,提供了一个强大的工具,使得用户可以以更人...

Read More
2024-05-01 talkingdev

Cognition Labs寻求20亿美元估值,为其AI编码工具Devin融资

正在从加密转向AI的Cognition Labs,正寻求20亿美元的估值为其AI编码工具Devin融资。在AI初创公司估值飙升的趋势中,Cognition的成功反映了行业的增长以及在数据和计算资源上进行重大投资的重要性。像Google和Micros...

Read More
2024-05-01 talkingdev

QUICK:加速LLM的新CUDA内核开源

QUICK是一套新的优化CUDA内核,通过解决内存问题,提升了大型语言模型的效率。这导致了NVIDIA GPU上的显著速度提升,使AI模型运行更快,效率更高。QUICK的出现,无疑为AI领域带来了新的可能性,通过优化内存处理方式...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page