漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-18 talkingdev

Cappy:小型评分器如何超越大型多任务语言模型

Cappy是一款小型模型,专门设计用于接收指令和候选完成,然后为完成度打分,以衡量其完成指令的程度。在这项任务上,Cappy的表现超越了许多更大的模型,这表明它可能作为训练和生成过程中的一个反馈机制。Cappy的成...

Read More
2024-03-14 talkingdev

MoAI:整合视觉任务信息的增强型语言模型

MoAI是一种新型的大型语言和视觉模型,它通过整合专门的计算机视觉任务的辅助视觉信息来增强当前模型。该模型在 GitHub 上发布,旨在改善自然语言处理和计算机视觉任务之间的互动。MoAI使用了一种新的训练方法,可以...

Read More
2024-03-13 talkingdev

Perplexity结合Yelp数据,为其聊天机器人提供本地搜索结果

Perplexity将Yelp的数据整合到其聊天机器人中,以提供用户直接丰富的本地搜索结果,包括地图、评论和餐厅详细信息,从而增强聊天机器人的回答能力。Perplexity是一家专注于自然语言处理和人工智能技术的创业公司,其...

Read More
2024-03-12 talkingdev

互联网档案馆图书数据集开放

互联网档案馆拥有超过2亿个OCR图书页面,可供研究使用。该数据集可用于文本识别、自然语言处理、信息检索等多个领域的研究。研究人员可以使用该数据集进行模型训练、语言建模、数据分析等工作。该数据集的发布将加速...

Read More
2024-03-12 talkingdev

Cohere For AI发布Command-R多语言模型

Cohere For AI发布了一个30B+参数模型,该模型在10种语言的推理、摘要和问答方面非常擅长。该模型名为Command-R,是自然语言处理领域的一项重大突破。Command-R模型可以在多语言环境下进行推理和答案提取,这对于跨...

Read More
2024-03-12 talkingdev

xAI的语言模型Grok将于本周开源

据Elon Musk在X上透露,xAI的语言模型Grok将在未来几天内开源。 Grok是xAI的一项重要技术,它基于深度学习技术,能够快速地处理自然语言,并在文本中找到有意义的信息。Grok已经在xAI内部使用了很长时间,现在将会对...

Read More
2024-03-08 talkingdev

小型基准测试:用更少的示例评估LLM

评估语言模型通常采用手动策划的基准测试。其中一些基准测试非常大,有些超过14k个示例,这导致评估成本和噪声很高。这项工作表明,您可以可靠地评估流行基准测试中的语言模型性能,只需使用100个示例即可。

Read More
2024-03-07 talkingdev

如何为LLM优化技术文档

本文讨论如何为大型语言模型构建结构化文档,以及在整个过程中需要考虑的最佳实践。首先,为LLM编写文档时应当注意文档的结构及可读性。其次,可以通过提供示例代码、使用清晰的术语和概念以及清晰的语言来使文档更...

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page