漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-11 talkingdev

论文:AI翻译技术应用于语言模型,解决有害内容问题

该项目采用翻译技术,针对多种语言的AI模型中的有害内容问题进行改进,从而提高安全性。由于直接数据缺乏,因此该项目解决了AI模型中的有害内容问题,为该领域的发展提供了新的思路。

Read More
2024-03-11 talkingdev

01.AI发布Yi开放基础模型

01.AI团队发布了一篇论文,详细介绍了Yi模型的数据收集和训练过程。Yi模型一直是最强大的开放语言模型之一。

Read More
2024-03-08 talkingdev

CoLLM-通过协作提高LLM性能

Co-LLM推出了一种新方法,可以让大型语言模型协作,逐标记生成文本。这种策略允许模型利用其独特的优势和专业知识来完成各种任务,从而在遵循指令、特定领域问题和推理挑战等方面提高性能。

Read More
2024-03-08 talkingdev

小型基准测试:用更少的示例评估LLM

评估语言模型通常采用手动策划的基准测试。其中一些基准测试非常大,有些超过14k个示例,这导致评估成本和噪声很高。这项工作表明,您可以可靠地评估流行基准测试中的语言模型性能,只需使用100个示例即可。

Read More
2024-03-07 talkingdev

Claude 3:最像人类的AI模型

Anthropic发布的Claude 3是一个大型语言模型,可与GPT-4相媲美,它不仅在基准测试中表现出色,而且在交互质量上独具人类特色,具有创造性和自然性,使其成为AI与作家创意合作能力的重大进展。

Read More
2024-03-07 talkingdev

初创公司在荒野训练LLM模型

Reka的创始人、著名GPU评论家Yi Tay在一篇博客文章中概述了他们在谷歌之外训练极强语言模型的经验。主要的挑战来自于集群和硬件的不稳定性,他们还发现软件的成熟度也是一个挑战。尽管如此,他们还是成功地训练出了...

Read More
2024-03-07 talkingdev

如何为LLM优化技术文档

本文讨论如何为大型语言模型构建结构化文档,以及在整个过程中需要考虑的最佳实践。首先,为LLM编写文档时应当注意文档的结构及可读性。其次,可以通过提供示例代码、使用清晰的术语和概念以及清晰的语言来使文档更...

Read More
2024-03-07 talkingdev

从零开始培训LLMs的初创公司

一家名为LLMify的初创公司正在推出一种新的方法来训练语言模型,他们将在没有预训练模型的情况下从零开始培训LLMs。该公司的创始人表示,这种方法可以提高模型的准确性和适用性,并加快训练时间。该公司已经引起了一...

Read More
  1. Prev Page
  2. 44
  3. 45
  4. 46
  5. Next Page