漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-30 talkingdev

Nvidia展示新技术,让你用自己的声音与AI游戏角色交流

Nvidia在2023年Computex展示了一项新的生成式AI技术,可以让人们用自己的声音与游戏角色进行对话。Nvidia Avatar Cloud Engine将在本地和云端运行,包括部署大型语言模型、语音转文本、文本转语音等工具。文章中提供...

Read More
2023-05-30 talkingdev

与Samantha相遇:AI语言模型的人格化探索

近日,一项新的研究显示,AI语言模型可以模拟人类个体的行为特征,实现人格化。这意味着,只需通过一些精心构建的方法,就能够为AI语言模型赋予人类的个性。研究者采用GPT-4语言模型来构建Samantha,将其作为另一个...

Read More
2023-05-30 talkingdev

Sophia:一种用于语言模型预训练的可扩展的随机二阶优化器

近日,Sophia的官方实现已经上线,Sophia是一种可扩展的随机二阶优化器,用于语言模型预训练。以下是该实现的三个核心要点: - Sophia是一种适用于大规模语言模型预训练的随机二阶优化器; - Sophia的实现基于PyTor...

Read More
2023-05-29 talkingdev

构建LLMs时,谁也没有谈论的难点

在自然语言处理领域,语言模型是一种具有高潜力的新工具。然而,它们面临一系列具有挑战性的问题,这使得它们难以在生产环境中部署。本文讨论了提示可靠性、监控等方面的问题,为您展示了在应用程序中部署语言模型所...

Read More
2023-05-29 talkingdev

论文介绍新方法:提高文本转SQL的准确性

近日,有一篇论文提出了一种新的方法,旨在改进计算机理解和将日常语言转换为SQL的能力。该方法通过查看代码的整个部分而非单个单词来纠正错误,并使用一种新的SQL查询表示法,更接近于现有代码语言模型的工作方式,...

Read More
2023-05-29 talkingdev

无需训练,用GPT-4学习Minecraft

## 新闻摘要: - GPT-4被广泛认为是迄今为止最强大的语言模型。 - Voyager将代码作为“策略表示”,并使用环境错误和性能作为自然语言反馈,从而让GPT4能够逐步改进挖掘钻石等任务。 - 通过Voyager,我们不需要训练GP...

Read More
2023-05-29 talkingdev

研究人员开发出新型数据集,测试大型语言模型的问答能力

研究人员基于超过 350 个 STEM(科学、技术、工程和数学)定理,开发了包含 800 个问题-答案对的数据集,用于测试人工智能语言模型。该数据集为衡量人工智能使用这些定理解决复杂的大学级问题的能力提供了新的基准。...

Read More
2023-05-26 talkingdev

语言模型新技术:RECURRENTGPT实现任意长度文本生成

近日,GitHub上推出了名为RECURRENTGPT的新技术,它是一种基于语言的循环机制,被嵌入到像ChatGPT这样的大型语言模型中。通过模拟长短期记忆机制,RECURRENTGPT实现了任意长度的文本生成,同时保留了长期记忆。该技...

Read More
  1. Prev Page
  2. 153
  3. 154
  4. 155
  5. Next Page