漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-13 talkingdev

论文:让AI生成的句子更加自然流畅

研究人员发现,将生成句子的模型所需的思路或“概念”以一定顺序呈现给它们,将会影响生成的句子质量。在测试的各个程序中,BART-large在给定特定顺序的思路后表现最佳,但令人惊讶的是,更大的并不总是更好。

Read More
2023-10-13 talkingdev

改进连续文本分类的记忆能力

这项研究探讨了在“连续学习”中面临的挑战,即模型试图在不忘记旧知识的情况下不断学习新知识,特别是在对文本进行分类时。研究介绍了一种新方法称为InfoCL,它使用特殊技术帮助模型更好地记忆和减少错误。

Read More
2023-10-13 talkingdev

多模态前沿模型的深度探究

本文深入探究了当前围绕多模态语言模型的研究活动。随着人工智能和自然语言处理领域的不断发展,多模态模型在语言理解、生成和预测等方面已经取得了很大的进展。本文介绍了多模态模型的基本原理,以及当前最先进的多...

Read More
2023-10-12 talkingdev

OpenAI宣布大幅更新API,降低开发者成本

OpenAI计划在下个月推出其API的重大更新,包括内存存储和视觉功能。这些新功能预计将在公司首次开发者大会上于11月6日推出,旨在吸引更多开发者为访问OpenAI的模型付费。OpenAI旨在到2024年实现10亿美元的收入目标。

Read More
2023-10-11 talkingdev

论文:提升大型语言模型(LLMs)的数学推理能力

研究人员正在探究数据增强技术对提高大型语言模型(LLMs)数学推理能力的影响。他们通过增强现有数据集中的查询,创建了一个新的数据集AugGSM8K,并开发了一个名为MuggleMath的模型。数据增强技术能有效提升模型的数...

Read More
2023-10-11 talkingdev

利用大型语言模型提升视频理解能力——FAVOR新方法的引入

研究人员推出了一种名为FAVOR的新方法,该方法通过在帧级别精细融合音频和视觉细节,使大型语言模型能够理解视频。FAVOR方法的推出,为大型语言模型的视频理解能力提供了新的发展空间。这种新方法通过在帧级别精细融...

Read More
2023-10-11 talkingdev

在竞争激烈的拍卖世界中测试大型语言模型

研究员们创造了一款名为AucArena的模拟平台,旨在在拍卖环境中测试大型语言模型。这些环境是动态的,需要策略性思考。初步测试显示,如果给出合适的提示,这些模型可以在拍卖中表现出色,表现出诸如预算和长期计划等...

Read More
2023-10-11 talkingdev

提升文本生成中扩散模型的速度

研究人员推出了一种用于文本生成中的扩散模型的新技术。通过使用软吸收状态,他们改善了模型处理离散文本变化的方式,从而加快了学习速度和采样速度。扩散模型是一种能够模拟物质扩散过程的数学模型,能够以一种高效...

Read More
  1. Prev Page
  2. 353
  3. 354
  4. 355
  5. Next Page