漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-24 talkingdev

Ween推出AI平台,将定性数据转化为可行的见解

Ween是一家专注于数据分析的公司,他们刚刚发布了一款新的人工智能平台,该平台可以将定性数据转化为可行的见解。这一技术可以帮助企业更好地了解其客户、市场和竞争对手。Ween的人工智能平台使用先进的自然语言处理...

Read More
2023-10-23 talkingdev

Hugging Face Hub发布Math Mistral模型,助力数学与推理能力的提升

近日,人工智能技术公司Hugging Face Hub发布了一款名为Math Mistral的模型,该模型针对数学及推理能力进行了训练,具备强大的能力和广泛的应用场景。 Math Mistral是一种基于自然语言处理技术的模型,它可以帮助用...

Read More
2023-10-18 talkingdev

HuggingFace diffusers开源轻量快速推理引擎

近日,HuggingFace diffusers轻量快速推理引擎在GitHub上线。该引擎通过许多小改进,实现了大幅提升推理速度的目标,声称每秒可达60步,比原来的23步快了许多。该引擎在自然语言处理任务中表现优异,受到了许多开发...

Read More
2023-10-18 talkingdev

百度发布ERNIE 4.0,声称与OpenAI的GPT-4不相上下

百度发布了其先进的人工智能聊天机器人ERNIE 4.0,并声称它与OpenAI的GPT-4不相上下。ERNIE 4.0是一种基于深度学习的语言模型,它在理解自然语言方面取得了重大突破。ERNIE 4.0能够更好地理解人类语言,并在语义理解...

Read More
2023-10-18 talkingdev

论文:Llemma-面向数学的开放式语言模型

在自然语言处理领域,语言模型已经取得了重大的突破,但是在数学领域,语言模型的应用却相对较少。Llemma是一种面向数学的开放式语言模型,它基于GPT-3模型,可以处理数学领域的自然语言文本,如数学公式、定理和证...

Read More
2023-10-16 talkingdev

Anyscale-将Llama 2的冷启动时间缩短至30秒

将模型从云存储加载到节点GPU通常需要大部分推理时间。通过一些巧妙的技巧,例如内存流,Anyscale将其缩短了20倍,仅需30秒即可到达Llama 2 70B。

Read More
2023-10-13 talkingdev

GPT-4的推理能力已被充分证明

尽管GPT-4缺乏意识和长期记忆,但有充分的证据表明它能够推理和理解概念。GPT-4是人工智能领域中最先进的语言模型,它可以生成高质量的自然语言文本。尽管它缺少人类的智能,但它可以在多个领域表现出惊人的表现力。...

Read More
2023-10-11 talkingdev

论文:提升大型语言模型(LLMs)的数学推理能力

研究人员正在探究数据增强技术对提高大型语言模型(LLMs)数学推理能力的影响。他们通过增强现有数据集中的查询,创建了一个新的数据集AugGSM8K,并开发了一个名为MuggleMath的模型。数据增强技术能有效提升模型的数...

Read More
2023-10-11 talkingdev

Agent完全指南:LLMs与智能应用的革命

人工智能驱动软件的下一步演变并非聊天机器人,而是利用LLMs来完成实际工作的应用。AI基础设施联盟的此篇电子书全面覆盖了此领域的各个方面,包括Prompt工程、LLM逻辑和推理、主要框架如LlamaIndex、LangChain、Hays...

Read More
2023-10-05 talkingdev

思考再说:为LLMs添加暂停标记以提高推理能力

最近的研究表明,为ViTs注册器添加[reg]标记可以修复图像注意力映射的突增。这项工作表明,将一系列可学习的[pause]标记预置到序列中可以提高语言模型推理(仅解码器,最高可达10亿)的能力,最多可提高18%。直观上...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page