漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-02 talkingdev

论文:大型语言模型从错误中吸取教训

最近的一项研究引入了一种名为“从错误中学习”(LeMa)的方法,通过从错误中学习来教授大型语言模型解决数学问题,类似于人类学生通过纠正错误来提高自己。

Read More
2023-10-27 talkingdev

ToRA:集成Agent工具解决数学推理难题

ToRA是一系列工具集成的推理代理人,旨在通过与工具交互来解决具有挑战性的数学推理问题。通过与定理证明器、计算机代数系统等工具进行交互,ToRA能够发现新的证明策略,并在证明过程中自动应用这些策略。目前,ToRA...

Read More
2023-10-23 talkingdev

Hugging Face Hub发布Math Mistral模型,助力数学与推理能力的提升

近日,人工智能技术公司Hugging Face Hub发布了一款名为Math Mistral的模型,该模型针对数学及推理能力进行了训练,具备强大的能力和广泛的应用场景。 Math Mistral是一种基于自然语言处理技术的模型,它可以帮助用...

Read More
2023-10-23 talkingdev

MathGLM仍然无法解决数学问题

尽管有人声称MathGLM可以解决数学问题,但实际上它仍然无法胜任这项任务。这一现象凸显了仅仅依赖于大型语言模型的局限性。近年来,基于神经网络的自然语言处理技术取得了长足进步,但在某些特定领域,仍然需要更为...

Read More
2023-10-18 talkingdev

Morph Labs发布个人AI证明助手

证明助手工具(如Lean)是在计算机上形式化和证明数学概念的神奇方法。Morph Labs正在与许多团体合作建立开放式的证明助手。其第一个模型基于Mistral,极为高效,并有望帮助开启更多数学知识。

Read More
2023-10-18 talkingdev

论文:Llemma-面向数学的开放式语言模型

在自然语言处理领域,语言模型已经取得了重大的突破,但是在数学领域,语言模型的应用却相对较少。Llemma是一种面向数学的开放式语言模型,它基于GPT-3模型,可以处理数学领域的自然语言文本,如数学公式、定理和证...

Read More
2023-10-11 talkingdev

论文:提升大型语言模型(LLMs)的数学推理能力

研究人员正在探究数据增强技术对提高大型语言模型(LLMs)数学推理能力的影响。他们通过增强现有数据集中的查询,创建了一个新的数据集AugGSM8K,并开发了一个名为MuggleMath的模型。数据增强技术能有效提升模型的数...

Read More
2023-10-11 talkingdev

提升文本生成中扩散模型的速度

研究人员推出了一种用于文本生成中的扩散模型的新技术。通过使用软吸收状态,他们改善了模型处理离散文本变化的方式,从而加快了学习速度和采样速度。扩散模型是一种能够模拟物质扩散过程的数学模型,能够以一种高效...

Read More
2023-09-27 talkingdev

范畴理论与机器学习

范畴理论是对关系的抽象研究,通常被用作数学中的额外抽象层。这使得它具有强大的工具来研究机器学习。范畴理论能够提供一种全新的视角来理解和解决机器学习中的问题,通过更高层次的抽象,我们可以更深入地理解机器...

Read More
2023-09-21 talkingdev

告诉AI“深呼吸”,数学成绩飙升

Google开发了一种名为OPRO(Optimization by PROmpting)的技术,通过人类风格的鼓励,如“让我们一步一步思考”,来提高LLMs的数学技能。这种方法实际上是在AI的计算过程中注入了人类的思维方式,使其在解决问题时更...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page