漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-12 talkingdev

无需草稿模型,加速推测解码的新方法

语言模型推理通常较慢,因为这些模型的运行严重依赖内存。为了解决这一问题,人们引入了使用较小的草稿模型进行推测性解码,以“提前”提供给大模型的建议。这种方法效果不错,但实现起来复杂,且寻找一个好的草稿模型...

Read More
2023-09-12 talkingdev

PointLLM开源,教会语言模型理解3D形状

近日,GitHub发布了名为PointLLM的新工具,该工具的主要功能是帮助语言模型理解3D对象,而非仅限于文本和2D图像。这一工具的出现,标志着语言模型在处理和理解更为复杂的三维信息方面迈出了重要一步,这将极大地推动...

Read More
2023-09-12 talkingdev

RestGPT:基于LLM的自主控制Agent

RestGPT是一款旨在构建基于大型语言模型的自主控制实体的新型语言模型,其主要应用领域包括电影数据库和音乐播放器等实际应用。此模型采用先进的自然语言处理技术,将人类语言输入转化为计算机可以理解和执行的命令...

Read More
2023-09-08 talkingdev

论文:运用大型语言模型预测股票趋势

这篇论文介绍了一种使用大型语言模型(LLMs)快速分析公司的年度报告的方法,使得理解公司的财务健康状况,甚至预测股票价格变得更加简单。LLMs可以处理大量文本信息,提炼出关键数据,使投资者能够在短时间内获取到公...

Read More
2023-09-08 talkingdev

OnPrem:助力大型语言模型在离线环境下处理敏感数据

近日,GitHub发布了一个名为OnPrem.LLM的新项目。这是一个简单的Python包,可以使大型语言模型更容易地在没有互联网连接的机器上运行,处理非公开或敏感数据。OnPrem.LLM旨在解决在处理敏感数据或在无互联网环境下运...

Read More
2023-09-07 talkingdev

如何构建企业级LLM应用:GitHub Copilot的经验教训)

本文讨论如何构建和扩展使用大型语言模型的应用程序。GitHub花费了三年时间,从想法到生产,开发了GitHub Copilot。该团队制定了一个三阶段计划进行开发:他们确定了LLM应用的有影响力的问题空间,创建了流畅的AI产...

Read More
2023-09-07 talkingdev

苹果每天投入“数百万美元”开发对话式人工智能,旨在大幅改进Siri

据报道,苹果正在投入数百万美元的人工智能产品研究,旨在创建一款能够自动化涉及多个步骤的任务的Siri。大部分预算都用于模型训练,这需要大量昂贵的硬件。该公司已经研究了四年的大型语言模型,但尚不清楚它在多年...

Read More
2023-09-06 talkingdev

论文:提升数学技能的研究新突破

这项研究探讨了大型语言模型(LLMs)解决数学问题的能力,及各种不同因素如何影响它们的能力。研究人员发现,一种名为“拒绝采样精细调整”(Rejection sampling Fine-Tuning, RFT)的方法有助于这些模型在数学上的提...

Read More
  1. Prev Page
  2. 107
  3. 108
  4. 109
  5. Next Page