大型语言模型(LLMs)是否具备人类般的推理能力的争论仍在进行中。一方面,有些研究显示,这些模型主要依赖于记忆和模式匹配。另一方面,也有研究显示,它们在与训练数据相关的任务中表现出色,显示出一定的推理能力...
Read More近日,GitHub发布了名为PointLLM的新工具,该工具的主要功能是帮助语言模型理解3D对象,而非仅限于文本和2D图像。这一工具的出现,标志着语言模型在处理和理解更为复杂的三维信息方面迈出了重要一步,这将极大地推动...
Read MoreRestGPT是一款旨在构建基于大型语言模型的自主控制实体的新型语言模型,其主要应用领域包括电影数据库和音乐播放器等实际应用。此模型采用先进的自然语言处理技术,将人类语言输入转化为计算机可以理解和执行的命令...
Read More这篇论文介绍了一种使用大型语言模型(LLMs)快速分析公司的年度报告的方法,使得理解公司的财务健康状况,甚至预测股票价格变得更加简单。LLMs可以处理大量文本信息,提炼出关键数据,使投资者能够在短时间内获取到公...
Read More近日,GitHub发布了一个名为OnPrem.LLM的新项目。这是一个简单的Python包,可以使大型语言模型更容易地在没有互联网连接的机器上运行,处理非公开或敏感数据。OnPrem.LLM旨在解决在处理敏感数据或在无互联网环境下运...
Read More原名为Adept的柿子科技公司,近期推出了其极其高效的8b参数模型——柿子-8B。同时,该公司也发布了推理代码。此次发布的模型和代码中包含了许多亮点,其中最引人注目的是具备70k未使用的嵌入功能,这为多模态扩展提供...
Read More本文讨论如何构建和扩展使用大型语言模型的应用程序。GitHub花费了三年时间,从想法到生产,开发了GitHub Copilot。该团队制定了一个三阶段计划进行开发:他们确定了LLM应用的有影响力的问题空间,创建了流畅的AI产...
Read More这项研究探讨了大型语言模型(LLMs)解决数学问题的能力,及各种不同因素如何影响它们的能力。研究人员发现,一种名为“拒绝采样精细调整”(Rejection sampling Fine-Tuning, RFT)的方法有助于这些模型在数学上的提...
Read More