这篇论文介绍了一种使用大型语言模型(LLMs)快速分析公司的年度报告的方法,使得理解公司的财务健康状况,甚至预测股票价格变得更加简单。LLMs可以处理大量文本信息,提炼出关键数据,使投资者能够在短时间内获取到公...
Read More近日,GitHub发布了一个名为OnPrem.LLM的新项目。这是一个简单的Python包,可以使大型语言模型更容易地在没有互联网连接的机器上运行,处理非公开或敏感数据。OnPrem.LLM旨在解决在处理敏感数据或在无互联网环境下运...
Read More本文讨论如何构建和扩展使用大型语言模型的应用程序。GitHub花费了三年时间,从想法到生产,开发了GitHub Copilot。该团队制定了一个三阶段计划进行开发:他们确定了LLM应用的有影响力的问题空间,创建了流畅的AI产...
Read More据报道,苹果正在投入数百万美元的人工智能产品研究,旨在创建一款能够自动化涉及多个步骤的任务的Siri。大部分预算都用于模型训练,这需要大量昂贵的硬件。该公司已经研究了四年的大型语言模型,但尚不清楚它在多年...
Read More这项研究探讨了大型语言模型(LLMs)解决数学问题的能力,及各种不同因素如何影响它们的能力。研究人员发现,一种名为“拒绝采样精细调整”(Rejection sampling Fine-Tuning, RFT)的方法有助于这些模型在数学上的提...
Read MoreLLM微调中心是一个包含代码和洞察的平台,专门用于微调各种大型语言模型以适应您的使用场景。不论您是开发者,还是研究人员,甚至是业务决策者,都可以在此找到有用的资源。通过微调,大型语言模型的性能可以得到显...
Read More在训练大型语言模型以理解和匹配人类价值时,我们是使用评分(rating)还是比较(ranking)作为反馈?这项研究发现,选择的方式对结果影响颇大。例如,通过比较评估时,使用排名训练的模型往往更受青睐,但在打分评...
Read More微软发布了一种名为“思想算法”(AoT)的新型AI训练方法,旨在使大型语言模型如ChatGPT的推理能力更加高效和类人化。这种新颖的AI训练方法是微软在人工智能领域的一项重要突破,表明了微软在深化机器学习和人工智能技...
Read More