大型语言模型的相关内容 - 漫话开发者

2023-09-28 talkingdev

QA-LoRA的智能构建和微调方法，让LLM更快更小

大型语言模型在许多设备上的运行效率受限于其庞大的计算需求。然而，一个名为QA-LoRA的新方法已经成功改变了这一局面。QA-LoRA通过巧妙地改变模型的构建和微调方式，使得大型语言模型能够在维持强大功能的同时，有效...

2023-09-26 talkingdev

本文探讨了在中期未来，由大型语言模型驱动的软件可能会是什么样子。语言模型将会显著改变我们与计算机的交互方式。当前的技术状态看似初级，但越来越明显的是，生成型人工智能无法完全替代过去几十年里出现的其他用...

2023-09-21 talkingdev

这项研究的重点是使已经擅长理解和生成文本的大型语言模型，在回答医学问题方面表现得更好。大型语言模型（LLMs）已经在很多领域包括医学领域显示出了巨大的潜力，然而，尽管如此，它们在理解和回答具体的医学问题方...

2023-09-21 talkingdev

本研究探讨了大型语言模型（LLMs）如何更好地进行序列推荐。LLMs正在许多技术领域引发革命，它们能够在如推荐下一首歌曲或下一部电影等场景中发挥重要作用。通过这种方式，我们可以创建更加智能、更加个性化的推荐系...

2023-09-21 talkingdev

亚马逊在周三的秋季硬件发布会上展示了一款全新的Alexa语音助手，它由一个大型语言模型驱动，能够理解会话性短语并做出适当的回应，更有效地解析上下文并完成多个请求。这将极大提升家庭自动化的水平。亚马逊将逐步...

2023-09-20 talkingdev

研究人员近日推出了一种名为DoLa的新方法，该方法能够帮助大型语言模型（例如与您进行聊天或撰写文章的模型）停止编造内容，而专注于事实。DoLa采用一种智能的方式比较模型内部的不同层次，以过滤出错误的信息。这是...

2023-09-19 talkingdev

像GPT-3这样的大型语言模型之所以聪明，是因为它们从大量数据中学习。那么，当新的信息与它们已经知道的信息冲突时，它们会如何反应呢？研究人员发现，这些模型可能会感到困惑，并给出错误的答案，尤其是当它们面临...

2023-09-15 talkingdev

MLPerf发布了两个基准测试套件的结果：MLPerf Inference v3.1和MLPerf Storage v0.5。前者显示了创纪录的参与度和性能提升，后者评估了机器学习训练工作负载的存储系统性能。推理基准测试套件引入了一个大型语言模型...