语言模型的相关内容 - 漫话开发者

2023-07-11 talkingdev

树莓派集群上运行llama 65B模型？（GitHub议题）

GGML是一个开源库，用于在低资源设备上运行语言模型。最近，团队已经进行了并行推理的MPI（Message Passing Interface）工作。现在，随着这些变化的实施，团队正在努力在树莓派集群上推理llama 65B模型。这一行动可...

2023-07-11 talkingdev

本文介绍了一个名为INT-FP-QSim的开源模拟器。这款模拟器的主要功能是测试大型语言模型和视觉变换器在不同数值精度级别下的运行效果。大型语言模型和视觉变换器在AI领域具有广泛的应用，然而，由于其复杂的计算需求...

2023-07-10 talkingdev

美国国防部正在成功地测试用于军事任务的大型语言模型（LLMs），旨在加速数据请求并生成新颖的解决方案。五角大楼正在与像Scale AI这样的科技初创公司合作，实验五个LLMs。这是他们在军事领域中更广泛的数据整合和数...

2023-07-10 talkingdev

谷歌正在梅奥诊所测试其AI工具——Med-PaLM 2，这是一款专为解答医疗信息查询而设计的工具。作为语言模型PaLM 2的一个变种，Med-PaLM 2在推理、达成共识的答案和理解方面展现出了令人鼓舞的结果，尽管在准确性上还存在...

2023-07-08 talkingdev

最近一份技术报告详细介绍了FLACUNA，这是一种可以提高问题解决能力的语言模型。FLACUNA是通过使用一个名为FLANMINI的自定义指令数据集对VICUNA进行微调而创建的，VICUNA是另一种大型语言模型。FLACUNA的出现，对于...

2023-06-30 talkingdev

本研究介绍了ChatLaw，这是一个专门为中国法律语言设计的开源语言模型，旨在助力该领域的数字化转型。ChatLaw基于深度学习技术，经过大量的法律文本训练，能够理解和生成法律相关的语言。它可以帮助律师、法官和学者...

2023-06-29 talkingdev

Salesforce发布了一组新的语言模型，该模型在GitHub上公开发布。这些模型使用4K和8K序列长度进行了15亿个令牌的训练，参数量为70亿。与目前许多开源模型如MPT或Falcon相比，这些模型具有更好或相当的性能。此外，它...

2023-06-30 talkingdev

语言模型的性能通常是在一个非常小的筛选数据集上进行评估的。这些数据的分布往往从生产环境中大大简化。使用自我监督评估，您可以使用自己的数据集来评估这些模型。您甚至可以使用从生产环境中流入的数据。