FastEdit是一款旨在帮助开发者使用单一命令高效地向大型语言模型中注入新鲜和定制化知识的工具。这款工具已在GitHub上开源,可以让开发者在大型语言模型中更便捷地添加新知识,进而提高模型的性能和适用性。无论是进...
Read MoreGoogle NotebookLM是一款利用语言模型的力量与现有内容结合,以更快获得关键洞察的笔记应用。Google将之描述为一个可以总结事实、解释复杂想法并构思新连接的虚拟研究助手。NotebookLM的源定位功能可以减少模型的错...
Read More研究人员已经开发出一种名为TIM的新方法,通过向其展示正确和错误的翻译示例,来教导语言模型更好地翻译文本。这种方法在WMT2022数据集上的测试表明,其性能超过了现有的翻译技术。TIM的出现,无疑为机器翻译领域带...
Read MoreGGML是一个开源库,用于在低资源设备上运行语言模型。最近,团队已经进行了并行推理的MPI(Message Passing Interface)工作。现在,随着这些变化的实施,团队正在努力在树莓派集群上推理llama 65B模型。这一行动可...
Read More本文介绍了一个名为INT-FP-QSim的开源模拟器。这款模拟器的主要功能是测试大型语言模型和视觉变换器在不同数值精度级别下的运行效果。大型语言模型和视觉变换器在AI领域具有广泛的应用,然而,由于其复杂的计算需求...
Read More美国国防部正在成功地测试用于军事任务的大型语言模型(LLMs),旨在加速数据请求并生成新颖的解决方案。五角大楼正在与像Scale AI这样的科技初创公司合作,实验五个LLMs。这是他们在军事领域中更广泛的数据整合和数...
Read More谷歌正在梅奥诊所测试其AI工具——Med-PaLM 2,这是一款专为解答医疗信息查询而设计的工具。作为语言模型PaLM 2的一个变种,Med-PaLM 2在推理、达成共识的答案和理解方面展现出了令人鼓舞的结果,尽管在准确性上还存在...
Read More最近一份技术报告详细介绍了FLACUNA,这是一种可以提高问题解决能力的语言模型。FLACUNA是通过使用一个名为FLANMINI的自定义指令数据集对VICUNA进行微调而创建的,VICUNA是另一种大型语言模型。FLACUNA的出现,对于...
Read More