漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-17 talkingdev

FastEdit:一款帮助开发者高效注入知识的大型语言模型工具

FastEdit是一款旨在帮助开发者使用单一命令高效地向大型语言模型中注入新鲜和定制化知识的工具。这款工具已在GitHub上开源,可以让开发者在大型语言模型中更便捷地添加新知识,进而提高模型的性能和适用性。无论是进...

Read More
2023-07-13 talkingdev

Google新应用“NotebookLM”:以源文件为基础构建自定义AI

Google NotebookLM是一款利用语言模型的力量与现有内容结合,以更快获得关键洞察的笔记应用。Google将之描述为一个可以总结事实、解释复杂想法并构思新连接的虚拟研究助手。NotebookLM的源定位功能可以减少模型的错...

Read More
2023-07-12 talkingdev

TIM新方法提升机器翻译性能,表现超过现有技术

研究人员已经开发出一种名为TIM的新方法,通过向其展示正确和错误的翻译示例,来教导语言模型更好地翻译文本。这种方法在WMT2022数据集上的测试表明,其性能超过了现有的翻译技术。TIM的出现,无疑为机器翻译领域带...

Read More
2023-07-11 talkingdev

树莓派集群上运行llama 65B模型?(GitHub议题)

GGML是一个开源库,用于在低资源设备上运行语言模型。最近,团队已经进行了并行推理的MPI(Message Passing Interface)工作。现在,随着这些变化的实施,团队正在努力在树莓派集群上推理llama 65B模型。这一行动可...

Read More
2023-07-11 talkingdev

个人设备上运行大型语言模型的开源模拟器INT-FP-QSim

本文介绍了一个名为INT-FP-QSim的开源模拟器。这款模拟器的主要功能是测试大型语言模型和视觉变换器在不同数值精度级别下的运行效果。大型语言模型和视觉变换器在AI领域具有广泛的应用,然而,由于其复杂的计算需求...

Read More
2023-07-10 talkingdev

美国国防部试验生成型AI 加快数据处理与创新解决方案

美国国防部正在成功地测试用于军事任务的大型语言模型(LLMs),旨在加速数据请求并生成新颖的解决方案。五角大楼正在与像Scale AI这样的科技初创公司合作,实验五个LLMs。这是他们在军事领域中更广泛的数据整合和数...

Read More
2023-07-10 talkingdev

谷歌的医疗AI聊天机器人正在医院进行测试

谷歌正在梅奥诊所测试其AI工具——Med-PaLM 2,这是一款专为解答医疗信息查询而设计的工具。作为语言模型PaLM 2的一个变种,Med-PaLM 2在推理、达成共识的答案和理解方面展现出了令人鼓舞的结果,尽管在准确性上还存在...

Read More
2023-07-08 talkingdev

提升LLMs问题解决能力的新技术——FLACUNA

最近一份技术报告详细介绍了FLACUNA,这是一种可以提高问题解决能力的语言模型。FLACUNA是通过使用一个名为FLANMINI的自定义指令数据集对VICUNA进行微调而创建的,VICUNA是另一种大型语言模型。FLACUNA的出现,对于...

Read More
  1. Prev Page
  2. 147
  3. 148
  4. 149
  5. Next Page