错误的相关内容 - 漫话开发者

2023-10-20 talkingdev

FACTCHD：检测LLM中的事实错误的基准测试

研究人员推出了FACTCHD，这是一个基准测试，旨在检测像ChatGPT这样的大型语言模型在复杂情况下产生事实错误的信息。

2023-10-13 talkingdev

这项研究探讨了在“连续学习”中面临的挑战，即模型试图在不忘记旧知识的情况下不断学习新知识，特别是在对文本进行分类时。研究介绍了一种新方法称为InfoCL，它使用特殊技术帮助模型更好地记忆和减少错误。

2023-10-13 talkingdev

研究人员开发了一种新技术，将声音信息和语言数据结合起来，纠正自动语音识别系统中的错误。该技术基于交叉模态融合，使用视觉和语言信息来提供更准确的识别结果。此外，该技术还可以提供更好的语音合成能力。研究人...

2023-09-30 talkingdev

近年来，随着“数字化转型”和“互联网+”的发展，低代码编程模型逐渐崭露头角。低代码编程模型是指采用可视化模型构建应用程序的一种方法。低代码平台提供了一种简便的方式，使得需要开发应用程序的人员可以使用拖放界...

2023-09-26 talkingdev

DeepEval是一个提供Pythonic方式进行离线评估的工具，专为LLM（语言模型）流水线设计。使用DeepEval，开发者能够在部署到生产环境之前，对其LLM流水线进行深度和全面的评估。这大大降低了生产环境中出现错误的风险，...

2023-09-20 talkingdev

研究人员近日推出了一种名为DoLa的新方法，该方法能够帮助大型语言模型（例如与您进行聊天或撰写文章的模型）停止编造内容，而专注于事实。DoLa采用一种智能的方式比较模型内部的不同层次，以过滤出错误的信息。这是...

2023-09-19 talkingdev

像GPT-3这样的大型语言模型之所以聪明，是因为它们从大量数据中学习。那么，当新的信息与它们已经知道的信息冲突时，它们会如何反应呢？研究人员发现，这些模型可能会感到困惑，并给出错误的答案，尤其是当它们面临...

2023-09-18 talkingdev

研究人员已经创建了一种名为Repilot的系统，这个系统能够使AI副驾驶在帮助程序员修复代码中的缺陷上更上一层楼。通过这种系统，AI不仅可以更好地理解程序员的问题，还可以为他们提供更准确、更具有针对性的解决方案...

2023-09-15 talkingdev

最近发布的GitHub仓库为开发者提供了一份详尽的指南，指导如何构建基于RAG（Retrieval Augmented Generation）的LLM（Language Learning Machine）应用程序。该指南详细介绍了从设计到实施的全过程，包括选择合适的...

2023-09-12 talkingdev

本文分享了七种实用模式，用于将大型语言模型（LLM）整合到系统中：性能测量、添加最新知识、微调任务、缓存以节省时间/成本、确保质量输出、错误管理以及利用用户反馈。首先，性能测量是衡量模型在实际应用中的效果...