ML的相关内容 - 漫话开发者

2024-02-12 talkingdev

如何通过qapair提示训练Mistral-7B模型以实现更好的微调

HelixML实现了一套qapair提示，从各种不同的角度提取内容，并为每个文档生成内容寻址哈希。这使得微调Mistral-7B模型的效果更好。

2024-02-09 talkingdev

一项新研究揭示了多模态大型语言模型（MLLMs）如GPT-4V的一个弱点：它们难以处理特定类型的图像-文本输入，从而导致错误。CorrelationQA是一个基准测试，旨在评估MLLM在图像可能会误导或与文本相矛盾的情况下的表现...

2024-02-08 talkingdev

针对多模态大语言模型（MLLM）中的幻觉问题，研究人员开发了MHaluBench，一个新的评估幻觉检测方法的基准。该工具可以帮助研究人员更好地评估语言模型的幻觉能力，从而有效提高模型的质量和准确性。目前，该工具已经...

2024-02-05 talkingdev

RAGs是一个基于Streamlit的应用程序，允许用户使用自然语言从数据源创建RAG流水线。用户只需描述他们想要从RAG系统中获取的任务和参数即可。RAG可以进行查询，并且它将回答关于数据的问题。

2024-02-01 talkingdev

WhisperKit是一个用Swift编写的开源库，它将OpenAI的Whisper语音识别模型与Apple的CoreML框架集成，以在Apple设备上进行高效的本地推理。它可以通过Swift Package Manager集成到Swift项目中。WhisperKit会自动下载推...

2024-01-26 talkingdev

BreezeML推出了一款AI治理平台，该平台可以帮助企业合规团队在不需要依赖数据科学团队进行手动和繁琐的协调的情况下，对其组织中的每个AI工作流指定和持续监控治理政策。

2023-12-21 talkingdev

近日，一项名为LLMLingua的新项目在GitHub上开源。该项目使用对齐后的小型语言模型检测提示中的无关标记，并实现对黑盒LLM的压缩推理，从而实现了高达20倍的压缩比，且性能损失最小。简言之，LLMLingua能够帮助开发...

2023-12-19 talkingdev

微软的Medprompt+是目前MMLU最佳提示方法。微软已发布该模板以及许多其他思路链式模板，这些模板在评估界是标准的。