模型的相关内容 - 漫话开发者

2024-02-27 talkingdev

谷歌承认AI生成图像失控

谷歌承认其AI模型Gemini存在问题。该模型会向历史图像中注入不适当的多样性，反映出训练数据中存在偏见的问题。这个缺陷引发了有关科技领域中多样性、公平性和包容性的讨论。谷歌暗示将来会做出改进，但没有就AI在生...

2024-02-27 talkingdev

R2R是一个半正式框架，旨在快速部署生产级RAG系统。它旨在弥合实验性RAG模型和生产就绪系统之间的差距。R2R为在生产环境中部署、适应和维护RAG管道提供了简单的路径。现已提供短视频演示。

2024-02-27 talkingdev

Mistral AI推出了一款名为Mistral Large的新型语言大模型，以与GPT-4和Claude 2等顶级模型竞争。该公司还推出了一项名为Le Chat的新服务，以与ChatGPT竞争。通过该公司的API，访问Mistral Large的成本为每百万输入令...

2024-02-26 talkingdev

本文讨论依赖于真实标注数据的评估指标。它探讨了通用和RAG特定的评估指标。所有指标都带有Python实现或指向一个Hugging Face模型卡的链接。

2024-02-26 talkingdev

去年，Mozilla担任了效率挑战的可扩展评估者。它确保参赛者遵守比赛规则并评估模型性能。这篇文章是语言模型评估和竞争性训练方案的良好介绍。本次比赛对推动自然语言处理技术的发展具有重要意义。

2024-02-26 talkingdev

最近在《自然》杂志上介绍了一种名为FunSearch的方法，它使用大型语言模型在数学和计算机科学中进行新的发现。该方法将创造性的LLM与评估器配对，以产生可验证的解决方案，并在难以解决的cap set 和bin-packing问题...

2024-02-26 talkingdev

MMedLM 2是一种开创性的多语言语言模型，专为医学领域量身定制。它是在覆盖六种语言的新的255亿令牌语料库上训练的。在医学问答任务中，MMedLM 2的表现优于其他模型，包括GPT-4。

2024-02-26 talkingdev

谷歌工程师和科学家开发了一个新的代码库，名为CPP Gemma推理引擎。与llama.cpp类似，该代码库允许在SIMD CPU架构上进行推理。该工具的目的是鼓励实验和使用昨天发布的Gemma模型。