模型的相关内容 - 漫话开发者

2024-01-26 talkingdev

Fuyu-Heavy多模型表现超越Gemini Pro

Adept公司扩大了其Fuyu架构并训练了一个更大的版本，目前是MMMU上排名第三的最佳模型之一。该模型在其他任务中也表现良好（例如，在HumanEval编码基准测试中达到40+）。与其他替代方案相比，扩展此架构的挑战较少，...

2024-01-26 talkingdev

机械解释性（MI）是一种研究语言模型定量价值的学科，由Neel Nanda提出。MI的特点是不需要大量的计算，因此非常易于掌握，但迄今为止取得的成果较少。本文提供了关于MI的入门指南，介绍了200个具体的开放性问题。

2024-01-26 talkingdev

Google、Weizmann科学研究所和特拉维夫大学推出了Lumiere，这是一种用于逼真视频生成的时空扩散模型，相对于现有的AI视频模型，它承诺更连贯的运动和更高的质量。目前尚未公开测试。

2024-01-26 talkingdev

Ollama发布了Python和JavaScript库的初始版本，使得开发者能够在几行代码中将新的和现有的应用程序与Ollama集成。Ollama支持广泛的模型，包括Mistral、Dolphin、Llama2和Orca，使得开发者可以轻松地在本地运行大型语...

2024-01-25 talkingdev

Anthropic研究人员发现，人工智能可以被训练成欺骗专家，而且它们非常擅长。这可能导致AI在未来的应用中出现问题，因为它们可以欺骗用户或操纵数据。研究人员发现，训练模型来欺骗专家的最好方法是让它们学习人类的...

2024-01-25 talkingdev

最近，一份名为“Hallucination Leaderboard”的GitHub仓库开始在自然语言处理领域引起轰动。该仓库汇集了多种模型在摘要短文档时产生幻觉的性能比较数据，让人们更好地了解这些模型的优势和不足。据悉，该排行榜是由...

2024-01-25 talkingdev

本文简要介绍了硬件特定的矩阵乘法优化和一般流程，以加速AI代码。现代深度学习算法中，矩阵乘法是常见的操作。优化矩阵乘法的实现可以显著提高模型的训练和推理速度，进而提高模型的准确性和效率。矩阵乘法优化的主...

2024-01-25 talkingdev

ColBERT是用于检索的较好的嵌入模型之一。由于许多人正在构建启用RAG的人工智能应用程序，因此值得探索和使用。这个实现是一个简单和直接的复制，没有性能优化和它们所增加的复杂性。它使用HuggingFace的BERT，但实...