模型的相关内容 - 漫话开发者

2024-01-08 talkingdev

谷歌似乎正在开发付费高级版Bard AI

据报道，谷歌正在开发“Bard Advanced”，这是其Bard AI工具的增强版本，将通过付费的Google One订阅提供。这个升级版由谷歌的顶级大型语言模型Gemini Ultra提供支持，相比于目前运行在Gemini Pro上的Bard，它提供了先...

2024-01-04 talkingdev

Pykoi开源：采用RLHF提高LLMs性能

Pykoi是一个开源的Python库，旨在通过RLHF（Reinforcement Learning with Hamiltonian Flows）提高LLMs（Latent Linear Models）的性能。Pykoi是一个基于TensorFlow 2的库，提供了一系列的LLMs和RLHF的实现，可以直...

2024-01-03 talkingdev

2024年伊始：漫话LLMs和编程

在2023年，大型语言模型(LLMs)已经成为程序员的无价之宝，显著加快了代码编写速度并帮助理解复杂的API或框架。虽然在复杂的系统编程方面存在局限性，但LLMs在Python高级编程和单调任务方面表现出色，是提高生产力和...

2024-01-03 talkingdev

揭示Gemini的潜力：多模态常识推理研究

本项目介绍了对Google的Gemini进行深入分析的研究，Gemini是一种多模态大型语言模型，评估其在各种任务中的常识推理性能。该研究与其他模型进行了比较，揭示了其在跨模态知识整合方面的竞争能力。

2024-01-03 talkingdev

Llamafile-将模型和推理代码嵌入单个文件

Llamafile是一个将模型和推理代码嵌入单个便携式可执行文件的项目。此博客探讨了如何将命令行输出导入语言模型以进行进一步处理。

2024-01-03 talkingdev

MosaicBERT：针对快速预训练优化的双向编码器

BERT是一种仅有编码器的Transformer。这意味着它通常用于以嵌入形式表示自然语言，而不是用于生成文本。重要的是，它是最早用于搜索的Transformer之一，因为它可以表示查询和要检索的信息。Mosaic团队集成了FlashAtt...

2024-01-03 talkingdev

论文：微软研究使用LLM改进文本嵌入技术

微软的研究人员使用合成数据来训练基于Mistral的解码器，以改进嵌入技术。该技术是同类产品中最佳的。有趣的是，他们使用GPT-4的两步提示策略来生成合成检索训练数据。

2024-01-03 talkingdev

2023年AI探索总结：如何在个人设备上运行LLMs

本文旨在总结2023年人工智能发展的亮点。它涵盖了如何在个人设备上运行LLMs、微调模型、易受骗问题、LLM应用等方面。LLMs可以为有效使用它们的人提供显著的生活品质提升。它们实际上相当容易构建，但仍有许多未知数...