模型的相关内容 - 漫话开发者

2024-03-08 talkingdev

AnswerAI开源新微调工具，可在消费级GPU上训练70B参数模型

Answer AI发布了一款新的FSDP/QLoRA训练工具，可在消费级GPU上训练70B参数模型。该公司开源了代码，并使其易于本地运行或在runpod上运行。

2024-03-08 talkingdev

Inflection近日推出了一款新模型，为其个人助手Pi提供支持。该模型表现与GPT-4相当，在基准测试中具备出色的推理能力，达到了94%的成绩。Inflection声称，相对于GPT-4，该模型训练所需的计算资源仅占40%。有意思的是...

2024-03-07 talkingdev

Mistral AI推出了“le Chat Mistral”，这是一个新的多语言对话助手。它采用了其Mistral模型，并推出了企业版本，为企业提供服务。该助手可以用于客户服务、销售和支持等领域，能够通过语音和文字进行多语言交流，为用...

2024-03-07 talkingdev

Vision-RWKV将NLP中的RWKV架构应用于视觉任务，为高分辨率图像处理提供了一个高效的解决方案。RWKV是一种基于注意力机制的架构，它在处理序列数据时表现出色，而Vision-RWKV则将其成功地应用于图像领域。该模型的表...

2024-03-07 talkingdev

Anthropic发布的Claude 3是一个大型语言模型，可与GPT-4相媲美，它不仅在基准测试中表现出色，而且在交互质量上独具人类特色，具有创造性和自然性，使其成为AI与作家创意合作能力的重大进展。

2024-03-07 talkingdev

Reka的创始人、著名GPU评论家Yi Tay在一篇博客文章中概述了他们在谷歌之外训练极强语言模型的经验。主要的挑战来自于集群和硬件的不稳定性，他们还发现软件的成熟度也是一个挑战。尽管如此，他们还是成功地训练出了...

2024-03-07 talkingdev

微软发布了Orca数学问题数据集。该数据集被用于训练一些当前最先进的数学模型，现在可以被社区用于研究。

2024-03-07 talkingdev

MobileClip是一个快速的文本和图像模型，与OpenAI的原始CLIP模型性能相同，但运行速度提高了7倍。它可以在设备上用于各种视觉和语言任务。