模型的相关内容 - 漫话开发者

2024-03-12 talkingdev

Cohere For AI发布Command-R多语言模型

Cohere For AI发布了一个30B+参数模型，该模型在10种语言的推理、摘要和问答方面非常擅长。该模型名为Command-R，是自然语言处理领域的一项重大突破。Command-R模型可以在多语言环境下进行推理和答案提取，这对于跨...

2024-03-12 talkingdev

Covariant推出了RFM-1，旨在通过利用其Brain AI平台的大规模数据收集，为机器人语言构建大型语言模型，提高机器人在各行业的决策和交互能力。这将彻底改变机器人的行业应用，为机器人开启新的聊天界面。ChatGPT将有...

2024-03-12 talkingdev

据Elon Musk在X上透露，xAI的语言模型Grok将在未来几天内开源。 Grok是xAI的一项重要技术，它基于深度学习技术，能够快速地处理自然语言，并在文本中找到有意义的信息。Grok已经在xAI内部使用了很长时间，现在将会对...

2024-03-12 talkingdev

Covariant宣布推出机器人基础模型，使机器人具备类似于人类的推理能力。这个具有80亿参数的RFM-1模型可以通过更多的数据消耗来扩展其能力。它将图像、视频、关节角度、力读数、吸盘强度等多种信息整合到其预测引擎中...

2024-03-11 talkingdev

来自不同厂商的四款新模型正在挑战GPT-4长期以来的顶尖大型语言模型的地位，展示了能力和应用方面的不断进步，但它们都没有公开许可证或透明地公开其训练数据。

2024-03-11 talkingdev

近日，研究人员提出了一种名为 ViewFusion 的新算法，旨在改善扩散模型从新的视角生成图像的方式，确保图像在不同视角下保持一致。传统的扩散模型在处理多视角图像时，往往会产生不一致性，导致图像质量下降。ViewFu...

2024-03-11 talkingdev

微软的强大DeepSpeed训练库更新了，可以让模型每个参数使用6位。这可以将推理速度提升超过2倍。

2024-03-11 talkingdev

上周，在小型GPU上训练大型模型取得了突破。这个配置展示了如何使用这些技术在消费级硬件上训练Mixtral。