模型的相关内容 - 漫话开发者

2024-01-25 talkingdev

论文：MMCbench新基准测试大型多模型

这篇技术报告介绍了MMCBench，这是一个新的基准测试，旨在测试各种任务如文本到图像和语音到文本等情况下大型多模型（LMMs）的一致性和可靠性。该测试涵盖了超过100个流行模型，旨在提高读者对这些AI系统在现实世界...

2024-01-25 talkingdev

对比偏好优化（CPO）是一种新的优化技术，现在应用于机器翻译。与DPO相比，CPO在数据效率方面更高。重要的是，该目标函数防止模型提出合理但不准确的翻译，从而使模型在WMT上取得了有竞争力的表现。

2024-01-25 talkingdev

奖励模型在RLHF中用于表示人类偏好，尽管被对齐的模型通常“破解奖励”并实现不利的性能。通过合并多个奖励模型，这些模型保持线性模式连接，得到的对齐模型被79％的人更喜欢，而不是一个对齐单一奖励模型的模型。模型...

2024-01-25 talkingdev

谷歌正在增强Chrome的功能，包括在线文本编辑助手、多标签页自动整理和基于文本到图像扩散模型的自定义主题创建器等AI功能。

2024-01-25 talkingdev

Prompt工程只是软件工程的一部分。Prompt是用自然语言编写的小程序。通过巧妙地使用词汇来猜测正确的'函数调用'，因为API未指定且在模型之间变化巨大，这是游戏的重要部分。将Prompt视为代码，允许Prompt工程师为喜...

2024-01-25 talkingdev

Lumiere是一款使用时空扩散模型进行逼真视频生成的AI视频生成器。它使用的Space-Time U-Net架构可以一次性生成整个视频的时间持续时间。它旨在处理视频中物体的位置以及物体如何移动和变化。Lumiere可以执行文本到视...

2024-01-24 talkingdev

近日，GitHub开源了MM-Interleaved模型，该模型在处理和生成交替的图文数据方面表现出色。MM-Interleaved模型能够根据输入的文本描述生成对应的图像，同时也可以从图像中提取文本。该模型使用了条件生成对抗网络（Co...

2024-01-24 talkingdev

研究人员引入了“提示高亮器”方法，它革新了多模态语言模型中的文本生成技术，使用户能够突出提示的某些部分，从而更好地控制生成的文本。这种方法提供了一种更加灵活、直观和有效的交互式控制方式，使得文本生成的结...