漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-10 talkingdev

Mistral AI的估值飙升至60亿美元

总部位于巴黎的Mistral AI正在以60亿美元的估值进行募资,这一估值是其去年12月的三倍。作为一家领先的人工智能公司,Mistral AI的估值增长迅猛,充分反映了投资者对其技术和市场前景的高度认可。这次融资活动也进一...

Read More
2024-05-10 talkingdev

阿里巴巴推出全新大语言模型Qwen2.5

阿里巴巴云已经发布了其最新版的大语言模型 - Tongyi Qianwen Qwen2.5。这一新版本在推理、代码理解以及文本理解等方面相比于Qwen2.0有了显著的改进。Qwen2.5的推出标志着阿里巴巴在人工智能语言模型开发上取得了重...

Read More
2024-05-10 talkingdev

Gemma 10M语境探讨:语言模型的延伸途径

近期,关于如何扩展语言模型的语境的讨论引起了业界的关注。这次讨论并未提供太多的评估方法,但却对语言模型领域的探索方向提供了深度剖析。语言模型的语境是机器学习和自然语言处理中的关键组成部分,对于提高模型...

Read More
2024-05-10 talkingdev

Buzz预训练数据集发布,更准确地理解和预测人类的行为和喜好

Buzz是一个创新型的数据集,它在预训练中融合了偏好数据。该数据集的研究者们还发布了几个利用这些数据训练的模型。他们发现,这些模型在许多人类偏好任务上表现出色。Buzz数据集的出现,无疑为人工智能研究提供了新...

Read More
2024-05-10 talkingdev

一次缓存,永久有效:YOCO架构再塑GPU内存需求

YOCO架构是一种具有全局注意力能力的解码器-解码器模型,能有效地降低GPU内存需求。它包含一个自解码器和一个交叉解码器,使得关键-值对的缓存和复用更加高效。与传统的Transformer相比,YOCO在推理内存、延迟和吞吐...

Read More
2024-05-10 talkingdev

ElevenLabs预览音乐生成AI模型

人工智能初创企业ElevenLabs正在预览一种新模型,该模型可以将提示转化为歌词。该公司使用的推广策略与OpenAI为Sora AI使用的策略类似。这种新型AI模型的出现,预示着AI在音乐创作领域的应用可能会有很大的突破。Ele...

Read More
2024-05-10 talkingdev

OpenAI公布模型规范,明确模型在各种场景下的行为预期

OpenAI最近发布了一份文件,详细阐述了公司希望其模型在各种场景下的行为表现。这份文件的公布,标志着OpenAI对于模型行为的透明度和可预测性的重视。通过明确模型的行为预期,OpenAI希望能进一步优化其模型在实际应...

Read More
2024-05-10 talkingdev

Image In Words数据集,图像与文字配对的新型标签方法

近日,一种新型的标签方法被研究者利用在了图片和文字的配对上,这种方法运用了两次的VLMs(视觉语言模型)扫描,产生了极为详细的图片和文字配对数据。这些配对数据的标题比以往的任何数据集都要详细,能够帮助训练...

Read More
  1. Prev Page
  2. 290
  3. 291
  4. 292
  5. Next Page