漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-06 talkingdev

Nous Research发布Hermes 2.5视觉模型

Nous Research发布了Hermes 2.5视觉模型,该模型基于最佳的7B语言模型和SigLIP集成,是一种强大的新型开源文本和视觉模型,可在消费级硬件上运行。这里的一个很酷的创新是集成函数调用。由于存在幻觉问题,该模型仍...

Read More
2023-12-05 talkingdev

谷歌基于非英语查询存在不一致问题,推迟Gemini的发布时间

谷歌将推迟Gemini的发布时间,从下周推迟到明年一月份。Gemini是谷歌的下一代基础模型,由于AI在处理非英语查询方面存在一致性问题而导致推迟。

Read More
2023-12-05 talkingdev

万能GPT来袭,美国政府与英特尔启动ScienceGPT训练计划

近日,美国政府与英特尔公司合作启动了一个名为ScienceGPT的训练计划。该计划旨在训练一个万亿参数的GPT模型,以便提高自然语言处理的效率和精度。GPT(Generative Pre-trained Transformer)是一种基于Transformer...

Read More
2023-12-05 talkingdev

SAFE:一种用于模式识别的融合框架开源

SAFE是一种新的模式识别融合框架,它结合了预训练的视觉和语言模型,使用RGB帧、事件流和语义标签进行融合。该框架能够通过各种传感器收集的数据来识别和理解环境中的对象和场景,具有广泛的应用前景。在实现过程中...

Read More
2023-12-05 talkingdev

使用大模型初始化小模型的简单方法

在知识蒸馏和初始化方面已经做了大量的工作,例如“彩票假设”。这项工作提供了一种简单的机制,可以从一个更大的模型中初始化一个更小的模型。这显著提高了较小模型的性能。

Read More
2023-12-05 talkingdev

论文:无注意力的扩散模型

现代大多数扩散模型都使用了注意力机制,但并非所有模型都如此。最近,对状态空间的兴趣浪潮已经传到了扩散模型中,这为理论加速和有趣的应用开辟了道路。扩散模型是一种机器学习模型,用于对自然界中的信号进行建模...

Read More
2023-12-05 talkingdev

StyleGAN-嵌入式个性化图像生成技术

一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型,提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性,更好地满足用户的需求。

Read More
2023-12-05 talkingdev

OpenAI的GPT商店延迟至明年发布

由于一些意外情况导致公司忙碌,OpenAI的GPT商店将推迟到明年发布。GPT商店是一个在线平台,允许用户购买和使用OpenAI的自然语言处理模型。该平台旨在帮助研究人员、开发人员和企业更轻松地访问这些模型,从而加速AI...

Read More
  1. Prev Page
  2. 327
  3. 328
  4. 329
  5. Next Page