漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-05 talkingdev

使用大模型初始化小模型的简单方法

在知识蒸馏和初始化方面已经做了大量的工作,例如“彩票假设”。这项工作提供了一种简单的机制,可以从一个更大的模型中初始化一个更小的模型。这显著提高了较小模型的性能。

Read More
2023-12-05 talkingdev

MaXTron,新的视频全景分割技术开源

MaXTron是一种简单而有效的统一元架构,用于视频分割。

Read More
2023-12-05 talkingdev

论文:无注意力的扩散模型

现代大多数扩散模型都使用了注意力机制,但并非所有模型都如此。最近,对状态空间的兴趣浪潮已经传到了扩散模型中,这为理论加速和有趣的应用开辟了道路。扩散模型是一种机器学习模型,用于对自然界中的信号进行建模...

Read More
2023-12-05 talkingdev

StyleGAN-嵌入式个性化图像生成技术

一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型,提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性,更好地满足用户的需求。

Read More
2023-12-05 talkingdev

MoMask-文字转动画技术开源,实现细粒度控制

MoMask文字转动画技术是一项新颖的技术,其作者在此领域的基础性工作已有了新的进展。他们采用了新颖的编码方法,使得最终的动画生成具有细粒度控制能力,可以更具创意地生成动画效果。此技术的优点是可以通过更改编...

Read More
2023-12-05 talkingdev

OpenAI的GPT商店延迟至明年发布

由于一些意外情况导致公司忙碌,OpenAI的GPT商店将推迟到明年发布。GPT商店是一个在线平台,允许用户购买和使用OpenAI的自然语言处理模型。该平台旨在帮助研究人员、开发人员和企业更轻松地访问这些模型,从而加速AI...

Read More
2023-12-05 talkingdev

OpenAI的联合创始人Sam Altman被解雇和重新雇用:采访回顾

OpenAI的前任首席执行官兼联合创始人Sam Altman在公司的董事会更迭后重返公司。在最近的一次采访中,Altman没有讨论他被解雇的原因,但分享了他的反抗感和最终接受重返公司的感受。OpenAI的最大投资者微软也计划获得...

Read More
2023-12-05 talkingdev

LLM可视化(网站)

LLM可视化是一个展示nano-gpt模型的网站,该模型有85000个参数。它展示了该模型如何将一个包含6个字母的序列按字母顺序排列。此网站可以帮助人们更好地了解和理解自然语言处理中的模型和算法。

Read More
  1. Prev Page
  2. 826
  3. 827
  4. 828
  5. Next Page