漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-13 talkingdev

OpenAI 推出可定制的 GPTs

OpenAI 推出可定制的 ChatGPT (GPTs),允许用户无需编码即可为特定任务定制 AI。即将推出的 GPT Store 将允许共享和赚取这些定制的 GPTs,关注隐私、安全和在现实世界中扩大效用。企业可以部署仅供内部使用的 GPTs,...

Read More
2023-11-09 talkingdev

基于Transformer扩散模型的训练成本比基于UNet的模型便宜90%

PixArt是一种新的文本到图像模型,它使用T5文本编码、交叉注意力和扩散变压器,以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型,可以比使用UNet模型训练快90%。PixArt模型的训练...

Read More
2023-11-01 talkingdev

COMM开源,改进多模态LLMs性能

近期,研究人员深入探究了多模态大型语言模型(MLLMs)中使用的视觉编码器,并发现CLIP和DINO模型中的某些特征特别适合于详细的视觉任务。他们随后引入了COMM,一种结合了两种模型优点的策略。COMM能够显著提高LLMs...

Read More
2023-11-01 talkingdev

Phind称其模型打败GPT-4,速度等同于GPT-3.5,支持16k上下文编码

据最新消息,Phind模型在编码方面的表现已经超过了目前最强的GPT-4。该模型支持16k上下文编码,在编码速度上也不逊于GPT-3.5。Phind模型是一种基于自然语言处理技术的编码器,可以用于编写各种程序代码。该模型采用...

Read More
2023-10-19 talkingdev

Adept发布多模式LLM

Adept发布了一个极其简单(没有图像编码器)而且非常高效(超过了13B模型)的多模式模型。这篇文章概述了Adept如何评估模型的性能以及一些模型的细节。

Read More
2023-10-11 talkingdev

深度学习技术助力人类运动模式转移至机器人

研究人员已经能够通过使用深度学习编码器,将人类的运动模式转移至机器人。通常,这需要使用专门的硬件,并对其进行针对机器人的校准。结合视频基础的运动捕捉技术,未来可能会有更酷的项目出现。传统的技术需要使用...

Read More
2023-10-06 talkingdev

Anthropic公司的下一步:朝向可解释性的发展

机械可解释性是通过将神经网络分解为更可解释的子部分来理解神经网络的过程。不幸的是,神经元本身往往不可解释。有一些深层次的原因,如叠加,导致了这个挑战。Anthropic公司的这项工作使用稀疏自编码器从一层Trans...

Read More
2023-09-29 talkingdev

论文:VQ-VAE的简化,新方案提出简易量化计划

向量量化变分自编码器(VectorQuantized-VAEs)通常被视为在学习特定离散表示(例如,令牌或代码)时的最新技术。然而,它们通常复杂且脆弱。一篇新的论文提出了一种简单的量化方案,消除了代码本崩溃和复杂的设备,...

Read More
2023-09-27 talkingdev

Vizro:创建模块化数据可视化应用的工具包

Vizro是一个用于创建模块化数据可视化应用的工具包。它允许用户在不需要高级编码或设计经验的情况下,在几分钟内创建自定义仪表板。Vizro支持使用Pydantic模型,JSON,YAML,Python字典等编写的配置。扩展功能也是可...

Read More
2023-09-20 talkingdev

LayoutNUWA-使用LLM生成优化网页布局

在网上创建引人注目的设计对于吸引用户的兴趣和帮助他们理解信息非常重要。这种新方法,被称为LayoutNUWA,通过使用语言模型将编码指令转化为出色的布局,使这些设计更加智能。LayoutNUWA的核心在于,它通过理解编程...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page