漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-18 talkingdev

AI新闻:从红到黑

本文包含几个新的人工智能发展故事。这些故事涵盖了人工智能领域的竞争、行业就业现状、人工智能战略、Sourcegraph的Cody AI编码助手正式上线等。多年来致力于为其代码添加注释的工程师们为大型语言模型推理其代码提...

Read More
2023-12-11 talkingdev

MistralMLX文本生成示例

最近,Mistral发布了一个使用MLX生成文本的示例,这是一种基于人工智能的技术,它可以生成高质量的自然语言文本。该示例代码可以在GitHub上找到,它展示了如何使用Mistral的MLX库来生成文本。MLX库是Mistral的核心开...

Read More
2023-12-08 talkingdev

Google Gemini:原生多模态模型,文本能力达到GPT4水平

Google的旗舰机型Gemini是一款原生多模态模型,其文本能力达到了GPT4的水平,同时还能够处理许多其他数据序列。此外,它还训练了Alpha Code 2,这是一个在代码力量比赛中排名前15%的编码器。Alpha Code 2将在12月13...

Read More
2023-12-07 talkingdev

DiffiT:基于扩散的视觉转换器生成高分辨率图像

该项目探索了视觉转换器在基于扩散的生成学习中的有效性,揭示了Diffusion Vision Transformers(DiffiT)。该模型将U形编码器-解码器架构与新型时变自注意模块相结合。DiffiT可以生成高分辨率的图像,具有非常好的...

Read More
2023-12-06 talkingdev

IMMA为文本转图模型提供保护

IMMA是一种新技术,可以为文本转图模型提供保护,以防止被恶意适应生成有害内容。IMMA是一种基于信息瓶颈原理的技术,可以将文本编码为低维向量,然后将其与图像编码结合起来,以生成所需的图像。此技术不仅可以防止...

Read More
2023-12-05 talkingdev

MoMask-文字转动画技术开源,实现细粒度控制

MoMask文字转动画技术是一项新颖的技术,其作者在此领域的基础性工作已有了新的进展。他们采用了新颖的编码方法,使得最终的动画生成具有细粒度控制能力,可以更具创意地生成动画效果。此技术的优点是可以通过更改编...

Read More
2023-11-17 talkingdev

谷歌AI搜索功能全球推广

GitHub的Copilot X通过在每个阶段嵌入AI,彻底革新了软件开发。由GPT-4驱动的全新Copilot Chat实现了自然语言编码,将于2023年12月推出。面向组织代码库的Copilot Enterprise将于2024年2月发布。增强的AI安全功能以...

Read More
2023-11-16 talkingdev

LLM可使用隐写术隐藏推理过程

红木研究的一项研究表明,大型语言模型(LLMs)可以掌握“编码推理”,这是一种隐写术,允许LLMs在生成的文本中嵌入中间推理步骤,使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...

Read More
2023-11-13 talkingdev

OpenAI 推出可定制的 GPTs

OpenAI 推出可定制的 ChatGPT (GPTs),允许用户无需编码即可为特定任务定制 AI。即将推出的 GPT Store 将允许共享和赚取这些定制的 GPTs,关注隐私、安全和在现实世界中扩大效用。企业可以部署仅供内部使用的 GPTs,...

Read More
2023-11-09 talkingdev

基于Transformer扩散模型的训练成本比基于UNet的模型便宜90%

PixArt是一种新的文本到图像模型,它使用T5文本编码、交叉注意力和扩散变压器,以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型,可以比使用UNet模型训练快90%。PixArt模型的训练...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page