最近,Mistral发布了一个使用MLX生成文本的示例,这是一种基于人工智能的技术,它可以生成高质量的自然语言文本。该示例代码可以在GitHub上找到,它展示了如何使用Mistral的MLX库来生成文本。MLX库是Mistral的核心开...
Read MoreGoogle的旗舰机型Gemini是一款原生多模态模型,其文本能力达到了GPT4的水平,同时还能够处理许多其他数据序列。此外,它还训练了Alpha Code 2,这是一个在代码力量比赛中排名前15%的编码器。Alpha Code 2将在12月13...
Read More该项目探索了视觉转换器在基于扩散的生成学习中的有效性,揭示了Diffusion Vision Transformers(DiffiT)。该模型将U形编码器-解码器架构与新型时变自注意模块相结合。DiffiT可以生成高分辨率的图像,具有非常好的...
Read MoreIMMA是一种新技术,可以为文本转图模型提供保护,以防止被恶意适应生成有害内容。IMMA是一种基于信息瓶颈原理的技术,可以将文本编码为低维向量,然后将其与图像编码结合起来,以生成所需的图像。此技术不仅可以防止...
Read MoreMoMask文字转动画技术是一项新颖的技术,其作者在此领域的基础性工作已有了新的进展。他们采用了新颖的编码方法,使得最终的动画生成具有细粒度控制能力,可以更具创意地生成动画效果。此技术的优点是可以通过更改编...
Read MoreGitHub的Copilot X通过在每个阶段嵌入AI,彻底革新了软件开发。由GPT-4驱动的全新Copilot Chat实现了自然语言编码,将于2023年12月推出。面向组织代码库的Copilot Enterprise将于2024年2月发布。增强的AI安全功能以...
Read More红木研究的一项研究表明,大型语言模型(LLMs)可以掌握“编码推理”,这是一种隐写术,允许LLMs在生成的文本中嵌入中间推理步骤,使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...
Read MoreOpenAI 推出可定制的 ChatGPT (GPTs),允许用户无需编码即可为特定任务定制 AI。即将推出的 GPT Store 将允许共享和赚取这些定制的 GPTs,关注隐私、安全和在现实世界中扩大效用。企业可以部署仅供内部使用的 GPTs,...
Read MorePixArt是一种新的文本到图像模型,它使用T5文本编码、交叉注意力和扩散变压器,以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型,可以比使用UNet模型训练快90%。PixArt模型的训练...
Read More