编码的相关内容 - 漫话开发者

2023-12-25 talkingdev

UDiffText-提高AI生成图片中的文字质量

UDiffText是一种全新的方法，可以提高AI生成图片中的文字质量。通过使用专门的文本编码器和大型数据集进行微调，UDiffText显著减少拼写错误并提高文字准确性。

2023-12-25 talkingdev

近日，一项关于单张图像快速重建3D模型的新技术取得了突破。该技术基于高斯飞溅技术，通过学习性技术将图像中的每个像素映射到一个3D高斯函数中，从而实现单张图像的3D重建。这一技术的创新点在于引入了“飞溅图像”，...

2023-12-20 talkingdev

最近的一项研究表明，与解码器相比，使用UNet编码器在扩散模型中表现更加稳定。这一发现导致了一种新的编码器传播方案，显著加快了文本到图像和文本到视频生成等任务的速度。该研究成果已在GitHub上发布。

2023-12-18 talkingdev

本文包含几个新的人工智能发展故事。这些故事涵盖了人工智能领域的竞争、行业就业现状、人工智能战略、Sourcegraph的Cody AI编码助手正式上线等。多年来致力于为其代码添加注释的工程师们为大型语言模型推理其代码提...

2023-12-11 talkingdev

最近，Mistral发布了一个使用MLX生成文本的示例，这是一种基于人工智能的技术，它可以生成高质量的自然语言文本。该示例代码可以在GitHub上找到，它展示了如何使用Mistral的MLX库来生成文本。MLX库是Mistral的核心开...

2023-12-08 talkingdev

Google的旗舰机型Gemini是一款原生多模态模型，其文本能力达到了GPT4的水平，同时还能够处理许多其他数据序列。此外，它还训练了Alpha Code 2，这是一个在代码力量比赛中排名前15%的编码器。Alpha Code 2将在12月13...

2023-12-07 talkingdev

该项目探索了视觉转换器在基于扩散的生成学习中的有效性，揭示了Diffusion Vision Transformers（DiffiT）。该模型将U形编码器-解码器架构与新型时变自注意模块相结合。DiffiT可以生成高分辨率的图像，具有非常好的...

2023-12-06 talkingdev

IMMA是一种新技术，可以为文本转图模型提供保护，以防止被恶意适应生成有害内容。IMMA是一种基于信息瓶颈原理的技术，可以将文本编码为低维向量，然后将其与图像编码结合起来，以生成所需的图像。此技术不仅可以防止...