漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-07 talkingdev

ChatDB发布NaturalSQL模型,Text-to-SQL指令性能达到最新水平

ChatDB发布了一系列名为NaturalSQL的模型,这些模型在Text-to-SQL指令上表现出最新的性能。NaturalSQL是一个基于自然语言处理的SQL查询生成器,能够将自然语言指令转化为SQL查询语句。这个开源项目已经在GitHub上开...

Read More
2023-12-25 talkingdev

UDiffText-提高AI生成图片中的文字质量

UDiffText是一种全新的方法,可以提高AI生成图片中的文字质量。通过使用专门的文本编码器和大型数据集进行微调,UDiffText显著减少拼写错误并提高文字准确性。

Read More
2023-12-22 talkingdev

论文:Diff-Text,无需训练的多语言场景文本生成技术

Diff-Text是一种新的无需训练的框架,可用于创建任何语言的具有文本的逼真图像。它通过使用手绘图像作为先验,增强了稳定扩散模型的多语言能力。

Read More
2023-12-19 talkingdev

谷歌发布Gemini Pro,为Vertex AI提供图像和文本处理能力

谷歌推出了Gemini Pro,这是其先进的AI模型Gemini Ultra的轻量级版本,在Vertex AI中公开预览,提供文本和图像处理能力以及可定制的上下文,适用于各种用例。Gemini Pro是一个快速而灵活的解决方案,可以自定义模型...

Read More
2023-12-15 talkingdev

Google推出Imagen2,提供文本和标志生成功能

Google推出了Imagen 2,这是一种增强的AI图像模型,可供经批准的Google Cloud Vertex AI用户使用,提供文本渲染,标志以及多语言翻译等新功能。Imagen 2可以通过Google Cloud的AutoML API和Vision API实现。该模型使...

Read More
2023-11-28 talkingdev

论文:视觉上下文提示:AI视觉任务的新时代

视觉上下文提示(Visual In-Context Prompting)是一种创新的方法,能适应各种提示和上下文,极大地提高了分割任务的性能,并在开放式挑战中展示了令人印象深刻的结果。该方法为深度学习模型提供了更多的信息,从而...

Read More
2023-11-13 talkingdev

谷歌完成5万多芯片的最大分布式LLM训练任务

谷歌利用MaxText和Jax训练技术,同时在超过5万个芯片上进行了LLM(语言模型)训练任务,保持了66%以上的利用率,成为了最佳MFU的强有力竞争者。该项目主要基于专有技术,但其中展示了一些有趣的细节,对于其他大规模...

Read More
2023-10-11 talkingdev

提升文本生成中扩散模型的速度

研究人员推出了一种用于文本生成中的扩散模型的新技术。通过使用软吸收状态,他们改善了模型处理离散文本变化的方式,从而加快了学习速度和采样速度。扩散模型是一种能够模拟物质扩散过程的数学模型,能够以一种高效...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page