漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-27 talkingdev

论文:评估GPT-4V的光学字符识别能力

本文研究了大型多模型GPT-4V在各种光学字符识别(OCR)任务中的表现,包括读取场景和手写文本,理解复杂的文档结构等。

Read More
2023-10-26 talkingdev

Promptchain推出新品,打造多样化模型的视觉提示链

Promptchain最近推出了一款新产品,名为Promptchain (Product),该产品可以用于创建多种模型的视觉提示链。视觉提示链是一种用于呈现一系列图像或文字的工具,通常用于帮助人们更好地理解复杂的概念或过程。Promptch...

Read More
2023-10-26 talkingdev

开源文本图像模型SDXL体积缩小50%、速度提升60%

研究人员发现,当前领先的开源文本图像模型SDXL在推理时间上有了显著的加速,其速度提升了60%,同时体积缩小了50%。研究人员声称,在使用中,图像质量只有轻微的降低。

Read More
2023-10-26 talkingdev

互联网数据的爆炸性增长可能导致模型崩溃,ChatGPT等应用程序将受到影响

近年来,随着互联网数据的不断增长,模型崩溃成为了一个备受关注的问题。这对于像ChatGPT等应用程序来说,是一个非常大的挑战。现有的基础模型供应商已经开始寻找可能的解决方案,以克服模型崩溃带来的影响。一种可...

Read More
2023-10-26 talkingdev

Polyfire开源: 面向AI应用的一站式后端管理平台

Polyfire是一个开源的后端管理平台,为AI应用提供一站式的解决方案。它包括数据管理、模型管理、部署和监控等功能,可以帮助开发团队快速搭建和管理AI应用的后端。Polyfire支持多种框架和语言,例如PyTorch、TensorF...

Read More
2023-10-26 talkingdev

SpellTest:基于Github的AI-to-AI测试

SpellTest是基于Github的一个新项目,旨在为基于LLM的应用提供AI-to-AI测试。LLM是一种基于语言模型的学习方法,常用于在自然语言处理和计算机视觉等领域。SpellTest可以帮助开发者在应用程序中减少拼写错误,并自动...

Read More
2023-10-25 talkingdev

OpenAI能否在消费者和企业市场上取得胜利?

OpenAI目前通过ChatGPT和API赢得了消费者和企业市场,但他们能否继续这么做还不确定。OpenAI是一家人工智能研究实验室,其目标是创建安全和有益的人工智能。ChatGPT是一种语言生成模型,可以生成与给定输入相关的自...

Read More
2023-10-25 talkingdev

谷歌AI产品泄密:多模态Gemini和革命性应用原型设计功能Stubbs

谷歌将用多模态AI模型Gemini取代PaLM 2,并将其引入Makersuite,提供图像和文本识别功能。该公司还拥有一个名为Stubbs的隐藏工具,使用户可以构建和启动AI生成的应用原型。Makersuite将很快完全支持语言翻译。

Read More
  1. Prev Page
  2. 346
  3. 347
  4. 348
  5. Next Page