计算机视觉的相关内容 - 漫话开发者

2023-11-10 talkingdev

Roboflow发布GPTV示例，辅助计算机视觉应用开发

Roboflow是一个计算机视觉工具包，通过可组合的代码片段使应用程序开发更加容易。现在，随着GPT-4 Vision进入OpenAI API，Roboflow团队已经制作了一些演示，展示如何与segment anything和DINO一起使用它。

2023-11-09 talkingdev

CogVLM-17B是一个开放式的视觉语言模型，具有100亿视觉参数和70亿语言参数。该模型在许多标准基准测试中表现出色，并在人类评估中表现良好。CogVLM-17B的性能优于以往的模型，将为计算机视觉和自然语言处理领域的发...

2023-11-02 talkingdev

Hugging Face Space最近发布了两项重要技术：Segment Anything和MetaCLIP，这两项技术结合了最强大的语言模型和计算机视觉技术，能够基于文本输入进行开放式分词。开放式分词是计算机视觉领域中一个新颖且令人兴奋的...

2023-10-31 talkingdev

嵌入是一种机器可读的数字列表，用于表示有关数据的某些信息。它们越来越多地通过将数据通过神经网络并查看模型的激活来获得。本文在计算机视觉任务中使用CLIP推进了这一想法，并探讨了如何使用降维来推理学习到的嵌...

2023-10-26 talkingdev

SpellTest是基于Github的一个新项目，旨在为基于LLM的应用提供AI-to-AI测试。LLM是一种基于语言模型的学习方法，常用于在自然语言处理和计算机视觉等领域。SpellTest可以帮助开发者在应用程序中减少拼写错误，并自动...

2023-10-20 talkingdev

ProductAI是一家提供人工智能（AI）解决方案的公司，日前推出了一项新技术，可通过AI生成高质量的产品照片。这项技术基于计算机视觉和机器学习，能够快速、准确地生成符合规格的产品照片。根据公司表示，这项技术不...

2023-10-20 talkingdev

Objective公司已经完成了一轮种子融资，以便为企业构建低代码多模式搜索工具包。这款工具包将使用自然语言处理、计算机视觉和语音识别技术，可以帮助企业快速构建自定义搜索引擎，减少搜索时间。Objective的目标客户...

2023-10-19 talkingdev

ChatGPT的Browse With Bing现已退出Beta测试，DALL-E 3正在进行Beta测试。这是OpenAI最近的两个重要更新，Browse With Bing是一款由OpenAI推出的基于自然语言的浏览器，用户可以通过聊天的方式寻找信息，而DALL-E 3...