漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-19 talkingdev

React Print:打造高效PDF与打印文档的UI工具包

React Print是一个专注于构建和生成PDF及打印文档的UI工具包,提供了创建发票、文档和手册等的简单可复用组件和模板。该工具包赋予开发者对其布局的完全控制权,包括边距、页眉、页脚等。此外,React Print还允许开...

Read More
2024-03-13 talkingdev

微软AI语音工具将于今年晚些时候推出,主要面向语言障碍者

微软在第14届Ability Summit上宣布了一系列面向无障碍性的更新,包括面向残障开发人员的新Azure AI功能,面向语言障碍者的“Speak For Me”功能的预览版,Copilot的新技能和心理健康工具包

Read More
2024-03-04 talkingdev

Modular推出MAX开发者版,加速AI部署

Modular推出了一款名为MAX的工具包,可大大简化和加速AI部署。现在可用。MAX提供了一个简单易用的接口,可以在几分钟内为任何深度学习模型构建和部署一个API。它还为开发人员提供了一个可扩展的插件系统,以便更轻松...

Read More
2024-02-13 talkingdev

Phidata-构建AI助手工具包开源

Phidata是一个使用函数调用构建AI助手的工具包。它不仅可以帮助开发者更快地构建AI助手,还可以通过模块化设计轻松扩展其功能。Phidata基于Python语言,支持各种功能,包括自然语言处理、语音识别和图像识别。它还提...

Read More
2024-01-16 talkingdev

Surya开源,多语言OCR工具包提供准确的文本检测

排线检测是在图像或PDF中在文本行周围放置一个边界框的过程。Surya是一个非常强大的多语言排线检测模型,并已在GitHub上开源发布。该模型可以识别多种语言,包括中文、英文、法文、德文和印地文等,并且可以在不同的...

Read More
2024-01-08 talkingdev

苹果公司将在WWDC上推出一系列基于生成式AI的新工具

据报道,作为iOS 18的一部分,苹果计划在WWDC上宣布一系列基于生成式AI的新工具。这些新工具将包括Siri的改进版本、Xcode的新版本以及Apple Music中用于自动创建播放列表的工具。该技术还将用于解决AppleCare的问题...

Read More
2023-12-20 talkingdev

Amphion-开源多媒体资源生成工具包

Amphion是一款新的媒体生成工具包,支持音乐和语音,并且团队正在努力添加更多的模型。该工具包基于开源技术,可自由使用和修改。

Read More
2023-11-14 talkingdev

Tarsier开源,基于视觉交互的Web Agent

随着强大的新视觉模型的出现,许多团队正在尝试构建使用视觉与Web元素交互的代理程序。Tarsier工具包介绍了一套标准工具(例如元素标记),您可以使用任何视觉系统来理解网页并执行操作。它还包括用于非视觉语言模型...

Read More
2023-11-10 talkingdev

Roboflow发布GPTV示例,辅助计算机视觉应用开发

Roboflow是一个计算机视觉工具包,通过可组合的代码片段使应用程序开发更加容易。现在,随着GPT-4 Vision进入OpenAI API,Roboflow团队已经制作了一些演示,展示如何与segment anything和DINO一起使用它。

Read More
2023-11-07 talkingdev

xAI推出PromptIDE开发环境

xAI的PromptIDE是一个用于提示工程和可解释性研究的开发环境。PromptIDE是一个为AI开发人员和研究人员提供的全面的可解释性工具,旨在帮助他们更好地理解和管理AI系统。该工具包括强大的可视化和分析功能,可以帮助...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page