微软在第14届Ability Summit上宣布了一系列面向无障碍性的更新,包括面向残障开发人员的新Azure AI功能,面向语言障碍者的“Speak For Me”功能的预览版,Copilot的新技能和心理健康工具包。
Read MoreModular推出了一款名为MAX的工具包,可大大简化和加速AI部署。现在可用。MAX提供了一个简单易用的接口,可以在几分钟内为任何深度学习模型构建和部署一个API。它还为开发人员提供了一个可扩展的插件系统,以便更轻松...
Read MorePhidata是一个使用函数调用构建AI助手的工具包。它不仅可以帮助开发者更快地构建AI助手,还可以通过模块化设计轻松扩展其功能。Phidata基于Python语言,支持各种功能,包括自然语言处理、语音识别和图像识别。它还提...
Read More排线检测是在图像或PDF中在文本行周围放置一个边界框的过程。Surya是一个非常强大的多语言排线检测模型,并已在GitHub上开源发布。该模型可以识别多种语言,包括中文、英文、法文、德文和印地文等,并且可以在不同的...
Read More据报道,作为iOS 18的一部分,苹果计划在WWDC上宣布一系列基于生成式AI的新工具。这些新工具将包括Siri的改进版本、Xcode的新版本以及Apple Music中用于自动创建播放列表的工具。该技术还将用于解决AppleCare的问题...
Read More随着强大的新视觉模型的出现,许多团队正在尝试构建使用视觉与Web元素交互的代理程序。Tarsier工具包介绍了一套标准工具(例如元素标记),您可以使用任何视觉系统来理解网页并执行操作。它还包括用于非视觉语言模型...
Read MoreRoboflow是一个计算机视觉工具包,通过可组合的代码片段使应用程序开发更加容易。现在,随着GPT-4 Vision进入OpenAI API,Roboflow团队已经制作了一些演示,展示如何与segment anything和DINO一起使用它。
Read More