近日,Maestro作为下一代移动UI自动化工具,正式亮相。该工具旨在通过先进的自动化技术,显著提升移动应用的用户界面测试效率。Maestro不仅支持多种移动操作系统,还能无缝集成到现有的开发流程中,极大地简化了测试...
Read More近日,GitHub上发布了一个名为CoT-UQ的创新框架,该框架旨在为大型语言模型(LLM)提供响应层面的不确定性量化。CoT-UQ通过集成链式思维(Chain-of-Thought, CoT)推理,能够更精确地评估模型在生成响应时的置信度。...
Read MoreMeta近日发布了其新一代混合现实眼镜Aria gen 2,这款设备以其强大的视觉能力引起了广泛关注。Aria gen 2不仅在虚拟现实和增强现实领域表现出色,还在机器人技术等多个领域展现了广泛的应用潜力。其先进的视觉系统能...
Read MoreProbly是一款创新的浏览器工具,将电子表格、Python编程和AI功能无缝集成,为用户提供强大的数据处理和分析能力。通过Probly,用户可以直接在浏览器中创建和编辑电子表格,同时利用Python脚本进行复杂的数据操作和自...
Read More近日,Hugging Face Hub发布了一款名为Magma的新型基础模型,专为视觉agent任务设计,尤其在视频理解和UI导航方面表现出色。Magma模型以其易于调优的特性,为开发者提供了强大的工具,以应对复杂的多模态AI任务。该...
Read More根据Camunda发布的《2025流程编排与自动化状态报告》,在最近一年内,87%的企业已经利用流程自动化来推动业务增长。这项基于800位IT决策者、商业领袖及软件架构师的调查结果显示,人工智能正推动自动化的进一步发展...
Read More随着Vision Language Models(VLMs)的快速发展,传统的光学字符识别(OCR)技术正面临被取代的可能。VLMs结合了计算机视觉和自然语言处理的能力,能够更准确地理解和解析图像中的文本内容。与OCR相比,VLMs不仅能识...
Read More近日,Browser Use (YC W25) 宣布推出其开源项目——Web Agents,旨在通过自动化技术提升用户在浏览器中的操作效率。该项目基于先进的LLM和agent技术,能够模拟人类在网页上的操作行为,如点击、滚动、填写表单等。通...
Read More