漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-01 talkingdev

Maestro引领下一代移动UI自动化技术

近日,Maestro作为下一代移动UI自动化工具,正式亮相。该工具旨在通过先进的自动化技术,显著提升移动应用的用户界面测试效率。Maestro不仅支持多种移动操作系统,还能无缝集成到现有的开发流程中,极大地简化了测试...

Read More
2025-02-28 talkingdev

CoT-UQ框架:为大型语言模型引入链式思维不确定性量化

近日,GitHub上发布了一个名为CoT-UQ的创新框架,该框架旨在为大型语言模型(LLM)提供响应层面的不确定性量化。CoT-UQ通过集成链式思维(Chain-of-Thought, CoT)推理,能够更精确地评估模型在生成响应时的置信度。...

Read More
2025-02-28 talkingdev

Meta发布新一代混合现实眼镜Aria gen 2,拓展机器人技术应用

Meta近日发布了其新一代混合现实眼镜Aria gen 2,这款设备以其强大的视觉能力引起了广泛关注。Aria gen 2不仅在虚拟现实和增强现实领域表现出色,还在机器人技术等多个领域展现了广泛的应用潜力。其先进的视觉系统能...

Read More
2025-02-27 talkingdev

Probly:浏览器中的电子表格、Python与AI集成工具

Probly是一款创新的浏览器工具,将电子表格、Python编程和AI功能无缝集成,为用户提供强大的数据处理和分析能力。通过Probly,用户可以直接在浏览器中创建和编辑电子表格,同时利用Python脚本进行复杂的数据操作和自...

Read More
2025-02-27 talkingdev

Magma:多模态AI agent的基础模型在Hugging Face Hub发布

近日,Hugging Face Hub发布了一款名为Magma的新型基础模型,专为视觉agent任务设计,尤其在视频理解和UI导航方面表现出色。Magma模型以其易于调优的特性,为开发者提供了强大的工具,以应对复杂的多模态AI任务。该...

Read More
2025-02-27 talkingdev

《2025流程编排与自动化状态报告》揭示企业自动化增长趋势

根据Camunda发布的《2025流程编排与自动化状态报告》,在最近一年内,87%的企业已经利用流程自动化来推动业务增长。这项基于800位IT决策者、商业领袖及软件架构师的调查结果显示,人工智能正推动自动化的进一步发展...

Read More
2025-02-26 talkingdev

Vision Language Models或将取代OCR技术

随着Vision Language Models(VLMs)的快速发展,传统的光学字符识别(OCR)技术正面临被取代的可能。VLMs结合了计算机视觉和自然语言处理的能力,能够更准确地理解和解析图像中的文本内容。与OCR相比,VLMs不仅能识...

Read More
2025-02-25 talkingdev

Browser Use开源Web Agents,推动自动化浏览技术发展

近日,Browser Use (YC W25) 宣布推出其开源项目——Web Agents,旨在通过自动化技术提升用户在浏览器中的操作效率。该项目基于先进的LLM和agent技术,能够模拟人类在网页上的操作行为,如点击、滚动、填写表单等。通...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page