漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-12 talkingdev

YoloE:实现实时开放词汇检测的小型视觉模型

YoloE 是一种创新的小型视觉模型,能够通过多种方式进行提示,以实现开放词汇检测。这意味着用户可以使用类别、图像和文本来决定模型应该检测的内容。特别值得一提的是,YoloE 的运行速度高达 300 帧每秒(fps),使...

Read More
2025-03-12 talkingdev

OpenAI推出全新AI智能体构建工具包

OpenAI近日发布了一系列新工具,包括API和智能体SDK,旨在帮助开发者更轻松地构建AI智能体。该工具包集成了网络和文件搜索功能、计算机使用能力以及可观察性工具,显著简化了智能体的编排和任务自动化流程。这些新工...

Read More
2025-03-10 talkingdev

STORM模型通过Mamba适配器提升长视频理解能力

在视频理解领域,大多数模型通常逐帧处理视频数据,这使得处理时间相关的问题变得具有挑战性。STORM模型通过引入Mamba适配器,增加了时间注意力操作,从而显著提升了长视频的理解能力。与Qwen模型相比,STORM在处理...

Read More
2025-03-08 talkingdev

Strobelight:基于开源技术构建的性能分析服务

近日,一款名为Strobelight的性能分析服务引起了技术界的广泛关注。该服务基于开源技术构建,旨在为开发者提供高效、精准的性能分析工具。Strobelight通过集成多种开源组件,能够实时监控应用程序的运行状态,帮助开...

Read More
2025-02-26 talkingdev

基于DiNO 2的视线估计算法在GitHub开源,助力商业与安全应用

近日,一款基于DiNO 2的视线估计算法在GitHub上开源,该算法能够高效地估计人们的视线方向,为商业、制造业和安全领域提供了重要的技术支持。视线估计技术通过分析人眼的注视点,可以广泛应用于零售场景中的消费者行...

Read More
2025-02-24 talkingdev

STeCa框架:提升LLM Agents在长期任务中的表现

近日,研究人员推出了一种名为STeCa的创新框架,旨在通过自动识别和纠正次优行动来提升LLM Agents在长期任务中的表现。该框架的核心在于其能够对LLM Agents的每一步行动进行校准,从而确保在复杂的长期任务中,每一...

Read More
2025-02-15 talkingdev

AI agent使用与滥用的检测技术引发关注

随着AI agent技术的快速发展,其应用场景日益广泛,但同时也带来了潜在的滥用风险。近期,业界开始聚焦于如何有效检测AI agent的使用与滥用行为。通过结合LLM、embedding、LoRA和RAG等先进技术,研究人员正在开发更...

Read More
2025-02-13 talkingdev

PgAssistant:开源工具助力开发者优化PostgreSQL性能

近日,一款名为PgAssistant的开源工具正式发布,旨在帮助开发者更好地理解和优化PostgreSQL(PG)数据库的性能。PgAssistant通过提供详细的性能分析报告和优化建议,使开发者能够快速定位数据库中的性能瓶颈,并采取...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page