漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-27 talkingdev

Magma:多模态AI agent的基础模型在Hugging Face Hub发布

近日,Hugging Face Hub发布了一款名为Magma的新型基础模型,专为视觉agent任务设计,尤其在视频理解和UI导航方面表现出色。Magma模型以其易于调优的特性,为开发者提供了强大的工具,以应对复杂的多模态AI任务。该...

Read More
2025-02-26 talkingdev

Rabbit展示其AI agent控制Android应用的能力

Rabbit近日展示了其AI agent控制Android应用的能力,实现了其早期R1发布时的承诺。该AI能够执行诸如查找视频和收集鸡尾酒配料等任务,尽管目前仍存在一些效率问题。Rabbit表示将继续优化这一agent,并计划在不久的将...

Read More
2025-02-25 talkingdev

Browser Use开源Web Agents,推动自动化浏览技术发展

近日,Browser Use (YC W25) 宣布推出其开源项目——Web Agents,旨在通过自动化技术提升用户在浏览器中的操作效率。该项目基于先进的LLM和agent技术,能够模拟人类在网页上的操作行为,如点击、滚动、填写表单等。通...

Read More
2025-02-24 talkingdev

STeCa框架:提升LLM Agents在长期任务中的表现

近日,研究人员推出了一种名为STeCa的创新框架,旨在通过自动识别和纠正次优行动来提升LLM Agents在长期任务中的表现。该框架的核心在于其能够对LLM Agents的每一步行动进行校准,从而确保在复杂的长期任务中,每一...

Read More
2025-02-23 talkingdev

仅用四个数字2,如何构造任意整数?数学挑战引发热议

近日,一项关于如何仅用四个数字2构造任意整数的数学挑战在技术圈引发广泛讨论。该问题不仅考验数学家的创造力,也为算法设计和逻辑推理提供了新的思路。通过结合数学运算符、括号以及指数等工具,参与者可以尝试构...

Read More
2025-02-20 talkingdev

论文:突破极限,单向量嵌入1568个Token的技术探索

近日,一项关于表示容量极限的研究引起了广泛关注。该研究尝试将尽可能多的Token嵌入到一个固定大小的向量中,成功实现了将1568个Token压缩至单一向量。这一突破不仅展示了embedding技术的强大潜力,也为LLM和agent...

Read More
2025-02-19 talkingdev

Mastra:全新开源JS Agent框架

近日,Gatsby的开发者团队宣布推出了一款全新的开源JavaScript agent框架——Mastra。该框架旨在为开发者提供一个高效、灵活的工具,以简化复杂agent系统的构建过程。Mastra不仅支持LLM、embedding等先进技术的集成,...

Read More
2025-02-14 talkingdev

AI agent使用与滥用的检测技术引发关注

随着AI agent技术的快速发展,其应用场景日益广泛,但同时也带来了潜在的滥用风险。近期,业界开始聚焦于如何有效检测AI agent的使用与滥用行为。通过结合LLM、embedding、LoRA和RAG等先进技术,研究人员正在开发更...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page