视觉启用的语言模型(VLMs)如GPT-4o和Gemini,能够赋予自主代理人完成诸如进行购物或编辑代码等任务的能力。然而,这项工作也突出了这些代理人易受到恶意攻击的脆弱性。在现实世界中,我们必须对这些具有视觉理解能...
Read MoreWebCanvas是一个全新的框架,专门用于在动态的、实时的网络环境中评估自主Web代理Agent。该框架的出现,将为Web代理Agent的开发和应用带来革新。WebCanvas以其高度灵活和动态的特性,为Web代理提供了一个广阔的应用...
Read More近日,知名的开源平台GitHub上的Paramount项目公开了一项新的技术——LLMs(Large Language Models)的Agent精度测量。该技术旨在提升大型语言模型的代理精度,助力开发者更加准确地评估和优化模型性能。据了解,LLMs...
Read MoreDecagon正在为客户支持构建人性化的AI Agent。该公司近期从Accel获得了3000万美元的A轮融资,并从a16z获得了500万美元的种子轮融资。Decagon的产品为Eventbrite、Rippling、Webflow、BILT和Substack等公司提供全球支...
Read MoreMora是一款创新的视频生成模型,它利用多个视觉AI代理,旨在挑战OpenAI的领先模型Sora。Mora的独特之处在于其多代理系统,这使得它在视频内容生成的多样性和质量上表现出色。通过集成高级视觉处理技术和机器学习算法...
Read MoreGarple是一个在线销售短小、易于发音的.com域名的网站,这些域名非常适合作为初创公司的名称。令人惊奇的是,该网站上所有的代码都是由一个AI编码代理完成的。这标志着人工智能在编程领域的应用已经步入了一个新的阶...
Read MorePipecat是一个构建语音和多模式对话代理的框架。这个框架使开发者能够更便捷地创建和管理语音交互系统。多模式对话代理则是指可以处理多种类型输入(如文字、语音、图像等)的人工智能系统。Pipecat不仅适用于创建语...
Read More近日,GitHub上出现了一个名为Memary的新项目。该项目允许Agent在知识图谱中存储大量信息,通过我们的记忆模块推断用户知识,只检索与结果相关的信息。Memary的核心是其强大的知识图谱,这是一种可以存储和组织大量...
Read MoreAIOS是一个创新型的操作系统,它通过将大型语言模型嵌入到操作系统中,作为系统的核心'大脑',从而赋予了操作系统全新的生命力。与传统操作系统相比,AIOS通过深度学习和自然语言处理技术,能够更加智能地理解用户需...
Read MoreLocalSearch 是一个基于LLM Agents的完全本地运行的搜索引擎。该技术允许用户在不依赖外部服务器的情况下,实现高效的本地数据检索。这一创新性项目已经在GitHub上开源,开发者可以自由地下载和使用。LocalSearch 的...
Read More