人工智能研究公司Perplexity近日开源了其最新研究成果“BrowseSafe”,这是一个专门为保护AI浏览器智能体(AI Browser Agents)而设计的实时内容检测模型与基准测试套件。在开放世界的网页环境中,AI智能体在执行网页...
Read More近期,一项由AI智能体主导的安全审计在区块链智能合约中发现了价值高达460万美元的潜在安全漏洞。这一事件凸显了人工智能技术在提升区块链安全领域的巨大潜力。传统的智能合约审计通常依赖于人工专家,过程耗时且可...
Read More随着AI智能体技术的快速发展,其在自动化任务处理、复杂决策支持等方面展现出前所未有的能力。然而,将AI智能体应用推向生产环境时,若缺乏严谨的评估体系,极易导致性能不稳定、成本失控及用户体验下降等风险。Weig...
Read More近日,一个名为ENACT的新型基准测试在人工智能与认知科学交叉领域引发关注。该基准旨在通过第一人称视角的世界建模来系统评估智能体的具身认知能力。具身认知理论认为,智能体的认知过程与其物理身体及与环境的实时...
Read More随着AI智能体在软件开发领域的深入应用,如何有效配置和引导这些智能体成为开发者关注的核心技能。近期,一篇关于撰写高质量`CLAUDE.md`文件的文章在技术社区引发广泛讨论,获得了424个点赞和134条评论,凸显了行业...
Read MoreLangChain AI团队在GitHub开源了实验性项目Open Deep Research,这是一个基于LangGraph框架构建的完全开源研究助手。该系统通过规划、收集和撰写结构化Markdown报告,实现了深度主题研究的自动化流程。其核心创新在...
Read More近日,GitHub开源项目Better Agents推出了一款专注于AI智能体开发领域的CLI工具及标准化体系。该工具通过交互式命令行界面,逐步引导开发者选择编程语言、智能体框架、编码助手、大语言模型供应商及API密钥配置,显...
Read More近日,GitHub开源项目workmux引发开发者社区关注,该工具通过深度融合git worktrees与tmux窗口管理能力,构建出轻量级隔离开发环境。其核心价值在于将每个git工作树自动映射为独立的tmux窗口,使开发者能够同时开展...
Read More