人工智能公司Anthropic近日宣布,将不会在短期内向公众发布其最新、能力最强的模型Claude Mythos。公司声明,其决定源于对网络安全的审慎考量,认为该模型目前所展现出的网络能力过于强大,若广泛可用可能带来潜在风...
Read More埃隆·马斯克旗下的人工智能公司xAI正在为其即将推出的代码生成平台Grok Build开发一套基于积分的定价模型。该平台将同时提供本地命令行界面和远程网页界面,旨在为开发者提供灵活的开发环境。Grok Build的核心创新之...
Read More近日,一个名为Advanced Mac Substitute的开源项目引发了技术社区的广泛关注。该项目并非简单的模拟器,而是对上世纪80年代经典Mac OS操作系统在API级别的重新实现。其核心目标是在现代硬件和操作系统上,通过提供一...
Read More近期,一篇题为《Mythos之后:AI网络安全的锯齿状前沿》的技术博客引发了广泛讨论。文章核心观点指出,在AI驱动的网络安全领域,真正的护城河并非单一模型的能力,而在于整个系统架构。值得注意的是,文中提及不仅大...
Read More加州大学伯克利分校的研究团队近日发表博客文章,详细阐述了他们在构建可信赖的AI智能体基准测试方面取得的突破性进展。文章指出,当前许多流行的AI智能体基准测试存在设计缺陷,容易被特定策略“破解”或产生误导性结...
Read MoreAI搜索与问答平台Perplexity近日宣布,通过与开放式金融数据网络Plaid深度集成,正式推出全新的“个人金融”服务。这标志着Perplexity从一个提供投资组合追踪的附加功能,全面升级为一个集成的个人金融中心。用户现在...
Read More近日,GitHub上出现了一个名为“reverse-SynthID”的开源项目,引发了科技社区的高度关注。该项目旨在对谷歌DeepMind旗下Gemini模型所采用的SynthID图像水印检测技术进行逆向工程分析。SynthID是谷歌为应对AI生成图像...
Read More近期,一项针对Claude Code Review系统的实际测试揭示了其在自动化代码审查领域的最新进展与应用潜力。该系统采用创新的多智能体并行处理架构,通过多个专门化智能体协同工作,对代码进行多轮验证,并设定80%置信度...
Read More