漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-13 talkingdev

Anthropic以网络安全为由暂缓发布最强模型Claude Mythos,启动“玻璃翼项目”

人工智能公司Anthropic近日宣布,将不会在短期内向公众发布其最新、能力最强的模型Claude Mythos。公司声明,其决定源于对网络安全的审慎考量,认为该模型目前所展现出的网络能力过于强大,若广泛可用可能带来潜在风...

Read More
2026-04-13 talkingdev

xAI为即将发布的Grok Build引入积分定价系统,挑战代码生成工具市场格局

埃隆·马斯克旗下的人工智能公司xAI正在为其即将推出的代码生成平台Grok Build开发一套基于积分的定价模型。该平台将同时提供本地命令行界面和远程网页界面,旨在为开发者提供灵活的开发环境。Grok Build的核心创新之...

Read More
2026-04-12 talkingdev

开源|Advanced Mac Substitute:API级复刻80年代经典Mac OS系统

近日,一个名为Advanced Mac Substitute的开源项目引发了技术社区的广泛关注。该项目并非简单的模拟器,而是对上世纪80年代经典Mac OS操作系统在API级别的重新实现。其核心目标是在现代硬件和操作系统上,通过提供一...

Read More
2026-04-12 talkingdev

AI网络安全新视角:小型模型同样发现Mythos揭示的漏洞

近期,一篇题为《Mythos之后:AI网络安全的锯齿状前沿》的技术博客引发了广泛讨论。文章核心观点指出,在AI驱动的网络安全领域,真正的护城河并非单一模型的能力,而在于整个系统架构。值得注意的是,文中提及不仅大...

Read More
2026-04-12 talkingdev

我们如何打破顶级AI智能体基准测试?加州伯克利团队揭示可信基准构建之道

加州大学伯克利分校的研究团队近日发表博客文章,详细阐述了他们在构建可信赖的AI智能体基准测试方面取得的突破性进展。文章指出,当前许多流行的AI智能体基准测试存在设计缺陷,容易被特定策略“破解”或产生误导性结...

Read More
2026-04-10 talkingdev

Perplexity推出Plaid驱动的个人金融中心,AI助手转型全能财务仪表盘

AI搜索与问答平台Perplexity近日宣布,通过与开放式金融数据网络Plaid深度集成,正式推出全新的“个人金融”服务。这标志着Perplexity从一个提供投资组合追踪的附加功能,全面升级为一个集成的个人金融中心。用户现在...

Read More
2026-04-10 talkingdev

开源|逆向工程揭秘:开发者成功破解谷歌Gemini的SynthID水印检测机制

近日,GitHub上出现了一个名为“reverse-SynthID”的开源项目,引发了科技社区的高度关注。该项目旨在对谷歌DeepMind旗下Gemini模型所采用的SynthID图像水印检测技术进行逆向工程分析。SynthID是谷歌为应对AI生成图像...

Read More
2026-04-09 talkingdev

实测Claude代码审查:多智能体并行分析,精准捕捉关键漏洞与潜在风险

近期,一项针对Claude Code Review系统的实际测试揭示了其在自动化代码审查领域的最新进展与应用潜力。该系统采用创新的多智能体并行处理架构,通过多个专门化智能体协同工作,对代码进行多轮验证,并设定80%置信度...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page