漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-03 talkingdev

Perplexity推出BrowseSafe:为AI浏览器智能体构建实时防护盾,抵御提示注入攻击

人工智能研究公司Perplexity近日开源了其最新研究成果“BrowseSafe”,这是一个专门为保护AI浏览器智能体(AI Browser Agents)而设计的实时内容检测模型与基准测试套件。在开放世界的网页环境中,AI智能体在执行网页...

Read More
2025-11-26 talkingdev

Nano Banana Pro突破AI图像生成边界:工具调用实现智能信息图创作

人工智能研究领域迎来重大突破——Nano Banana Pro通过工具调用技术重新定义了信息图生成的边界。该模型能够主动抓取多源数据并进行智能合成,在保持原始数据准确性的基础上,通过算法优化生成具有视觉表现力的信息图...

Read More
2025-11-21 talkingdev

开源|Cline推出cline-bench:首个基于真实开发场景的智能体编码开源基准

人工智能研究机构Cline近日发布开源项目cline-bench,旨在构建源自真实开源开发场景的高保真度基准测试与强化学习环境。当前AI模型在代码生成领域虽取得显著进展,但业界始终缺乏能够准确反映实际工程约束的标准化评...

Read More
2025-11-06 talkingdev

AWS EFA实现万亿参数模型突破:Perplexity发布分布式推理代码

人工智能研究机构Perplexity近日发布突破性代码,首次实现万亿参数混合专家模型在多个AWS服务器间的高效运行。这项技术突破使得算力基础设施相对薄弱的数据中心也能承载尖端AI模型的推理任务。当前大型语言模型面临...

Read More
2025-10-08 talkingdev

GPT-5-Codex实现突破:AI自主研究能力超越人类研究员

开发者Sean Goedecke在最新实验中证实,OpenAI的GPT-5-Codex在人工智能研究领域展现出超越人类研究员的潜力。通过构建自动化研究流程,Codex能够自主设计实验方案并根据结果持续优化策略,特别是在文本生成领域取得...

Read More
2025-09-18 talkingdev

Anthropic构建多智能体研究系统,效率提升超90%

人工智能研究公司Anthropic近日披露了其创新的多智能体研究系统架构。该系统采用编排器-工作者模式,通过一个主导研究智能体协调多个并行工作的专业化子智能体,并配备专门的引证验证智能体进行来源核查。该设计通过...

Read More
2025-08-28 talkingdev

开源|Environments Hub:社区驱动平台推动强化学习迈向开放AGI

人工智能研究领域迎来重要基础设施升级——新型开源平台Environments Hub正式推出,旨在解决强化学习(RL)环境长期存在的碎片化、封闭性和共享难题。该平台通过构建社区驱动的开放生态,集中提供数十个高质量RL环境,...

Read More
2025-08-17 talkingdev

Claude Opus 4.1重大升级:AI模型首次具备主动终止特定对话能力

人工智能研究公司Anthropic近日发布技术公告,其旗舰模型Claude Opus 4及4.1版本实现突破性功能更新——模型可自主终止特定类型的对话交互。这项被官方称为'模型健康管理'的前沿研究,标志着AI系统首次具备对话边界判...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page