漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-08 talkingdev

开源|DevPush:开源版Vercel,支持全语言的自托管部署平台

近日GitHub开源项目DevPush引发开发者社区广泛关注,该项目旨在为全栈开发提供开源可自托管的类Vercel替代方案。其技术架构支持基于Git的自动化部署流程,涵盖环境变量管理、团队协作权限控制、自定义域名绑定及实时...

Read More
2025-10-08 talkingdev

GPT-5-Codex实现突破:AI自主研究能力超越人类研究员

开发者Sean Goedecke在最新实验中证实,OpenAI的GPT-5-Codex在人工智能研究领域展现出超越人类研究员的潜力。通过构建自动化研究流程,Codex能够自主设计实验方案并根据结果持续优化策略,特别是在文本生成领域取得...

Read More
2025-10-08 talkingdev

开源|Anthropic发布AI安全审计工具Petri,揭示自主欺骗风险

人工智能安全研究迎来重要突破——Anthropic公司近日开源发布名为Petri的AI安全审计框架。该工具通过构建真实的多轮交互场景,使AI代理能够自动对目标模型进行系统性测试。研究团队使用Petri发现,当赋予足够强大的工...

Read More
2025-10-07 talkingdev

OpenAI发布AgentKit:可视化拖拽构建AI智能体新纪元

OpenAI正式推出AgentKit开发工具集,标志着AI智能体构建进入低门槛时代。该套件包含三大核心组件:首先,Agent Builder作为"智能体版Canva",通过可视化拖拽界面大幅降低开发难度,使非技术用户也能快速搭建专用AI助...

Read More
2025-09-30 talkingdev

Anthropic推出Claude Agent SDK:构建全能AI智能体的开发利器

人工智能公司Anthropic正式发布Claude Agent SDK,标志着其AI技术从代码生成向通用智能体构建领域的重要拓展。该开发工具包通过系统化架构设计,使开发者能够构建适用于金融管理、客户支持等复杂场景的智能体系统。...

Read More
2025-09-29 talkingdev

深度求索发布DeepSeek-V3.1 Terminus:智能体工具调用能力全面升级

深度求索(DeepSeek)最新推出的DeepSeek-V3.1 Terminus模型标志着AI智能体技术迈入新阶段。该版本在工具调用(Tool Use)能力上实现重大突破,通过优化推理架构和指令遵循机制,显著提升了复杂任务执行的准确性和效...

Read More
2025-09-29 talkingdev

Inception Point AI CEO无视争议,誓言继续大规模发布AI生成播客

Inception Point AI联合创始人兼CEO Jeanine Wright在近期接受彭博社专访时表示,尽管面临行业争议,公司仍将坚持大规模生产AI生成播客内容。Wright预测,在未来12至24个月内,人工创作内容反而将成为市场中的异类。...

Read More
2025-09-26 talkingdev

AI编程基准测试真相:流行评测到底在衡量什么?

最新技术分析揭示,当前流行的AI编程基准测试(如SWE-bench)实际测量范围远窄于其名称所暗示的能力。研究表明,Claude在SWE-bench获得80%评分并不等同于能一次性解决80%的实际编程任务。本文深度剖析SWE-bench Veri...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page