漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-10 talkingdev

OpenAI宣布GPT-5模型政治偏见降低30%,应对敏感提示更稳健

OpenAI最新发布的GPT-5模型在政治偏见控制方面取得突破性进展。根据该公司与Axios共享的研究数据,GPT-5即时版(Instant)和思考版(Thinking)相较于前代模型,政治偏见水平降低了30%。这一改进源于模型架构的优化...

Read More
2025-10-08 talkingdev

GPT-5-Codex实现突破:AI自主研究能力超越人类研究员

开发者Sean Goedecke在最新实验中证实,OpenAI的GPT-5-Codex在人工智能研究领域展现出超越人类研究员的潜力。通过构建自动化研究流程,Codex能够自主设计实验方案并根据结果持续优化策略,特别是在文本生成领域取得...

Read More
2025-09-24 talkingdev

GPT-5-Codex正式上线OpenAI Responses API,开发者可集成最新代码生成模型

OpenAI宣布其新一代代码生成模型GPT-5-Codex已正式集成至Responses API服务中,同时支持通过API密钥在Codex命令行界面调用。该模型并非现有模型的直接替代品,而是经过专项优化的版本,需结合特定提示词指南以发挥最...

Read More
2025-09-19 talkingdev

GPT-5重大更新:模型具备时间感知能力,安全测试面临新挑战

OpenAI最新发布的GPT-5 API展现出突破性特性——该模型成为首个具备实时时间感知能力的大型语言模型。这一技术演进引发学术界高度关注,因为当模型知晓当前日期时,能够识别出自身正处于测试环境中。研究表明,AI模型...

Read More
2025-09-18 talkingdev

Tau²基准测试揭秘:简单提示词改写竟让GPT-5-mini性能飙升22%

Quesma实验室最新发布的Tau²基准测试研究表明,通过精细化提示词工程可显著提升轻量级AI模型在工具调用场景中的表现。该团队针对GPT-5-mini模型进行提示词重构后,在模拟真实工具使用场景的基准测试中成功率提升超20...

Read More
2025-09-18 talkingdev

谷歌与OpenAI编程AI在国际大学生程序设计竞赛中表现超越人类选手

在2025年国际大学生程序设计竞赛(ICPC)世界总决赛期间,OpenAI的GPT-5和谷歌的Gemini 2.5 Deep Think两大前沿AI系统在独立测试中取得突破性表现。尽管未与人类队伍同台竞技,但这些企业级AI工具在ICPC官方规则和监...

Read More
2025-09-16 talkingdev

OpenAI发布GPT-5-Codex升级版:编程助手迎来革命性进化

OpenAI正式推出GPT-5-Codex,这是专为Codex智能编程代理系统优化的增强版本。新版本在实时协作、独立任务处理和多平台适配方面实现重大突破,支持终端、IDE、网页及移动端全场景编程。升级包含全新CLI工具链、智能ID...

Read More
2025-08-28 talkingdev

重磅更新!Codex集成GPT-5推出多款开发者工具

开发平台Codex今日宣布推出系列重大更新,全面整合GPT-5技术能力。新版本包含针对主流代码编辑器的扩展插件(支持Cursor、VSCode、Windsurf等),显著提升的本地环境CLI工具链,以及突破性的混合任务管理架构。最值...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page