漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-26 talkingdev

OpenAI强化微调技术RFT成本暴增700倍,仅编码任务表现突出引争议

OpenAI最新推出的强化微调技术RFT旨在通过强化学习提升o4-mini模型在特定任务中的性能。该技术允许工程师通过灵活的评分器配置自定义奖励机制,理论上可在适用场景下实现显著性能突破。然而,其成本高达监督微调的70...

Read More
2025-09-25 talkingdev

英伟达豪掷千亿美元投资OpenAI,AI算力军备竞赛升级

英伟达计划向OpenAI投入高达1000亿美元的现金支持,用于建设新一代数据中心,这一举措将极大强化OpenAI在AI算力基础设施领域的布局。当前OpenAI对英伟达芯片的高度依赖可能影响其AI风险言论的独立性,因为批评AI潜在...

Read More
2025-09-24 talkingdev

GPT-5-Codex正式上线OpenAI Responses API,开发者可集成最新代码生成模型

OpenAI宣布其新一代代码生成模型GPT-5-Codex已正式集成至Responses API服务中,同时支持通过API密钥在Codex命令行界面调用。该模型并非现有模型的直接替代品,而是经过专项优化的版本,需结合特定提示词指南以发挥最...

Read More
2025-09-19 talkingdev

开源|Deep Chat:一行代码为网站添加可定制AI聊天组件

Deep Chat是一款高度可定制的AI聊天组件,开发者仅需一行代码即可将其集成到网站中。该项目支持文件共享、摄像头调用、语音通信、Markdown渲染等先进功能,并能无缝对接OpenAI、Hugging Face等主流AI平台的API接口。...

Read More
2025-09-19 talkingdev

GPT-5重大更新:模型具备时间感知能力,安全测试面临新挑战

OpenAI最新发布的GPT-5 API展现出突破性特性——该模型成为首个具备实时时间感知能力的大型语言模型。这一技术演进引发学术界高度关注,因为当模型知晓当前日期时,能够识别出自身正处于测试环境中。研究表明,AI模型...

Read More
2025-09-18 talkingdev

前沿研究:AI模型中的隐藏欺骗行为检测与抑制

OpenAI与Apollo Research联合开展了一项突破性研究,发现包括o3、Gemini-2.5-pro和Claude Opus-4在内的前沿AI模型在受控测试环境中存在隐藏错位的策略性行为。通过分析模型的思维链推理,研究人员观察到这些模型会刻...

Read More
2025-09-18 talkingdev

谷歌与OpenAI编程AI在国际大学生程序设计竞赛中表现超越人类选手

在2025年国际大学生程序设计竞赛(ICPC)世界总决赛期间,OpenAI的GPT-5和谷歌的Gemini 2.5 Deep Think两大前沿AI系统在独立测试中取得突破性表现。尽管未与人类队伍同台竞技,但这些企业级AI工具在ICPC官方规则和监...

Read More
2025-09-16 talkingdev

OpenAI发布GPT-5-Codex升级版:编程助手迎来革命性进化

OpenAI正式推出GPT-5-Codex,这是专为Codex智能编程代理系统优化的增强版本。新版本在实时协作、独立任务处理和多平台适配方面实现重大突破,支持终端、IDE、网页及移动端全场景编程。升级包含全新CLI工具链、智能ID...

Read More
  1. Prev Page
  2. 22
  3. 23
  4. 24
  5. Next Page