漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-08 talkingdev

GPT-5-Codex实现突破:AI自主研究能力超越人类研究员

开发者Sean Goedecke在最新实验中证实,OpenAI的GPT-5-Codex在人工智能研究领域展现出超越人类研究员的潜力。通过构建自动化研究流程,Codex能够自主设计实验方案并根据结果持续优化策略,特别是在文本生成领域取得...

Read More
2025-10-08 talkingdev

开源|Anthropic发布AI安全审计工具Petri,揭示自主欺骗风险

人工智能安全研究迎来重要突破——Anthropic公司近日开源发布名为Petri的AI安全审计框架。该工具通过构建真实的多轮交互场景,使AI代理能够自动对目标模型进行系统性测试。研究团队使用Petri发现,当赋予足够强大的工...

Read More
2025-10-07 talkingdev

OpenAI在ChatGPT对话中内嵌应用,生态整合迈出关键一步

OpenAI近日推出全新开发者工具,允许第三方应用通过MCP连接器直接嵌入ChatGPT对话界面。在官方演示中,用户已能通过Booking.com实时搜索酒店房源,借助Zillow进行房产数据调研,并利用Canva快速生成演示文稿。这一技...

Read More
2025-10-07 talkingdev

谷歌启动专项AI漏洞赏金计划,最高奖励3万美元

谷歌正式推出针对人工智能产品的专项漏洞赏金计划,为安全研究人员发现其AI系统漏洞提供最高3万美元的奖励。该计划特别关注能诱导AI执行异常指令的“越狱行为”,反映出科技巨头对AI安全治理的重视。随着生成式AI技术...

Read More
2025-10-07 talkingdev

开源|OpenAI发布ChatKit-JS客户端库,加速AI对话应用开发

OpenAI近日在GitHub平台正式开源了ChatKit-JS项目,这是一个专为JavaScript开发者设计的对话界面开发工具包。该库封装了与OpenAI API交互的核心能力,支持实时对话流、上下文管理和多轮对话等企业级功能,可显著降低...

Read More
2025-10-07 talkingdev

OpenAI发布ChatGPT应用开发框架Apps SDK,加速AI应用生态构建

OpenAI正式推出Apps SDK开发框架,为开发者提供构建ChatGPT专属应用的核心工具链。该框架通过标准化接口封装了对话管理、上下文控制和多模态交互能力,支持快速集成知识库检索、工作流编排等企业级功能。技术文档显...

Read More
2025-10-06 talkingdev

LLM表格理解能力大比拼:11种数据格式测试结果揭晓

最新研究针对大型语言模型的表格理解能力展开系统性评测,通过向GPT-4.1-nano模型输入包含1000条员工记录的11种不同格式数据,评估其回答问题的准确率。研究结果显示,Markdown键值对格式(Markdown-KV)以最高准确...

Read More
2025-10-06 talkingdev

LoRA无憾:低秩适配技术全面匹敌全参数微调,突破大模型高效训练瓶颈

思维机器实验室最新研究揭示了低秩适配技术(LoRA)在大语言模型微调领域的突破性表现。这项发表于权威平台的研究表明,当LoRA应用于模型所有层(尤其是MLP层)且不受数据集规模限制时,其性能可完全媲美传统全参数...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page