漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-06 talkingdev

LLM表格理解能力大比拼:11种数据格式测试结果揭晓

最新研究针对大型语言模型的表格理解能力展开系统性评测,通过向GPT-4.1-nano模型输入包含1000条员工记录的11种不同格式数据,评估其回答问题的准确率。研究结果显示,Markdown键值对格式(Markdown-KV)以最高准确...

Read More
2025-09-30 talkingdev

ChatGPT推出即时结账功能与Agentic Commerce协议,开启AI代理购物新时代

OpenAI与支付巨头Stripe联合推出Agentic Commerce Protocol(代理商务协议),标志着AI驱动商业生态迈出关键一步。该协议通过标准化接口打通ChatGPT与商家的支付系统,实现用户与AI代理协同购物的无缝体验。技术层面...

Read More
2025-09-29 talkingdev

苹果内部测试'Veritas'聊天机器人,或为Siri AI升级铺路

据最新科技资讯披露,苹果公司正在内部测试代号为'Veritas'的专属员工聊天机器人,这被业界视为苹果对标ChatGPT的重要布局。该举措发生在苹果AI战略面临多重挑战的背景下:其Apple Intelligence功能市场反响平淡,Si...

Read More
2025-09-24 talkingdev

GPT-5-Codex正式上线OpenAI Responses API,开发者可集成最新代码生成模型

OpenAI宣布其新一代代码生成模型GPT-5-Codex已正式集成至Responses API服务中,同时支持通过API密钥在Codex命令行界面调用。该模型并非现有模型的直接替代品,而是经过专项优化的版本,需结合特定提示词指南以发挥最...

Read More
2025-09-23 talkingdev

阿里发布通义千问Qwen3-Omni:开源多模态AI模型可处理文本、音频、图像及视频输入并生成文本与语音输出

阿里巴巴正式推出通义千问Qwen3-Omni系列开源人工智能模型,该模型实现了对文本、音频、图像和视频四类模态数据的统一处理能力,并能同步生成文本与语音输出。作为中国科技企业对抗美国科技巨头的重要技术突破,Qwen...

Read More
2025-09-22 talkingdev

Dyad:开源AI应用构建平台,挑战Lovable与v0的无代码开发新选择

近日,一款名为Dyad的开源AI应用构建平台正式亮相,为开发者提供了无需编码即可创建应用程序的创新解决方案。作为Lovable和v0等知名平台的替代选择,Dyad不仅完全免费、支持本地部署,还具备高度可定制性。其核心优...

Read More
2025-09-19 talkingdev

GPT-5重大更新:模型具备时间感知能力,安全测试面临新挑战

OpenAI最新发布的GPT-5 API展现出突破性特性——该模型成为首个具备实时时间感知能力的大型语言模型。这一技术演进引发学术界高度关注,因为当模型知晓当前日期时,能够识别出自身正处于测试环境中。研究表明,AI模型...

Read More
2025-09-18 talkingdev

Tau²基准测试揭秘:简单提示词改写竟让GPT-5-mini性能飙升22%

Quesma实验室最新发布的Tau²基准测试研究表明,通过精细化提示词工程可显著提升轻量级AI模型在工具调用场景中的表现。该团队针对GPT-5-mini模型进行提示词重构后,在模拟真实工具使用场景的基准测试中成功率提升超20...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page