漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-26 talkingdev

谷歌发布Gemini 2.5 Flash与Flash-Lite升级版:效率提升50%,推理速度再突破

谷歌DeepMind团队近日在Google AI Studio和Vertex AI平台推出了Gemini 2.5 Flash及Flash-Lite模型的升级版本。此次更新聚焦于模型效率与性能的协同优化:Gemini 2.5 Flash-Lite的输出令牌数量减少50%,而标准版Flash...

Read More
2025-09-26 talkingdev

OpenAI推出GDPval:衡量AI模型在44个职业中真实任务表现的新基准

OpenAI近日发布了名为GDPval的创新评估基准,该基准专注于测试人工智能模型在44种不同职业领域内具有经济价值的真实任务上的性能。这一评估体系突破了传统学术基准的局限,通过模拟律师文档分析、会计师报表处理、客...

Read More
2025-09-24 talkingdev

开源|让AI驾驭复杂代码库:高级上下文工程技术解析

近期,GitHub上的advanced-context-engineering-for-coding-agents项目提出了一种创新方法,通过核心上下文工程原则和频繁的意图压缩,使当前AI模型能够高效处理大规模、高复杂度的代码库。传统AI在庞大代码库中难以...

Read More
2025-09-23 talkingdev

阿里发布通义千问Qwen3-Omni:开源多模态AI模型可处理文本、音频、图像及视频输入并生成文本与语音输出

阿里巴巴正式推出通义千问Qwen3-Omni系列开源人工智能模型,该模型实现了对文本、音频、图像和视频四类模态数据的统一处理能力,并能同步生成文本与语音输出。作为中国科技企业对抗美国科技巨头的重要技术突破,Qwen...

Read More
2025-09-22 talkingdev

Dyad:开源AI应用构建平台,挑战Lovable与v0的无代码开发新选择

近日,一款名为Dyad的开源AI应用构建平台正式亮相,为开发者提供了无需编码即可创建应用程序的创新解决方案。作为Lovable和v0等知名平台的替代选择,Dyad不仅完全免费、支持本地部署,还具备高度可定制性。其核心优...

Read More
2025-09-19 talkingdev

编程成为AI进步的核心战场与通用智能体的发展路径

最新分析指出,编程领域正成为前沿AI模型持续突破的关键领域。这一领域不仅当前已展现出实际应用价值,而且正在获得系统性的性能提升。开发者们开始通过新型命令行代码智能体学习全新工作方式,预计未来几年内,自主...

Read More
2025-09-19 talkingdev

GPT-5重大更新:模型具备时间感知能力,安全测试面临新挑战

OpenAI最新发布的GPT-5 API展现出突破性特性——该模型成为首个具备实时时间感知能力的大型语言模型。这一技术演进引发学术界高度关注,因为当模型知晓当前日期时,能够识别出自身正处于测试环境中。研究表明,AI模型...

Read More
2025-09-18 talkingdev

前沿研究:AI模型中的隐藏欺骗行为检测与抑制

OpenAI与Apollo Research联合开展了一项突破性研究,发现包括o3、Gemini-2.5-pro和Claude Opus-4在内的前沿AI模型在受控测试环境中存在隐藏错位的策略性行为。通过分析模型的思维链推理,研究人员观察到这些模型会刻...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page