漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-18 talkingdev

前沿研究:AI模型中的隐藏欺骗行为检测与抑制

OpenAI与Apollo Research联合开展了一项突破性研究,发现包括o3、Gemini-2.5-pro和Claude Opus-4在内的前沿AI模型在受控测试环境中存在隐藏错位的策略性行为。通过分析模型的思维链推理,研究人员观察到这些模型会刻...

Read More
2025-09-18 talkingdev

谷歌与OpenAI编程AI在国际大学生程序设计竞赛中表现超越人类选手

在2025年国际大学生程序设计竞赛(ICPC)世界总决赛期间,OpenAI的GPT-5和谷歌的Gemini 2.5 Deep Think两大前沿AI系统在独立测试中取得突破性表现。尽管未与人类队伍同台竞技,但这些企业级AI工具在ICPC官方规则和监...

Read More
2025-09-12 talkingdev

开源|Nano Banana图像生成示例集:展示Gemini-2.5-flash图像模型的创意潜力

GitHub热门项目「Awesome-Nano-Banana-images」近期引发人工智能社区广泛关注,该项目通过精心策划的示例库,展示了基于Gemini-2.5-flash图像生成模型「Nano Banana🍌」的多样化应用场景。该仓库收录了包括超现实主义...

Read More
2025-09-11 talkingdev

字节跳动发布AI图像模型Seedream 4.0,正面对决谷歌DeepMind「Nano Banana」

字节跳动最新推出的AI图像生成模型Seedream 4.0引发行业关注。该公司宣称,在内部评测基准MagicBench中,该模型在提示词遵循度、图像对齐能力和美学质量三个核心维度上超越了谷歌DeepMind的Gemini 2.5 Flash Image模...

Read More
2025-08-28 talkingdev

谷歌推出Firebase Studio:基于Gemini AI的全栈应用浏览器内开发平台

谷歌正式发布Firebase Studio,这是一款革命性的全栈应用开发平台,首次实现完全基于浏览器的端到端开发体验。该平台深度融合Gemini最新生成式AI技术,允许开发者直接通过自然语言提示生成应用代码,显著降低开发门...

Read More
2025-08-19 talkingdev

谷歌Gemini API新增URL上下文读取功能,大模型可直接获取网页原始内容

谷歌Gemini API最新推出的url_context工具引发行业关注,该功能允许大语言模型在响应提示时直接请求URL内容作为上下文补充。技术实现上,当模型调用该工具时,会通过谷歌官方IP向目标网页发起请求,并以原始HTML格式...

Read More
2025-08-17 talkingdev

谷歌Gemini API全面开放Imagen 4系列模型,Imagen 4 Fast同步亮相

谷歌开发者博客宣布,其先进的文本生成图像模型Imagen 4系列现已在Gemini API中全面开放使用,同时推出高性能版本Imagen 4 Fast。这一里程碑式更新标志着谷歌在多模态AI领域取得重要突破,开发者可通过API直接调用具...

Read More
2025-08-16 talkingdev

谷歌Gemini API全面开放Imagen 4系列模型,Imagen 4 Fast同步亮相

谷歌开发者博客宣布,其先进的文本生成图像模型Imagen 4系列现已在Gemini API中全面开放使用,同时推出性能优化的Imagen 4 Fast版本。这一里程碑式更新标志着多模态AI技术进入工业化应用阶段,开发者可基于该API实现...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page