漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-07 talkingdev

谷歌Gemini API推出文件搜索工具:内置RAG系统,简化检索任务

谷歌近日在Gemini API中正式推出文件搜索工具(File Search),这是一个完全托管的检索增强生成(RAG)系统,直接集成于API架构中。该系统通过向量搜索技术实现高效语义匹配,并自动生成引用来源,支持包括PDF、Word...

Read More
2025-10-28 talkingdev

《2025生成式媒体调查报告》发布:图像生成个人应用领先,企业投资回报周期缩短至12个月

最新发布的《2025生成式媒体调查报告》揭示了生成式媒体技术发展的关键趋势。报告显示,当前图像生成技术在个人用户中的普及度显著高于视频生成,其中谷歌Gemini系列模型在图像生成领域占据领先地位,而视频生成领域...

Read More
2025-09-29 talkingdev

苹果内部测试'Veritas'聊天机器人,或为Siri AI升级铺路

据最新科技资讯披露,苹果公司正在内部测试代号为'Veritas'的专属员工聊天机器人,这被业界视为苹果对标ChatGPT的重要布局。该举措发生在苹果AI战略面临多重挑战的背景下:其Apple Intelligence功能市场反响平淡,Si...

Read More
2025-09-11 talkingdev

字节跳动发布AI图像模型Seedream 4.0,正面对决谷歌DeepMind「Nano Banana」

字节跳动最新推出的AI图像生成模型Seedream 4.0引发行业关注。该公司宣称,在内部评测基准MagicBench中,该模型在提示词遵循度、图像对齐能力和美学质量三个核心维度上超越了谷歌DeepMind的Gemini 2.5 Flash Image模...

Read More
2025-08-19 talkingdev

谷歌Gemini API新增URL上下文读取功能,大模型可直接获取网页原始内容

谷歌Gemini API最新推出的url_context工具引发行业关注,该功能允许大语言模型在响应提示时直接请求URL内容作为上下文补充。技术实现上,当模型调用该工具时,会通过谷歌官方IP向目标网页发起请求,并以原始HTML格式...

Read More
2025-08-17 talkingdev

谷歌Gemini API全面开放Imagen 4系列模型,Imagen 4 Fast同步亮相

谷歌开发者博客宣布,其先进的文本生成图像模型Imagen 4系列现已在Gemini API中全面开放使用,同时推出高性能版本Imagen 4 Fast。这一里程碑式更新标志着谷歌在多模态AI领域取得重要突破,开发者可通过API直接调用具...

Read More
2025-08-16 talkingdev

谷歌Gemini API全面开放Imagen 4系列模型,Imagen 4 Fast同步亮相

谷歌开发者博客宣布,其先进的文本生成图像模型Imagen 4系列现已在Gemini API中全面开放使用,同时推出性能优化的Imagen 4 Fast版本。这一里程碑式更新标志着多模态AI技术进入工业化应用阶段,开发者可基于该API实现...

Read More
2025-08-14 talkingdev

谷歌Deep Research API即将问世,AI驱动的复杂研究任务自动化时代来临

谷歌Gemini Deep Research团队正在开发名为Deep Research API的创新工具,该技术将彻底改变传统研究模式。这一API具备强大的自动化研究能力,可在几分钟内完成数百个网站的智能浏览、信息深度分析及生成多页洞察报告...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page