漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

谷歌Gemini API最新推出的url_context工具引发行业关注,该功能允许大语言模型在响应提示时直接请求URL内容作为上下文补充。技术实现上,当模型调用该工具时,会通过谷歌官方IP向目标网页发起请求,并以原始HTML格式获取内容,期间不会执行页面中的JavaScript代码。这一技术突破意味着Gemini模型能够更精准地解析网页核心信息,避免动态加载内容造成的干扰,显著提升了对静态网页内容的理解准确性。该功能对知识检索、事实核查和内容摘要等应用场景具有重要价值,但同时也引发了对网页内容版权和隐私安全的新一轮讨论。行业分析认为,这标志着大模型正在从纯文本处理向跨模态网络内容理解演进,可能重塑搜索引擎与AI交互的边界。

核心要点

  • Gemini API新增工具可直接获取URL原始HTML内容
  • 请求过程不执行JavaScript确保内容获取稳定性
  • 功能提升模型对网页信息的精准解析能力

Read more >