漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-01-16 talkingdev

新型陷阱Nepenthes专门捕捉AI网络爬虫

Nepenthes是一种专门设计来捕捉人工智能网络爬虫的陷阱系统。该系统通过模拟网站和在线服务,吸引并“捕获”试图自动访问这些服务的AI爬虫。Nepenthes的工作机制类似于数字世界的“粘网”,一旦AI爬虫被诱入陷阱,Nepent...

Read More
2024-02-15 talkingdev

robots.txt:维护互联网秩序的文本文件

三十年来,robots.txt一直是维持互联网秩序的关键所在。这个简单的文本文件代表着早期互联网先驱者之间的协议,以尊重彼此的意愿,并以使每个人都受益的方式建立互联网。它允许运行网站的任何人告诉网络谁有权进入网...

Read More
2023-08-08 talkingdev

OpenAI发布GPTBot,详细介绍如何限制访问

OpenAI推出了一个网络爬虫来改善其人工智能模型。GPTBot将在搜索数据时严格过滤掉任何有付费墙限制的来源、违反OpenAI政策的来源或收集个人身份信息的来源。网站管理员可以选择是否允许该机器人访问他们的网站。该机...

Read More