作者:h38868863 | 来源:互联网 | 2023-06-23 11:23
因为一些需求,不得不爬取一些网站内的邮箱地址。
目前准备的是两个方案
1.写个爬虫把别人的网站从头到尾跑一遍。然后每个页面正则出所有邮箱。
这个方法太暴力。也有诸多限制,与较低的效率
2.使用谷歌: 相关关键词 "@gmail.com" site:目标网站
这个可能更合适,但是我没办法在谷歌中使用通配符查询?
如果改成 相关关键词 "@*" site:目标网站,这样的搜索似乎忽视了@
我的问题是,
1.是否有更加简单高效,也减少网站负担的方式获取网站内的邮箱?
2.谷歌是否能使用通配符查询带有邮箱的记录?如果能我该如何写?一句看过谷歌的帮助文件,但是提供的类似数值范围和与或非之类的判断。并没有需要的通配符。
请各位大神指点