利用代理防止网络爬虫被屏蔽 防止网站被爬虫抓取

利用goeagent代理服务器,首先打开代理服务器,在java中设置如下:public static void setProxyServer(String proxy, StringproxyPort) { //设置代理服务器 System.getProperties().put("proxySet", "true"); System.getProperties().put("proxyHost", proxy); System.getProperties().put("proxyPort",proxyPort); }之后即可调用该函数设置代理服务器,proxy是主机地址,默认127.0.0.1,proxyPort是端口,默认8087退出代理服务器:public static void unsetProxyServer(){ System.getProperties().remove("proxySet"); System.getProperties().remove("proxyHost"); System.getProperties().remove("proxyPort"); }在爬取时,不能太频繁,因此需要设置等待时间,代码如下:Random r = new Random();int ran = r.nextInt(10);//0~10间的随机数ran = (ran)*1000;Thread.sleep(ran);之所以等待时间取随机数是因为固定时间间隔爬取还会被认为是爬虫,因此需要随机时间间隔去取。

利用代理防止网络爬虫被屏蔽 防止网站被爬虫抓取

  

爱华网本文地址 » http://www.aihuau.com/a/25101014/211399.html

更多阅读

怎样打免费的网络电话 被别人拉黑了怎么恢复

怎样打免费的网络电话——简介怎样打免费的网络电话?当网友看到这条标题会不会觉得不可能呢?其实没有这不可能就是有免费的事 那么到底怎么打呢?小编给一些好奇的网友们说一下操作怎样打免费的网络电话——方法/步骤怎样打免费的网络

被猫抓伤后的正确处理方法 被猫抓伤出血要打针吗

被猫抓伤后的正确处理方法——简介猫的牙齿和爪尖异常锋利,猫又喜欢同主人玩耍逗乐,因此,偶尔被猫咬伤或抓伤总是难免的。尽管不是猫本身想攻击你,但是面对这种情况,还是要做好防治措施,毕竟动物的爪子可能携带了病菌之类的。所以如果被猫

利用SAS抓取网页数据总结及案例 sas聚类分析案例

故事来由本人以前有一小站www.daaata.com刊登几篇关于利用SAS抓取网页数据的小文,然后挂了个链接在人大论坛。后因懒惰,此站挂掉,相继有人询问。在从新有此博后打算把其中一篇简单易懂的补上,另外几篇译文已被@统计网收录,文章末尾会贴

网络爬虫与web安全——营销安全 爬虫营销服务平台

最近营销恩师大为哥在谈到一个cms建站时不要在线制作,本地全功之后再上传,目的是为了不让爬虫抓到半成品网页,和一些能透露出某些网站安全信息的东东,我不禁想到了Google语法等等,能搜索到很多有【价值】的信息,包括百度在内的的各大搜索

显示网络电缆被拔出该怎么办? 精 win10网络电缆被拔出

显示网络电缆被拔出该怎么办? 精——简介大家在用电脑访问Internet网络的过程中会经常遇到电脑网络图标显示网络电缆被拔出,遇到这种办法应该怎么办呢?这里我给大家分析一下原因,然后给大家一个不错的办法,好了,随着我一起来看看吧。显示

声明:《利用代理防止网络爬虫被屏蔽 防止网站被爬虫抓取》为网友呆萌男神分享!如侵犯到您的合法权益请联系我们删除