设为首页收藏本站

EPS数据狗论坛

搜索
快捷导航
查看: 344|回复: 0

[其他] 爬虫使用代理遇到的问题

[复制链接]

7

主题

88

金钱

130

积分

入门用户

发表于 2019-11-4 16:41:18 | 显示全部楼层 |阅读模式
做爬虫的小伙伴们一般都会绕不开代理IP这个问题.但是如果有还没遇到被封IP的小伙伴,只能说你量太小人家懒得理你,或者就是人家压根不在乎,没有防爬虫的机制来限制你.不过现在大部分的网站都会有设置防爬虫的机制.
一般的爬虫用户自己是没有能力去维护一系列的代理服务器和代理IP的,这个成本与时间实在是有点高了.所以公用的代理服务器就应运而生,现在网上有很多收费的代理IP供用户选择,同时也有许多免费的代理IP在网站上面放出.大家都是做爬虫的,那么,是不是可以先把代理IP网站的数据爬一遍?
然而在使用过程中我们发现了一些问题:
许多网站公布的代理IP并不一定是可用的,有的可能代理服务器挂了,有的可能IP无效了等等之类的,有的甚至就是一个没有用的IP地址.质量非常不好,有的可能可以使用,但是网速非常慢,也不稳定.或者是代理IP是部分可用的,某些代理IP可用代理访问百度,但是再用代理访问谷歌的时候就GG了.要不然就是代理连通性是好的,但是已经被太多人使用过了,访问站就会识别为代理IP返回验证码或者辣鸡数据.
其实使用收费的代理IP也不是一件不好的事情,相比于免费的代理IP的质量差,稳定性不高,安全性不确定,网速慢等等的问题,收费的代理IP还是非常好用的.而且用户可以自己选择一定档位的代理IP,并不一定就是只有鬼的可以选择.你可以选择一个实惠的,又适合你的需求的代理IP数亿牛云代理就可以试用一下.

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
9:00-18:00
QQ群:
542280196
联系电话:
010-85786021-8014
在线咨询
客服中心

Powered by BFIT! X3.2© 2008-2018 BFIT Inc.

快速回复 返回顶部 返回列表