智能家居

标题: python爬虫基础之验证码 [打印本页]

作者: yiniuyun    时间: 2020-5-22 17:42
标题: python爬虫基础之验证码

目前,很多网站会采取各种各样的措施来反爬虫,验证码就是其中的一种,比如当检测到访问频率过高时会弹出验证码让你输入,确认访问网站的不是机器人。但是随着爬虫技术的发展,验证码的花样也越来越多,从最开始简单的几个数字或字母构成的图形验证码发展到需要点击倒立人文字字母的,与文字相符合的图片点触型验证码,需要滑动到合适位置的极验滑动验证码,以及以计算题验证码等等,花样百出,让人头大。
图像验证码:这是最简单的一种,也很常见。就比如CSDN登录几次失败之后就会出验证码
(, 下载次数: 5)
解决思路:
滑块验证码:需要按住滑块并移到正确的位置
(, 下载次数: 2)
解决思路:
点触验证码:需要识别图片中的文字或类型并按序点击
(, 下载次数: 3)
解决思路:

计算题验证码:需要给出正确答案
(, 下载次数: 2)
解决思路
IP限制问题
  我们可以用最无赖也是最无解的代理ip来解决。直接通过切换访问的代理来突破,这里没有丝毫技术性含量。挂上代理后,去访问目标网站,根据返回的结果判断代理是否还有效。若是无效了,将当前查询目标回滚一次,并切换代理就行了。但是代理还是需要购买高质量的,在百度上搜一下,像亿牛云比较好的代理就会出来。






欢迎光临 智能家居 (https://bbs.mywll.com/) Powered by Discuz! X3.4