注意: IP代理精灵仅提供国内ip网络节点,不提供境外网络节点,不能用于任何非法用途或访问境外封闭网站,不能跨境联网,只能用于合法的国内网络加速。

请登录 注册

首页 > 新闻资讯 > Python爬虫设置代理IP的方法

Python爬虫设置代理IP的方法

来源:互联网 作者:admin 时间:2019-04-14 16:19:00

在学习Python爬虫的时候,经常会遇见所要爬取的网站采取了反爬取技术导致爬取失败。高强度、高效率地爬取网页信息常常会给网站服务器带来巨大压力,所以同一个IP反复爬取同一个网页,就很可能被封,这里讲述一个爬虫技巧——设置代理IP。


配置环境


安装requests库


安装bs4库


安装lxml库


具体代码

Python爬虫设置代理IP的方法

函数get_ip_list(url, headers)传入url和headers,最后返回一个IP列表,列表的元素类似122.114.31.177:808格式,这个列表包括国内髙匿代理IP网站首页所有IP地址和端口。


函数get_random_ip(ip_list)传入第一个函数得到的列表,返回一个随机的proxies,这个proxies可以传入到requests的get方法中,这样就可以做到每次运行都使用不同的IP访问被爬取的网站,有效地避免了真实IP被封的风险。


proxies的格式是一个字典:{‘http’: ‘http://122.114.31.177:808‘},可以将下面的执行也封装为方法。


代理IP的使用


运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可

Python爬虫设置代理IP的方法

最新资讯

推荐阅读

  1. 09

    2020-09

    邮件营销IP多长时间需要换

    邮件营销IP多长时间需要换?大家的邮箱是不是有的时候会经常收到来自商家或者品牌的广告邮件,在你注册会员或是使用邮箱账号登录某第三方平台的时候,你的邮箱就被商家进行了采集,他们

  2. 08

    2019-05

    HTTP代理IP如何使用

    HTTP代理IP​是最普遍的一种代理形式,能够代理客户机的HTTP访问,例如我们平时上网浏览页面使用的都是HTTP协议。如果你的业务是在浏览器操作,那么HTTP代理IP在适合不过。那么,HTTP代理IP要

  3. 09

    2019-10

    短效IP的应用场景

    短效IP的应用场景。代理ip中最常用的莫过于短效代理ip,短效又分普通短效ip和优质短效代理ip,普遍用的较多的基本是上是优质代理ip,像精灵HTTP代理(www.ipjldl.com)优质短效代理ip质量就非常适

  4. 11

    2019-07

    电商效果补量可以用代理IP

    电商效果补量可以用代理IP,现在网络购物比较普及的,说起电商大家都不陌生,全国人民熟悉的淘宝天猫,还有京东聚美优品,唯品会当当网等,都是比较知名的电商平台,自从有了网络我们

  5. 12

    2019-04

    使用代理服务器的最佳方式是什么?

    透明目的主机知道您的IP,它知接。未知 - 目的主机无法识别您的IP地址,但它知道您正在使用代理切换器服务器。E-lite - 目的主机不了解您的IP地址,或者请求已通过代理主机中继。

  6. 15

    2020-07

    验证代理IP的匿名度,第三方IP检测工具的结果可信吗

    验证代理IP的匿名度,第三方IP检测工具的结果可信吗?在使用代理ip过程中,很多人在获取代理IP之后,会自己编写代码先验证一次获取到的IP的有效性,去除无效的、延时过长的IP,保留满足自