注意: IP代理精灵仅提供国内ip网络节点,不提供境外网络节点,不能用于任何非法用途或访问境外封闭网站,不能跨境联网,只能用于合法的国内网络加速。

请登录 注册

首页 > 新闻资讯 > Python爬虫设置代理IP的方法

Python爬虫设置代理IP的方法

来源:互联网 作者:admin 时间:2019-04-14 16:19:00

在学习Python爬虫的时候,经常会遇见所要爬取的网站采取了反爬取技术导致爬取失败。高强度、高效率地爬取网页信息常常会给网站服务器带来巨大压力,所以同一个IP反复爬取同一个网页,就很可能被封,这里讲述一个爬虫技巧——设置代理IP。


配置环境


安装requests库


安装bs4库


安装lxml库


具体代码

Python爬虫设置代理IP的方法

函数get_ip_list(url, headers)传入url和headers,最后返回一个IP列表,列表的元素类似122.114.31.177:808格式,这个列表包括国内髙匿代理IP网站首页所有IP地址和端口。


函数get_random_ip(ip_list)传入第一个函数得到的列表,返回一个随机的proxies,这个proxies可以传入到requests的get方法中,这样就可以做到每次运行都使用不同的IP访问被爬取的网站,有效地避免了真实IP被封的风险。


proxies的格式是一个字典:{‘http’: ‘http://122.114.31.177:808‘},可以将下面的执行也封装为方法。


代理IP的使用


运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可

Python爬虫设置代理IP的方法

最新资讯

推荐阅读

  1. 16

    2020-10

    换IP地址的三种方法

    细数换IP地址的多种方法!现在人们上网更换IP地址可以说是家常便饭,只要需要,就可以更换。更换IP地址的方法也不止一种,下面就让我们来一一看看他们的优势和劣势。

  2. 18

    2019-04

    如何更改电脑本机网络IP地址

    每一台电脑都有属于自己的IP地址,这就好比一户人家都有一个属于自己的门牌号码一样。但是有时候不同的电脑尤其是在同一公司的不同电脑之间具有了相同的IP地址而造成冲突,从而上不了

  3. 14

    2019-05

    匿名代理是如何运作的

    如今几乎每个人都听说过“ 匿名上网 ”,它允许访问网站,同时阻止任何人收集个人信息/或网络历史记录。嗯,至少在理论上是这样的,因为代理服务的质量不同。此类服务会隐藏您的IP地址

  4. 23

    2019-04

    如何获取高匿代理IP资源

    我们都知道,代理IP分为透明代理、普匿代理和高匿代理,其中透明代理会被目标服务器识别并知晓真实IP,普匿代理会被目标服务器识别使用了代理但并不知道真实IP,高匿代理不会被服务器知

  5. 26

    2018-11

    如何实现大量爬取数据?爬取大量数据的方法

    如何实现大量爬取数据?对于爬虫抓取数据,大家对反爬机制都有一定的了解,比如IP被封,验证码限制等等,少量的抓取数据这些问题都还好解决,但如果想大量抓取数据,遇到的问题成倍...

  6. 22

    2020-04

    IP代理具有什么作用

    IP代理具有什么作用?代理服务器维护保养户局域网络的安全系数,事实上网上卖东西的老板绝大多数最忧虑的难点就是,门店刷单过多将会造成封禁的风险性,也是就是网站地址发帖过多而导