注意: IP代理精灵仅提供国内ip网络节点,不提供境外网络节点,不能用于任何非法用途或访问境外封闭网站,不能跨境联网,只能用于合法的国内网络加速。

请登录 注册 实名验证

首页 > 新闻资讯 > selenium+python设置爬虫代理IP的方法

selenium+python设置爬虫代理IP的方法

来源:IP代理精灵 作者:admin 时间:2019-04-26 14:40:32

这篇文章主要介绍了selenium+python设置爬虫代理IP的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧!

selenium+python设置爬虫代理IP的方法

1. 设置背景


在使用selenium浏览器渲染技术,当我们爬取某个网站的信息的时候,在一般情况下速度都不是特别的快。而且需要利用selenium浏览器渲染技术爬取的网站,反爬虫的应对技术都比较厉害,对IP访问频率有很高程度的限制。所以,如果想提升selenium抓取数据的速度,可以从两个方面出发:


第一方面, 抓取频率要提高,破解出现的验证信息,一般都是验证码或者是用户登陆 。


第二方面,使用多线程 + 代理IP, 这种方式,需要电脑有足够的内存和充足稳定的代理IP。


2. 为chrome设置代理IP


注意事项:


第一,选择稳定的固定的代理IP。不要选择动态代理IP。我们常用的爬虫IP代理通常都是具有高度保密性质的高匿名动态IP,是通过拨号动态产生的,时效性非常的短,一般都是在3分钟左右。对于scrapy这种并发度很高,又不需要登录的爬虫来说,非常合适,但是在浏览器渲染类爬虫中并不适用。


第二,选择速度较快的代理IP。因为selenium爬虫采用的是浏览器渲染技术,这种浏览器渲染技术速度就本身就很慢。如果选择的代理IP速度较慢,爬取的时间就会进一步增加。


第三,要有足够大的电脑内存。因为chrome占内存较大,在并发度很高的情况下,容易造成浏览器崩溃,也就是程序崩溃。


第四,在程序结束时,调用 browser.quit( ) 清除浏览器缓存。


最新资讯

推荐阅读

  1. 11

    2019-05

    代理IP助力企业金融数据采集

    金融行业经常打交道的文化就是“数字文化”当然金融行业的行业圈子里有自己的数字规则,在整个运行中开展数字运作的一个活动。当然,现在生活条件好了,很多人口袋里的钱也鼓了起来,

  2. 23

    2019-05

    使用免费代理IP有什么风险

    市面上免费代理IP那么多,为什么还有人愿意花钱使用付费代理IP?下面由小编带大家简单分析一下使用免费代理IP有什么风险,相信大家就能够明白了。一、免费代理IP传送信息不安全。同理,

  3. 25

    2019-11

    代理ip可以用来做些什么?

    代理ip可以用来做些什么?在互联网时代,特别如今我们不论是衣食住行还是工作中都离不开互联网,而用来连接互联网的电子计算机都会有一个ip地址,主要是用来确定计算机的具体位置同时也

  4. 30

    2019-05

    免费的IP代理有什么缺点

    市面上免费代理IP那么多,为什么还有人愿意花钱使用付费代理IP?免费的IP代理有什么缺点?下面由小编带大家简单分析一下。第一、免费代理IP传送信息不安全。使用免费代理IP,数据会先进

  5. 12

    2019-11

    HTTP代理IP对4S店网络发展有什么作用?

    HTTP代理IP对4S店网络发展有什么作用?互联网经济迅速发展,各个行业想要在这个经济背景之下抢占市场,网路模式已经成为必不可少的一种营销手段。4S店更是要这种新模式下迈向行业巅峰。在4

  6. 16

    2019-05

    手机如何使用国内动态IP

    手机如何使用国内动态IP?手机广泛应用后,因为便于携带,使用也方便,手机用户愈来愈多,许多人逐渐用手机工作。可是不换ip特别容易被禁掉,这就要手机也能换ip,所以手机如何使用国内