注意: IP代理精灵仅提供国内ip网络节点,不提供境外网络节点,不能用于任何非法用途或访问境外封闭网站,不能跨境联网,只能用于合法的国内网络加速。

请登录 注册 实名验证

首页 > 新闻资讯 > php如何识别代理ip?

php如何识别代理ip?

来源:IP代理精灵 作者:admin 时间:2019-11-07 11:58:06

php如何识别代理ip?在网络中我们能够抓到大量的代理IP,虽然数量很多,但是真正能够使用的往往是十分之二三都不到,那么在使用之前就需要剔除掉不能用的IP来提高我们的工作效率。

php如何识别代理ip

简单说一下方法,将抓到的IP和端口都放进了我们的MySQL数据表中,要验证肯定需要取出来,然后通过PHP中curl函数设置代理,再访问百度或者其他能访问到的网站,通过返回的状态码是否等于200来判断代理IP是不是可以正常使用的。

代理太长,这里就只看看curl验证代理IP的核心代码。

//代理IP验证方法functionGetHttpStatusCode($proxy){$curl=curl_init();curl_setopt($curl,CURLOPT_PROXY,$proxy);

//使用代理访问curl_setopt($curl,CURLOPT_URL,"");//获取内容urlcurl_setopt($curl,CURLOPT_HEADER,1);//获取http头信息curl_setopt($curl,CURLOPT_NOBODY,1);

//不返回html的body信息curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);//返回数据流,不直接输出curl_setopt($curl,CURLOPT_TIMEOUT,5);//超时时长,单位秒curl_exec($curl);$rtn=curl_getinfo($curl,CURLINFO_HTTP_CODE);curl_close($curl);return$rtn;}推荐阅读:怎么使用socks5代理IP

调用GetHttpStatusCode(代理IP地址:端口)方法就能返回该代理IP在访问百度首页时所返回的状态码,在需要的地方对状态码进行判断就可以使用了。这个验证方法可以在我们使用之前筛选到可用的代理IP,这样我们的工作效率就可以得到大大提高。

最新资讯

推荐阅读

  1. 30

    2019-01

    爬虫怎么判断网页有没有更新

    有些网站每天都更新,不仅会出现新的网页,而且老的网页也会有更新内容,这样爬虫怎么判断网页有没有更新?应该怎么设计爬取策略?难度每天都重新爬遍这个网站的所有网页,然后判断是

  2. 19

    2019-04

    大数据爬虫为什么要使用IP代理

    大数据爬虫为什么要使用IP代理?如今互联网的飞速猛劲的发展,大数据的应用,大数据样本获得需要通过数据爬虫来实现,而爬虫工作者一般都绕不过代理IP这个问题,这是因为在网络爬虫抓

  3. 04

    2019-11

    2019代理ip最新识别方法

    2019代理ip最新识别方法

  4. 20

    2019-06

    爬虫为何使用动态ip可以隐藏ip并提高爬取效率

    目前网站的反爬虫策略非常的完善,越是成熟的网站,想要获取信息越难,因为漏洞少,那只能伪装成用户去拿数据了,一个用户不会拿这么多的数据,最好是要伪装大量的用户去获取数据。而

  5. 09

    2019-09

    跨境电商运营之IP代理

    跨境电商运营之IP代理。从事跨境电商的卖家小伙伴们相信都曾经为每个账号拥有一个独立且固定的IP而苦恼,而IP代理就是目前市场较为流行的解决方案的一种。下面就个大家介绍一下跨境电商

  6. 17

    2019-10

    HTTP代理IP的用途及对爬虫工作的重要性

    HTTP代理IP的用途及对爬虫工作的重要性!近期不少朋友问起HTTP代理IP的有什么用,今天精灵代理ip工程师就来给大家说说HTTP代理IP的用途及对爬虫工作的重要性: