注意: IP代理精灵仅提供国内ip网络节点,不提供境外网络节点,不能用于任何非法用途或访问境外封闭网站,不能跨境联网,只能用于合法的国内网络加速。

请登录 注册

首页 > 新闻资讯 > python爬虫使用代理ip或请求头的问题

python爬虫使用代理ip或请求头的问题

来源:IP代理精灵 作者:admin 时间:2019-04-26 14:56:53

python爬虫使用代理ip或请求头的问题,接下来我们一起来看看!


在request库中使用代理ip实例如下

headers = {
    'User-Agent':
    'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:30.0) Gecko/20100101 Firefox/30.0',
    'Connection':
    'keep-alive',
    'Cookie':
    'session-id=130-1833310-5969908; session-id-time=2082787201l;',
    'referer':
    'https://www.amazon.com/s/ref=nb_sb_noss?field-keywords=%E7%94%B5%E8%84%91&ie=UTF8&language=zh_CN&url=search-alias%3Daps'
}

# 设置代理ip
proxies = {
    'http': 'http://110.52.235.150:9999',
    'https': 'https://58.137.62.133:80'
}
list_html = requests.get(
    'https://www.amazon.com/s/ref=nb_sb_noss?field-keywords=' + keywords +
    '&ie=UTF8&language=zh_CN&url=search-alias%3Daps',
    timeout=timeout,
    headers=headers,
    proxies=proxies,
)

一、 Failed to establish a new connection: [WinError 10061] 由于目标计算机积极拒绝,无法连接。')))


这种情况是爬取目标对本机进行反爬导致, 目前暂时考虑两种:


ip封锁导致:


解决的关键在于cookie携带还有ip更替, (cookie携带下, 对ip的封锁频率会降低)


请求头referer属性:


部分页面向下访问时会携带referer记录从哪个页面跳转, 有些反爬针对referer进行检测, 如果没有携带或者携带错误会大大增加封锁率


请求头用户代理:


二、Cannot connect to proxy.', NewConnectionError('<urllib3.connection.VerifiedHTTPSConnection object at 0x00000166942B8D30>: Failed to establish a new connection: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。


这种情况是由于使用的代理ip失效而无法再连接的问题, 可以使用cmd安装tcping命令对ip + 端口进行有效性检查


三、'Connection to 121.61.3.9 timed out. (connect timeout=10)'))


这种情况是由于使用的代理ip连接失效或者连接过于久, 使得超过了程序设定的时间, 可以不设置request的timeout属性以达到最大时间看看是否代理ip失效问题。

最新资讯

推荐阅读

  1. 05

    2019-05

    爬虫为什么使用ADSL动态IP拨号VPS?

    爬虫为什么使用ADSL动态IP拨号VPS?ADSL动态IP拨号VPS有什么作用?接下来我们来简单列举一下,如下:1、提高访问速度 通常代理服务器都设置一个较大的硬盘缓冲区,当有外界的信息通过时,同

  2. 27

    2020-05

    店铺刷销量无需愁,代理IP来帮你

    店铺刷销量无需愁,代理IP来帮你!自打淘宝网受欢迎越至今,电子商务行业变成了一个有前景的行业,很多人都变成了一名淘宝卖家或者微商代理,每一年的双十一双十二的成交额也高的可怕,

  3. 12

    2021-07

    怎样选择适合自己的代理ip软件

    怎样选择适合自己的代理ip软件?代理ip,简单来说,就是你的通行证,如果你本地的IP地址访问受到了限制,那么就需要换一个通行证来顺利通行。许多地方都需要使用代理ip,例如爬虫、投票、

  4. 18

    2019-06

    代理服务器怎么用

    代理服务器怎么用?代理服务器是Internet链路级网关所提供的一种重要的安全功能,它的工作主要在开放系统互联(OSI)型的对话层,主要的功能是突破自身IP访问限制。可以用来做以下事情:1.访

  5. 18

    2019-10

    更改IP地址方法

    更改IP地址方法!因为个人信息安全或是工作需要,我们有时候需要更改自己的ip地址。要怎样才能更改ip地址呢?有许多方法可以更改您的IP地址。有些方法适用于您,但可能不适用于其他人,反

  6. 02

    2019-06

    爬虫代理为什么要选择付费代理ip

    网络爬虫在大数据的发展中占据这举足轻重的地位,发挥着无人可替的作用。但是,当爬虫碰到反爬虫时也很无奈,于是网络爬虫的好帮手——代理IP上线了。代理IP的出现很大的程度上缓解了