注意: IP精灵代理仅提供国内ip网络节点,不提供境外网络节点,不能用于任何非法用途或访问境外封闭网站,不能跨境联网,只能用于合法的国内网络加速。

您好,请登录 没有账号?

首页 > 新闻资讯 > 代理IP如何帮助爬虫爬取淘宝商品价格信息的

代理IP如何帮助爬虫爬取淘宝商品价格信息的

来源:互联网 作者:admin 时间:2019-04-11 16:32:29

代理IP如何帮助爬虫是爬取淘宝商品价格数据的。这次的主要抓取目标是获取淘宝搜索结果页面的信息,提取商品名称和价格的信息数据。下面我们以手机为例。


代理IP如何帮助爬虫爬取淘宝商品价格信息的


代码如下:


import requests


import re


def getHTMLText(url):


    try:


        r = requests.get(url, timeout=30)


        r.raise_for_status()


        r.encoding = r.apparent_encoding


        return r.text


    except:


        return ""


def parsePage(ilt, html):


    try:


        plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"', html)


        tlt = re.findall(r'\"raw_title\"\:\".*?\"', html)


        for i in range(len(plt)):


            price = eval(plt[i].split(':')[1])


            title = eval(tlt[i].split(':')[1])


            ilt.append([price, title])


    except:


        print("")


def printGoodsList(ilt):


    tplt = "{:4}\t{:8}\t{:16}"


    print(tplt.format("序号", "价格", "商品名称"))


    count = 0


    for g in ilt:


        count = count + 1


        print(tplt.format(count, g[0], g[1]))


def main():


    goods = '手机'


    depth = 2


    start_url = 'https://s.taobao.com/search?q=' + goods


    infoList = []


    for i in range(depth):


        try:


            url = start_url + '&s=' + str(44*i)


            html = getHTMLText(url)


            parsePage(infoList, html)


        except:


            continue


    printGoodsList(infoList)


   

main()


通过以上代码,我们就可以获取到具体的商品价格信息数据了。IP代理精灵,数据采集服务服务提供商,为您提供更快,更可靠的服务。


最新资讯

推荐阅读

  1. 17

    2019-04

    如何下载正版的换IP软件

    国内代理软件多如牛毛,正版盗版在市场上泥沙俱上随处可见,这就增添了普通用户选择的困难。因为他们不是专业的开发人员,根本无法分清正版与盗版的区别。而且如果一不小心购买到盗版

  2. 16

    2019-04

    http代理适用于哪些业务?

    经常使用网络的人可能会常常听到这样的一个词:IP代理。那么它真正的作用很多人都是模棱两可的,在这里给大家普及一下在我们大部分人的网络活动中,http是比较常见的网络协议,因而http

  3. 16

    2019-05

    爬虫基础之代理的基本原理

    简单的说爬虫就是获取网页并提取和保存信息的自动化程序。下文为大家梳理了爬虫基础之代理的基本原理,一起来了解看看吧!1. 基本原理 代理实际上指的就是代理服务器,英文叫作proxy serve

  4. 24

    2019-05

    安卓手机怎样设置代理ip

    很多朋友问手机能不能设置代理IP,手机怎么设置代理IP?手机当然是可以设置代理IP来使用的,不同型号的手机设置方法不同,但基本都差不多,这里以安卓手机为例进,说明安卓手机怎样设置

  5. 24

    2019-05

    代理IP、ADSL拨号、VPN三种换IP方式以及区别

    换IP就是改变或者隐藏自己电脑的地址,现在很多地方都需要换IP,下文为大家分享代理IP、ADSL拨号、VPN三种换IP方式以及区别,一起来看看吧!1、代理IP:代理IP一般都是免费的,我们软件自己

  6. 25

    2019-04

    动态IP下避免爬虫被墙的技巧

    爬虫的目的就是大规模地、长时间地获取数据,不过,总使用一个IP去爬网站,大规模集中对服务器访问,时间一长就有可能被拒绝,爬虫长时间爬取数据,还可能会要求验证码,即便是多个账

在线客服
大客户VIP渠道
点击这里给我发消息
讨论QQ群
HTTP代理IP爬虫
客服电话
13318873961