注意: IP代理精灵仅提供国内ip网络节点,不提供境外网络节点,不能用于任何非法用途或访问境外封闭网站,不能跨境联网,只能用于合法的国内网络加速。

请登录 注册

首页 > 新闻资讯 > 代理IP如何帮助爬虫爬取淘宝商品价格信息的

代理IP如何帮助爬虫爬取淘宝商品价格信息的

来源:互联网 作者:admin 时间:2019-04-11 16:32:29

代理IP如何帮助爬虫是爬取淘宝商品价格数据的。这次的主要抓取目标是获取淘宝搜索结果页面的信息,提取商品名称和价格的信息数据。下面我们以手机为例。


代理IP如何帮助爬虫爬取淘宝商品价格信息的


代码如下:


import requests


import re


def getHTMLText(url):


    try:


        r = requests.get(url, timeout=30)


        r.raise_for_status()


        r.encoding = r.apparent_encoding


        return r.text


    except:


        return ""


def parsePage(ilt, html):


    try:


        plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"', html)


        tlt = re.findall(r'\"raw_title\"\:\".*?\"', html)


        for i in range(len(plt)):


            price = eval(plt[i].split(':')[1])


            title = eval(tlt[i].split(':')[1])


            ilt.append([price, title])


    except:


        print("")


def printGoodsList(ilt):


    tplt = "{:4}\t{:8}\t{:16}"


    print(tplt.format("序号", "价格", "商品名称"))


    count = 0


    for g in ilt:


        count = count + 1


        print(tplt.format(count, g[0], g[1]))


def main():


    goods = '手机'


    depth = 2


    start_url = 'https://s.taobao.com/search?q=' + goods


    infoList = []


    for i in range(depth):


        try:


            url = start_url + '&s=' + str(44*i)


            html = getHTMLText(url)


            parsePage(infoList, html)


        except:


            continue


    printGoodsList(infoList)


   

main()


通过以上代码,我们就可以获取到具体的商品价格信息数据了。IP代理精灵,数据采集服务服务提供商,为您提供更快,更可靠的服务。


最新资讯

推荐阅读

  1. 10

    2019-05

    代理ip软件哪个好用

    因为目前国内很多工作室及公司和个人一下业务需要,需要更改自己本机IP地址,帮助自己的业务效率的提升,那么问题来了,代理ip软件哪个好用呢?

  2. 28

    2021-06

    IP转换器支持手机电脑一键换IP

    IP转换器支持手机电脑一键换IP

  3. 25

    2020-11

    爬虫为什么要选择代理ip

    爬虫为什么要选择代理ip?在这个大数据时代,网络用户的增加,我们越来越需要代理IP,网络中一夜间冒出许多专门提供代理IP业务的商家,能够满足各种各样需求的用户。

  4. 28

    2019-05

    Win8如何设置LAN代理服务器

    许多win8系统用户为了能够畅游游戏世界,经常需要设置代理服务器来突破IP限制或是通告网络访问速度,但是许多用户并不知道要怎么设置LAN代理服务器,针对这个问题,小编这就给大家讲解Win

  5. 27

    2020-05

    店铺刷销量无需愁,代理IP来帮你

    店铺刷销量无需愁,代理IP来帮你!自打淘宝网受欢迎越至今,电子商务行业变成了一个有前景的行业,很多人都变成了一名淘宝卖家或者微商代理,每一年的双十一双十二的成交额也高的可怕,

  6. 28

    2020-02

    Python制作爬虫代理IP的操作方法

    Python制作爬虫代理IP的操作方法!我们在制作爬虫爬取想要的资料时,由于是计算机自动抓取,强度大、速度快,通常会给网站服务器带来巨大压力,所以同一个IP反复爬取同一个网页,就很可