色综合老司机第九色激情 _中文字幕日韩av资源站_国产+人+亚洲_久久久精品影院_久久久视频免费观看_欧美激情亚洲自拍_亚洲成av人片在线观看香蕉_热草久综合在线_欧美极品第一页_2020国产精品自拍

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > Scrapy與Selenium完美結合獲取小紅書漲粉榜單

Scrapy與Selenium完美結合獲取小紅書漲粉榜單

來源:千鋒教育
發布人:wjy
時間: 2022-06-07 09:51:00 1654566660

  Scrapy框架與Selenium我們前面都介紹過,本次給大家分享的是兩者如何配合使用。

  本次我們獲取千瓜的數據:http://www.qian-gua.com/rank/category/

Scrapy與Selenium完美結合獲取小紅書漲粉榜單111

 

  不好意思!接下來這個頁面你會很郁悶!

Scrapy與Selenium完美結合獲取小紅書漲粉榜單133

 

  我們想獲取更多的日榜達人的數據怎么操作?借助selenium哦!為了獲取更多我們結合Scrapy完成此次的爬蟲任務。

  任務要求:

  Python3環境

  Scrapy框架

  Selenium 可以參照https://selenium-python-zh.readthedocs.io/en/latest/

  谷歌瀏覽器+ChromeDriver

  ChromeDriver的下載地址:https://chromedriver.storage.googleapis.com/index.html

  首先我們創建項目:scrapy startproject qiangua_spider

  然后進入qiangua_spider目錄下,執行:scrapy genspider qiangua qian-gua.com

  在Pycharm中打開創建的項目,目錄結構如下:

Scrapy與Selenium完美結合獲取小紅書漲粉榜單510

 

  修改settings.py文件ROBOTSTXT_OBEY 為 False

  編寫items.py文件內容如下:

Scrapy與Selenium完美結合獲取小紅書漲粉榜單569

 

  代碼如下:

import scrapy

class QianguaSpiderItem(scrapy.Item):
    # define the fields for your item here like:
    name = scrapy.Field()
    level = scrapy.Field()
    fans = scrapy.Field()
    likeCollect = scrapy.Field()

  編寫spider.py爬蟲文件,如果不登陸我們是無法看的更多的小紅書達人們的賬號排行、漲粉等信息。如果想看的更多則需要登陸才可以。

  流程與思路:

  先進入http://www.qian-gua.com/rank/category/

  點擊右上角的登陸(此過程需要有千瓜的賬號才可以)

  有兩種登陸方式,我們可以選擇微信掃碼登陸,或者手機登陸(本案例采用手機登陸)

  獲取登陸的Cookies

  保存Cookies并訪問

  http://api.qian-gua.com/Rank/GetBloggerRank?pageSize=50&pageIndex=頁碼數&dateCode=20211104&period=1&originRankType=2&rankType=2&tagId=0&_=時間戳

  得到json數據并解析數據

  在上述的流程中1-4,我們都是結合selenium完成的。

  代碼如下

import json
import time
import scrapy
from selenium import webdriver
from qiangua_spider.items import QianguaSpiderItem


class QianguaSpider(scrapy.Spider):
    name = 'qiangua'
    allowed_domains = ['www.qian-gua.com']
    # start_urls = ['http://www.qian-gua.com/rank/category/']

    headers = {
        'Origin': 'http://app.qian-gua.com',
        'Host': 'api.qian-gua.com',
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.2 Safari/605.1.15'
    }

    def start_requests(self):
        driver = webdriver.Chrome()
        url = 'http://www.qian-gua.com/rank/category/'
        driver.get(url)
        driver.implicitly_wait(5)
        driver.find_element_by_xpath('//div[@class="loggin"]/a').click()
        time.sleep(2)
        driver.find_element_by_xpath('//div[@class="login-tab"]/span[2]').click()
        driver.find_element_by_xpath('//input[@class="js-tel"]').send_keys('15010185644')
        driver.find_element_by_xpath('//input[@class="js-pwd"]').send_keys('qiqining123')
        driver.find_element_by_xpath('//button[@class="btn-primary js-login-tel-pwd"]').click()
        time.sleep(2)
        cookies = driver.get_cookies()
        driver.close()

        jsonCookies = json.dumps(cookies)  # 通過jsoncookies寫入文件
        with open('qianguaCookies.json', 'w') as f:
            f.write(jsonCookies)
        print(cookies)
        with open('qianguaCookies.json', 'r', encoding='utf-8') as f:
            listcookies = json.loads(f.read())  # 獲取cookies

        cookies_dict = dict()
        for cookie in listcookies:
            # 在保存成dict時,我們其實只要cookies中的namevalue,而domain等其他都可以不要
            cookies_dict[cookie['name']] = cookie['value']
# 更多的數據需要開通會員才可以,我們當前獲取了top30的數據
        for page in range(1, 2):
            t = time.time()
            timestamp = str(t).replace(".", '')[:13]
            data_url = "http://api.qian-gua.com/Rank/GetBloggerRank?pageSize=50&pageIndex=" + str(
                page) + "&dateCode=20211104&period=1&originRankType=2&rankType=2&tagId=0&_=" + timestamp

            yield scrapy.Request(url=data_url, cookies=cookies_dict, callback=self.parse, headers=self.headers)

    def parse(self, response):
        rs = json.loads(response.text)
        if rs.get('Msg')=='ok':
            blogger_list = rs.get('Data').get("ItemList")
            for blogger in blogger_list:
                name = blogger.get('BloggerName')
                level = blogger.get('LevelName','')
                fans = blogger.get('Fans')
                likeCollect = blogger.get('LikeCollectCount')
                item = QianguaSpiderItem()
                item['name'] = name
                item['level'] = level
                item['fans'] = fans
                item['likeCollect'] = likeCollect
                yield item

  最后我們添加pipelines.py保存解析的數據,我們是將數據保存到csv文件中

  代碼如下:

import csv
from itemadapter import ItemAdapter


class QianguaSpiderPipeline:
    def __init__(self):
        self.stream = open('blogger.csv', 'w', newline='', encoding='utf-8')
        self.f = csv.writer(self.stream)

    def open_spider(self, spider):
        print("爬蟲開始...")

    def process_item(self, item, spider):
        data = [item.get('name'), item.get('level'), item.get('fans'), item.get('likeCollect')]
        self.f.writerow(data)

    def close_spider(self, spider):
        self.stream.close()
        print('爬蟲結束!')

  務必記得將settings.py中pipelines部分的代碼注釋取消掉

ITEM_PIPELINES = {
   'qiangua_spider.pipelines.QianguaSpiderPipeline': 300,
}

  執行爬蟲

  scrapy crawl qiangua

  結果很令我們滿意

Scrapy與Selenium完美結合獲取小紅書漲粉榜單4773

 

更多關于python培訓的問題,歡迎咨詢千鋒教育在線名師。千鋒教育擁有多年IT培訓服務經驗,采用全程面授高品質、高體驗培養模式,擁有國內一體化教學管理及學員服務,助力更多學員實現高薪夢想。

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
色综合老司机第九色激情 _中文字幕日韩av资源站_国产+人+亚洲_久久久精品影院_久久久视频免费观看_欧美激情亚洲自拍_亚洲成av人片在线观看香蕉_热草久综合在线_欧美极品第一页_2020国产精品自拍
国产在线不卡视频| 国产精品一区二区在线播放| 精品人在线二区三区| 一区二区三区四区精品在线视频| 国产suv精品一区二区6| 国产亚洲综合av| 岛国精品在线播放| 国产目拍亚洲精品99久久精品| 秋霞成人午夜伦在线观看| 日韩欧美一区二区在线视频| 美女mm1313爽爽久久久蜜臀| 日韩精品一区二区三区视频| 精品亚洲欧美一区| 日本一区二区电影| 在线亚洲精品福利网址导航| 亚洲高清免费视频| 欧美电影免费提供在线观看| 久久成人免费网| 国产欧美一区视频| 欧美日韩黄色影视| 国产高清在线观看免费不卡| 一区二区三区四区激情 | av在线播放成人| 亚洲午夜久久久久中文字幕久| 欧美一级高清片| 99国产精品国产精品毛片| 亚洲超丰满肉感bbw| 国产清纯美女被跳蛋高潮一区二区久久w | 亚洲高清中文字幕| 久久久久久久性| 欧美日韩亚洲丝袜制服| 国产精品99久久久久久久vr| 亚洲国产日日夜夜| 国产精品免费丝袜| 久久久久高清精品| 日韩欧美一二三四区| 欧美性猛交xxxx黑人交| 国产精品18久久久久久久久久久久| 亚洲男同性恋视频| 欧美极品xxx| 日韩欧美一区二区久久婷婷| 欧美日韩国产小视频在线观看| 成人综合婷婷国产精品久久蜜臀| 秋霞电影一区二区| 人人超碰91尤物精品国产| 亚洲精品水蜜桃| 国产精品久久久久久久久晋中| 久久婷婷成人综合色| 欧美不卡视频一区| 精品88久久久久88久久久| 日韩欧美一区电影| 欧美精品一区二区三区在线播放| 制服丝袜日韩国产| 91精品欧美久久久久久动漫| 91麻豆精品国产自产在线观看一区| 欧美日韩中文字幕一区二区| 欧美色区777第一页| 欧美精品日日鲁夜夜添| 88在线观看91蜜桃国自产| 日本亚洲电影天堂| 热久久一区二区| 麻豆精品蜜桃视频网站| 黄一区二区三区| 午夜视频在线观看一区二区| 悠悠色在线精品| 秋霞av亚洲一区二区三| 国产精品一区在线观看你懂的| 国产一区二区三区日韩| av中文字幕一区| 欧洲国内综合视频| 久久综合给合久久狠狠狠97色69| 久久久久久久久久久久电影 | 色哟哟国产精品| 欧美写真视频网站| 精品日本一线二线三线不卡| 久久久久久免费网| 一区二区在线观看不卡| 麻豆国产欧美一区二区三区| 国产乱码精品一区二区三区av | 日韩精品一二三四| 国产成人av福利| 欧美中文字幕一区| 久久亚洲精品小早川怜子| 亚洲欧洲精品一区二区精品久久久 | 免费一级片91| 成人午夜视频在线| 在线91免费看| 国产精品毛片久久久久久久| 日韩国产欧美在线视频| 99久久久久免费精品国产| 91麻豆精品国产自产在线| 国产精品成人一区二区艾草 | 亚洲精品一二三四区| 精品一区中文字幕| 在线91免费看| 亚洲影视在线观看| av一本久道久久综合久久鬼色| 欧美哺乳videos| 日韩精品乱码免费| 91黄视频在线观看| 亚洲欧洲日产国码二区| 不卡av在线免费观看| 久久精品视频免费观看| 视频一区二区三区在线| 欧美视频在线一区二区三区 | 91麻豆精品国产自产在线观看一区 | 午夜日韩在线电影| 在线观看国产91| 中文字幕色av一区二区三区| 国产一区二区三区久久久| 7777精品伊人久久久大香线蕉完整版 | 国产蜜臀av在线一区二区三区| 日韩电影免费一区| 欧美一级精品在线| 久久机这里只有精品| 91精品国产综合久久久久久久 | 欧洲生活片亚洲生活在线观看| 久久精品欧美日韩| 国产成人综合亚洲91猫咪| 久久久久国产精品免费免费搜索| 精品一区二区在线看| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 欧美亚洲综合一区| 亚洲国产日韩在线一区模特| 欧美日韩国产影片| 一区二区三区在线观看视频| 欧美日韩在线精品一区二区三区激情| av在线一区二区三区| 亚洲欧洲99久久| 在线观看成人小视频| 黄色精品一二区| 欧美一区二区三区播放老司机| 亚洲第四色夜色| 久久精品国产99| 91免费视频观看| 国产精品久久福利| 9色porny自拍视频一区二区| 亚洲欧洲综合另类在线| 欧美日韩一区二区在线观看视频| 蜜臀av一区二区在线观看| 亚洲国产激情av| 欧美夫妻性生活| 成人h精品动漫一区二区三区| 亚洲在线免费播放| 久久久久久久久蜜桃| 欧美日韩国产天堂| 高清日韩电视剧大全免费| 亚洲一区成人在线| 国产精品嫩草影院av蜜臀| 这里只有精品电影| 99久久伊人精品| 国产麻豆91精品| 日韩中文字幕av电影| 亚洲欧美一区二区不卡| 亚洲精品一区二区精华| 欧美军同video69gay| 91麻豆swag| 成人激情文学综合网| 国产麻豆精品视频| 久久国产精品99久久久久久老狼 | 最新国产成人在线观看| 91精品国产麻豆国产自产在线| 99精品国产99久久久久久白柏| 韩国精品一区二区| 蜜臀av性久久久久蜜臀aⅴ| 亚洲午夜一区二区三区| 一区二区三区四区在线播放 | 欧美一级二级三级乱码| 一本大道久久a久久综合| 国产美女精品人人做人人爽| 久久99这里只有精品| 精品亚洲免费视频| 蜜桃久久av一区| 国产在线精品不卡| 国产一区二区在线观看免费| 精品中文字幕一区二区小辣椒 | 亚洲小说欧美激情另类| 亚洲一区二区三区精品在线| 一区二区三区在线观看欧美| 亚洲国产va精品久久久不卡综合| 亚洲国产精品久久久久婷婷884 | 国产精品传媒入口麻豆| **网站欧美大片在线观看| 亚洲激情自拍视频| 亚洲成人综合在线| 久久aⅴ国产欧美74aaa| 国产精品77777| 91麻豆123| 在线播放欧美女士性生活| 精品av久久707| 亚洲日本韩国一区| 日本不卡一区二区三区| 国产剧情一区在线| 日本韩国一区二区三区| 日韩免费看网站| 国产精品美女久久福利网站| 樱花草国产18久久久久| 成人国产视频在线观看| 国产一区二区伦理| 色噜噜狠狠色综合中国|