久久国产精品99,国产精品无码Av在线观看播放

首頁 > 資訊 > > 正文

全球熱議:Scrapy爬蟲Response子類在應(yīng)用中的問題解析

2023-05-17 12:20:50 來源：腳本之家

正文

今天用scrapy爬取壁紙的時候（url：http://pic.netbian.com/4kmein...）絮叨了一些問題，記錄下來，供后世探討，以史為鑒。**

(資料圖片)

因為網(wǎng)站是動態(tài)渲染的，所以選擇scrapy對接selenium（scrapy抓取網(wǎng)頁的方式和requests庫相似，都是直接模擬HTTP請求，而Scrapy也不能抓取JavaScript動態(tài)渲染的網(wǎng)頁。）

所以在Downloader Middlewares中需要得到Request并且返回一個Response，問題出在Response，通過查看官方文檔發(fā)現(xiàn)class scrapy.http.Response(url[, status=200, headers=None, body=b"", flags=None, request=None])，隨即通過from scrapy.http import Response導(dǎo)入Response

輸入scrapy crawl girl得到如下錯誤：

*results=response.xpath("http://[@id="main"]/div[3]/ul/lia/img")
raise NotSupported("Response content isn"t text")
scrapy.exceptions.NotSupported: Response content isn"t text**

檢查相關(guān)代碼：

# middlewares.py
from scrapy import signals
from scrapy.http import Response
from scrapy.exceptions import IgnoreRequest
import selenium
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
class Pic4KgirlDownloaderMiddleware(object):
    # Not all methods need to be defined. If a method is not defined,
    # scrapy acts as if the downloader middleware does not modify the
    # passed objects.
    def process_request(self, request, spider):
        # Called for each request that goes through the downloader
        # middleware.
        # Must either:
        # - return None: continue processing this request
        # - or return a Response object
        # - or return a Request object
        # - or raise IgnoreRequest: process_exception() methods of
        #   installed downloader middleware will be called
        try:
            self.browser=selenium.webdriver.Chrome()
            self.wait=WebDriverWait(self.browser,10)
            self.browser.get(request.url)
            self.wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "#main > div.page > a:nth-child(10)")))
            return Response(url=request.url,status=200,request=request,body=self.browser.page_source.encode("utf-8"))
        #except:
            #raise IgnoreRequest()
        finally:
            self.browser.close()

推斷問題出在：

return Response(url=request.url,status=200,request=request,body=self.browser.page_source.encode("utf-8"))

查看Response類的定義

@property
    def text(self):
        """For subclasses of TextResponse, this will return the body
        as text (unicode object in Python 2 and str in Python 3)
        """
        raise AttributeError("Response content isn"t text")
    def css(self, *a, **kw):
        """Shortcut method implemented only by responses whose content
        is text (subclasses of TextResponse).
        """
        raise NotSupported("Response content isn"t text")
    def xpath(self, *a, **kw):
        """Shortcut method implemented only by responses whose content
        is text (subclasses of TextResponse).
        """
        raise NotSupported("Response content isn"t text")

說明Response類不可以被直接使用，需要被繼承重寫方法后才能使用

響應(yīng)子類

**TextResponse對象**
class scrapy.http.TextResponse(url[, encoding[, ...]])
**HtmlResponse對象**
class scrapy.http.HtmlResponse(url[, ...])
**XmlResponse對象**
class scrapy.http.XmlResponse（url [，... ] ）

舉例觀察TextResponse的定義from scrapy.http import TextResponse

導(dǎo)入TextResponse發(fā)現(xiàn)

class TextResponse(Response):
    _DEFAULT_ENCODING = "ascii"
    def __init__(self, *args, **kwargs):
        self._encoding = kwargs.pop("encoding", None)
        self._cached_benc = None
        self._cached_ubody = None
        self._cached_selector = None
        super(TextResponse, self).__init__(*args, **kwargs)

其中xpath方法已經(jīng)被重寫

@property
    def selector(self):
        from scrapy.selector import Selector
        if self._cached_selector is None:
            self._cached_selector = Selector(self)
        return self._cached_selector
    def xpath(self, query, **kwargs):
        return self.selector.xpath(query, **kwargs)
    def css(self, query):
        return self.selector.css(query)

所以用戶想要調(diào)用Response類，必須選擇調(diào)用其子類,并且重寫部分方法

Scrapy爬蟲入門教程十一 Request和Response（請求和響應(yīng)）

scrapy文檔：https://doc.scrapy.org/en/lat...

中文翻譯文檔：https://www.jb51.net/article/248161.htm

以上就是Scrapy爬蟲Response子類在應(yīng)用中的問題解析的詳細內(nèi)容，更多關(guān)于Scrapy爬蟲Response子類應(yīng)用的資料請關(guān)注腳本之家其它相關(guān)文章！

標(biāo)簽：

[ 相關(guān)新聞 ]

您可能感興趣

有基礎(chǔ)有條件、有信心有能力保持經(jīng)濟平穩(wěn)健康可持續(xù)發(fā)

鐵路等部門守護平安春運途

北京現(xiàn)有開放博物館197家

今日熱點

教育

傳輸?shù)臄?shù)據(jù)交換方式有幾種 DCE中的數(shù)據(jù)傳輸該如何理解？

2022-03-18 15:03:32

數(shù)據(jù)傳輸方式是什么意思并行傳輸和串行傳輸都可以使用嗎？

2022-03-18 15:01:59

數(shù)據(jù)傳輸是什么意思基本傳輸分類有幾種？

2022-03-18 15:00:36

冰壺混雙一天兩賽花滑男單女單出戰(zhàn)

2022-02-07 16:16:27

《狙擊手》排片上升能否逆襲還是懸念

2022-02-07 16:16:27

中日女冰交手關(guān)乎出線資格

2022-02-07 16:16:27

《人民冰雪·冰雪科技談》：五大關(guān)鍵技術(shù)保障冬奧賽區(qū)100

2022-02-07 16:16:27

在華留學(xué)生的“中國年”：學(xué)年俗、品“年味” 他鄉(xiāng)亦故鄉(xiāng)

2022-02-07 16:16:25

荷蘭女將為“冰絲帶”寫下首個冬奧紀(jì)錄

2022-02-07 16:16:25

產(chǎn)品

“冰墩墩”為何可愛可親（冬奧觀瀾）肩并肩參賽手牽手前行（盛會進行時）光盤行動常態(tài)化文明過節(jié)樹新風(fēng) 搭建大舞臺實干創(chuàng)未來 “動態(tài)清零”是香港抗疫的科學(xué)選擇努力成為闡釋黨的創(chuàng)新理論堅強陣地（信息快遞）更好推動新時代中國史學(xué)發(fā)展（學(xué)苑論衡）用榜樣的力量激勵人心（新書評介）把非物質(zhì)文化遺產(chǎn)保護好傳承好（大家手筆）在增強歷史自覺與歷史擔(dān)當(dāng)中創(chuàng)造歷史偉業(yè)（構(gòu)建中國特色

精品久久亚洲中文字幕无码_665566综合网的软件优势_亚洲av无码久久_亚洲资源xyz_免费无码无遮挡不卡网站

全球熱議:Scrapy爬蟲Response子類在應(yīng)用中的問題解析

目錄

正文

輸入scrapy crawl girl得到如下錯誤：

查看Response類的定義

響應(yīng)子類

您可能感興趣

今日熱點

5萬余人參與冬奧城市運行保障

挪威無愧“雪上大國”中國滑雪“借雞孵蛋”

巡診服務(wù)溫暖烈士親屬

運氣？實力！首金來之不易又水到渠成

鐵路等部門守護平安春運途

教育

傳輸?shù)臄?shù)據(jù)交換方式有幾種 DCE中的數(shù)據(jù)傳輸該如何理解？

數(shù)據(jù)傳輸方式是什么意思并行傳輸和串行傳輸都可以使用嗎？

數(shù)據(jù)傳輸是什么意思基本傳輸分類有幾種？

冰壺混雙一天兩賽花滑男單女單出戰(zhàn)

《狙擊手》排片上升能否逆襲還是懸念

中日女冰交手關(guān)乎出線資格

《人民冰雪·冰雪科技談》：五大關(guān)鍵技術(shù)保障冬奧賽區(qū)100

在華留學(xué)生的“中國年”：學(xué)年俗、品“年味” 他鄉(xiāng)亦故鄉(xiāng)

荷蘭女將為“冰絲帶”寫下首個冬奧紀(jì)錄

產(chǎn)品

精品久久亚洲中文字幕无码_665566综合网的软件优势_亚洲av无码久久_亚洲资源xyz_免费无码无遮挡不卡网站

全球熱議:Scrapy爬蟲Response子類在應(yīng)用中的問題解析

目錄

正文

輸入scrapy crawl girl得到如下錯誤：

查看Response類的定義

響應(yīng)子類

您可能感興趣

今日熱點

5萬余人參與冬奧城市運行保障

挪威無愧“雪上大國”中國滑雪“借雞孵蛋”

巡診服務(wù)溫暖烈士親屬

運氣？實力！首金來之不易又水到渠成

鐵路等部門守護平安春運途

教育

傳輸?shù)臄?shù)據(jù)交換方式有幾種 DCE中的數(shù)據(jù)傳輸該如何理解？

數(shù)據(jù)傳輸方式是什么意思 并行傳輸和串行傳輸都可以使用嗎？

數(shù)據(jù)傳輸是什么意思 基本傳輸分類有幾種？

冰壺混雙一天兩賽 花滑男單女單出戰(zhàn)

《狙擊手》排片上升 能否逆襲還是懸念

中日女冰交手 關(guān)乎出線資格

《人民冰雪·冰雪科技談》：五大關(guān)鍵技術(shù)保障冬奧賽區(qū)100

在華留學(xué)生的“中國年”：學(xué)年俗、品“年味” 他鄉(xiāng)亦故鄉(xiāng)

荷蘭女將為“冰絲帶”寫下首個冬奧紀(jì)錄

產(chǎn)品

運氣？實力！首金來之不易又水到渠成

傳輸?shù)臄?shù)據(jù)交換方式有幾種 DCE中的數(shù)據(jù)傳輸該如何理解？

數(shù)據(jù)傳輸方式是什么意思并行傳輸和串行傳輸都可以使用嗎？

數(shù)據(jù)傳輸是什么意思基本傳輸分類有幾種？

冰壺混雙一天兩賽花滑男單女單出戰(zhàn)

《狙擊手》排片上升能否逆襲還是懸念

中日女冰交手關(guān)乎出線資格

在華留學(xué)生的“中國年”：學(xué)年俗、品“年味” 他鄉(xiāng)亦故鄉(xiāng)