Scrapy使用Anaconda

發表於 2019年10 月15日星期二上午 9:28:27

Scrapy是一個應用程序框架。它是一個開放源代碼的網路爬蟲。任何可查看的內容都可以使用scrapy進行抓取。它對爬網網站和提取結構化數據很有用。它可用於各種有用的應用程序，例如數據挖礦，信息處理或歷史檔案。

您最初需要的只是草率的官方文檔，python（如果可能的話，最新版本）和anaconda。

以下是使用anaconda從網站抓取網頁的幾個步驟：

* dir cmd向您顯示創建的文件。您也可以在桌面上檢查它。

*示例：scrapy開始項目exp

然後，打開一個文本編輯器。示例：記事本++

例如：*打開記事本++

*新文件

*轉到文件->另存為

*將地址複製並粘貼到Spider：C： Users Pushpa Giri Desktop Exp exp exp spiders，以將其另存為

*在保存之前，將python文件名附加到該文件名。

示例：C： Users Pushpa Giri Desktop Exp exp exp spiders code1.py

*保存文件。您可以看到在蜘蛛文件下創建的python文件。

該代碼由搜尋器名稱和網頁地址組成。

像這樣：name =「 quotes」

def start_requests（）：

網址=（

『http://quotes.toscrape.com/page/1/』，

『http://quotes.toscrape.com/page/2/』，

例如，

名稱=「硬幣」

def start_requests（）：

網址=（

『https://coinmarketcap.com/coins/』，

『https://coinmarketcap.com/tokens/』，

『https://coinmarketcap.com/rankings/exchanges/reported/』，

『https://coinmarketcap.com/exchanges/volume/24-hour/」，

『https://coinmarketcap.com/currencies/volume/monthly/」，

因此，如果要更改名稱或地址，可以在此處進行。

在這裡，cd Exp

示例：cd exp

要檢查，您可以使用cmd：dir檢查目錄是否由該文件組成。作為參考，您可以打開目錄並進行檢查。

桌面-> Exp-> exp

例如，刮y的爬行幣

提示中顯示了它。像這樣：蜘蛛關閉（完成）

這些是使用scrapy和anaconda抓取網頁時涉及的幾個步驟。這將幫助您抓取任何網站的表格內容。您也可以嘗試使用scrapy從網站上抓取不同類型的數據。

資訊來源：由0x資訊編譯自NVESTLABS。版權歸作者Anusha所有，未經許可，不得轉載