1. 程式人生 > >向scrapy中的spider傳參,實現增量

向scrapy中的spider傳參,實現增量

爬蟲 scrapy

有時候需要根據項目的實際需求向spider傳遞參數來控制spider的運行方式。

比如說,1.根據用戶提交的url來控制spider爬取的網站。2.根據需求增量爬取數據。

今天就寫一個增量(augmenter)的方式:

1.首先在spider裏添加

技術分享圖片

註:在網上也看了不少的博客,最後發現*args, **kwargs這兩個必須加上,要不然會出現bug,不信的話可以試試哦!

如果想減少代碼量的話,可以寫到類裏面去繼承!那這樣的話,spider裏面就不要在寫了!!!要不然就不起作用了!!!

2.spider實現方式:

技術分享圖片


技術分享圖片


這樣就實現了簡單的增量!增量的方式有很多,常見的:時間、計數、爬取特定的幾頁!

註:工作中的遇到的一些問題,可能我的方法不一定是最好的,大家一起相互交流+扣扣781816703




向scrapy中的spider傳參,實現增量