Python，自己修改的爬去淘寶網頁的程式碼解決Python爬蟲爬取淘寶商品資訊也不報錯，也不輸出資訊

阿新 • • 發佈：2019-01-03

程式碼部分：
下面是正確的：

import requests
import re


def getHTMLText(url):
    try:
        r = requests.get(url, timeout = 30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return ""

def parsePage(ilt, html):
    try:
        plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"',html)
        fee = re.findall(r'\"view_fee\"\:\"[\d\.]*\"',html)
        xiao = re.findall(r'\"view_sales\"\:\".*?\"',html)
        tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
        shop = re.findall(r'\"nick\"\:\".*?\"',html)
        for i in range(len(plt)):
            price = eval(plt[i].split(':')[1])
            feeprice = eval(fee[i].split(':')[1])
            xiaoliang = eval(xiao[i].split(':')[1])
            title = eval(tlt[i].split(':')[1])
            shopname = eval(shop[i].split(':')[1])
            ilt.append([price,feeprice,xiaoliang,title,shopname])#,sal
    except:
        print("")



def printGoodsList(ilt):
    tplt = "{:4}\t{:8}\t{:8}\t{:8}\t{:16}\t{:8}"
    print(tplt.format("序號","價格","郵費","銷量","商品名稱            		                        ","店鋪名稱"))
    count = 0
    for g in ilt:
          count = count + 1
          print(tplt.format(count,g[0],g[1],g[2],g[3],g[4]))
          
def main():
    goods = '書包'
    depth = 1
    start_url = 'https://s.taobao.com/search?q=' + goods
    infoList = []
    for i in range(depth):
        try:
            url = start_url + '&s=' + str(44*i)
            html = getHTMLText(url)
            parsePage(infoList, html)
        except:
            continue
    printGoodsList(infoList)

main()

這個爬取的正則表示式：
在這裡插入圖片描述
其中在爬取銷量那個標籤的時候，沒有報錯。
但是也不會出現自己想要的東西。其他的爬取成功的資訊也不會顯示出來。
後來，我看了看網頁原始碼：
其中有個“人付款”，這個是中文的呀。
明顯用數字的正則表示式來爬取是不可以爬取到，也許是因為超時了？
反正就是什麼都輸出不來。

成功示例圖：

在這裡插入圖片描述
失敗示例圖：

程式碼，真有意思！

Python，自己修改的爬去淘寶網頁的程式碼解決Python爬蟲爬取淘寶商品資訊也不報錯，也不輸出資訊

程式碼部分：下面是正確的： import requests import re def getHTMLText(url): try: r = requests.get(url, timeout = 30) r.raise_for_stat

Python，自己修改的爬去淘寶網頁的程式碼解決Python爬蟲爬取淘寶商品資訊也不報錯，也不輸出資訊

程式碼部分：下面是正確的： import requests import re def getHTMLText(url): try: r = requests.get(ur

python程式碼本地執行不報錯，上傳伺服器後報錯？？？

本地執行是成功的，程式碼也更新了，但在伺服器上執行程式碼就報錯了，500 Internal Server ErrorThe server encountered an internal error and was unable to complete your request. Either t

原！tomcat啟動超時（打印了幾行日誌，後面沒了。也不報錯，處於啟動狀態，直到超時）

str tro 啟動項 dao 配置 spa 配置文件 size 結果項目框架：spring+struts2+mybatis 今天優化代碼，改了一堆mybatis dao和xml文件，啟動項目時，就出現如標題描述的狀況：打印了幾行日誌，後面就不打印了，也不報錯，處於啟動狀

（已解決）拷貝dll檔案到另一個專案，編譯不報錯，執行報錯“未能載入檔案或程式集...”

未能載入檔案或程式集“JUtility, Version=1.0.0.0, Culture=neutral, PublicKeyToken=null”或它的某一個依賴項。試圖載入格式不正確的程式。需要注意該dll生成的目標平臺：右擊專案-生成-目標平臺, 引用這個dll的專案

angular5父子元件的使用，執行時不報錯，build時報錯:

ERROR in : Type CompanyTreeComponent in D:/Project/ys-web1/src/app/system/manage/companyManage/companyTree/companyTree.component.ts is part of the d

springboot專案下，service層注入其他service時，沒有新增@Autowired，專案中不報錯，就是報空指標

這個問題讓我折騰了快一天，因為這個方法是個通用方法，在別的service都能執行成功，就是在此service下執行不成功，無意間發現了@autowired註解沒有加，協同開發不知道誰不小心刪除了吧。但是springboot也不報錯， try...catch後總是報空指

visual studio 2017裡發現的問題，為什麼C檔案不報錯，CPP檔案報錯

在visual studio 2017裡寫這個程式碼。如果寫的是C檔案，編譯不報錯也能執行。如果寫的是CPP檔案，編譯報錯且不能執行嚴重性程式碼說明專案檔案行禁止顯示狀態錯誤 C2440 “初始化”: 無法

springboot打包成功，釋出也不報錯，訪問也不報錯，但是登入訪問報錯xml...

原因是某個子模組的xml不能編譯打包。解決辦法：在pom.xml中新增如下程式碼 <build> <resources> <resource> <directory>src/m

行內onclick傳入動態字串，在ie11上面點選無反應，也不報錯，chrome就可以，怎麼解決

html += "<span class='tabtop' style='color:#0092ff;' onclick=conSee(\'"+row[0]+"\')>檢視</span>"; //呼叫 function conSee(id) {

Android 使用Sqlite資料庫時，插入了資料，不報錯，但查詢不到

Android 使用Sqlite資料庫時，插入了資料，不報錯，但查詢不到 (初學者)今天寫安卓的時候遇見這麼一個問題，我覺得挺有趣的，就是cursor查詢時，用cursor.getString(1)，這種居然不能精確定位到行位置（可能是從0開始？有時間再細糾一下），得用cur

SpringBoot+jpa配置自動建立表不報錯，卻不建立表

原因找了網上很多答案，均不對，包括以下幾種：包導的不對配置檔案不對註解寫的不對 … 最後發現原因： Sprint的入口檔案在子目錄裡了，應該比其他諸如server、dao、domain高一級。例如：service檔案所在為com.wds.met

tomcat啟動閃退且不報錯，多tomcat啟動時環境變數，埠衝突解決方案

問題描述：（補充：閃退可以用記事本開啟startup.bat，新增 pause 這個單詞在文字的最後一行，即可防止退出並檢視相關資訊）出現閃退的時候，是使用solr時需要開另外一個tomcat，因此去啟動startup.bat,出現如下圖：後來發現自己

SpringMVC，啟動不報錯，配置看起來都正確，但接不到值

今天自己建立一個SpringMVC的WEB工程，配置看起來都正確，但接不到值，後來一步步對比原來的工程，發現SpringMVC.xml裡缺了這個，原來的工程是用它來上傳檔案的，以為是不必要的，所以沒加，就出現了接不到POST的值了。 <bean id="multipa

Intellij IDEA 2017 Maven匯入依賴包失敗 Pom.xml不報錯，MavenProjects紅色波浪線。

背景：匯入maven web專案，匯入完畢之後，maven遠端下載依賴包，發現無論是重新匯入，還是配置maven遠端倉庫，都是徒勞。CSDN上有幾個弟兄，說要清除Intellij的快取，或者先將有波浪線的包配置在Pom.xml檔案中刪除，然後再恢復就好了。無奈，

js瀏覽器控制檯不報錯，但不執行下面的js程式碼

今天在寫程式碼是碰到一個很奇葩的錯誤，在控制檯不報錯，但下面的js程式碼就是不執行，我就把下面的js程式碼放到最上面，可以執行，在這樣一步一步往下放，最終找到了一段不是方法的js程

使用springmvc 接收上傳圖片，在手機 ios 上，有圖片上傳就不報錯，沒有就報下面這個錯誤，然後在pc端跟安卓手機上就不會有這個錯誤，這是為什麼呢？

七月 18, 2018 4:04:22 下午 org.apache.catalina.core.StandardWrapperValve invoke 嚴重: Servlet.service() for servlet [springMVC] in context with

eclipse起不來，也不報錯，閃一下就退了，不讀條

win8.1和win8差別好大，win8.1裝軟體總是報2503啊什麼的，還安裝與解除安裝混亂。關於eclipse的問題首先執行命令列 win+r 執行命令java -version 檢視結果，是不是成功安裝了jdk或者已經安裝好的jdk還健在，這是你會發現jdk不正

Spring quartz定時器不報錯，但不執行

原理現在我還沒有太搞懂，可能是因為專案執行緒併發量太少導致。解決方法： <bean id="helloJob" class="org.springframework.scheduling.quartz.MethodInvokingJobDetailFactoryB

關於查詢中查詢無果，也不報錯，inpout標簽中的value屬性為‘ ’的判斷問題

可能 alt png 什麽會什麽技術分享過濾 http 報錯首先當我們標簽中vlue屬性可能為‘ ‘時，我們一定要在後端進行判斷過濾，不然查詢會什麽都查不出來的，遇到的問題如下例子如下：這是一個easyui 中的下拉選，效果如下當我們默認查詢全

Python，自己修改的爬去淘寶網頁的程式碼 解決Python爬蟲爬取淘寶商品資訊也不報錯，也不輸出資訊

相關推薦

Python，自己修改的爬去淘寶網頁的程式碼解決Python爬蟲爬取淘寶商品資訊也不報錯，也不輸出資訊