bugzilla匯出的csv檔案亂碼的問題
CSV英文全稱為Comma Separated Values,簡稱CSV,是一種純文字格式,用來儲存資料。
在CSV中,資料的欄位由逗號分開,程式通過讀取檔案重新建立正確的欄位,方法是每次遇到逗號時開始新一段資料。
bugzilla匯出的csv檔案亂碼的原因:
從bugzilla中匯出的CSV檔案為UTF-8格式,但是由於Microsoft Office Excel不能自動識別並轉換檔案格式,為此開啟的檔案顯示亂碼。
用記事本或者RedOffice開啟CSV檔案時,都需要先轉換一下編碼格式,變為Unicode格式,才能正常閱讀。
記事本轉換時如果選擇ANSI或者UTF-8仍舊出現亂碼是因為cvs檔案裡的中文或者其他字元的佔位符不同,不符合ANSI或者UTF-8編碼格式,故出現亂碼。
雖然UTF-8也是Unicode的一種,但是佔位符的多少有所差異,我們這裡所說的Unicode其實是UTF-16.
CSV檔案從bugzilla匯出後直接開啟會發生亂碼問題(下圖為一個.csv檔案開啟後亂碼的截圖)
解決亂碼問題,需要格式轉換後,才能正常顯示,以下是兩種可以正常的方法:
1. 用RedOffice開啟:
開啟一個Excel表,點選“開啟”
¡§¡è 選擇要開啟的.csv檔案,點開啟
¡§¡è 進入匯入文字介面:字符集選擇Unicode(UTF-8);分隔符選擇逗號 ,點確定
¡§¡è 開啟檔案無亂碼
2. 用文字開啟:
開啟記事本,點選開啟
¡§¡è 檔案型別為“所有檔案(*.*)”,選擇要開啟的.csv檔案,編碼為UTF-8,點開啟
¡§¡è選擇另存為
¡§¡è另存為的編碼為Unicode,點選儲存
¡§¡è 開啟檔案無亂碼
注:
另存為的格式一定要是Unicode,如果選擇ANSI格式,則仍舊會有亂碼
另存為ANSI格式後,仍舊有部分內容為亂碼
轉載於:https://my.oschina.net/tadcat/blog/149246