1. 程式人生 > 實用技巧 >bugzilla匯出的csv檔案亂碼的問題

bugzilla匯出的csv檔案亂碼的問題

>>> hot3.png

CSV英文全稱為Comma Separated Values,簡稱CSV,是一種純文字格式,用來儲存資料。

在CSV中,資料的欄位由逗號分開,程式通過讀取檔案重新建立正確的欄位,方法是每次遇到逗號時開始新一段資料。

bugzilla匯出的csv檔案亂碼的原因:

從bugzilla中匯出的CSV檔案為UTF-8格式,但是由於Microsoft Office Excel不能自動識別並轉換檔案格式,為此開啟的檔案顯示亂碼。

用記事本或者RedOffice開啟CSV檔案時,都需要先轉換一下編碼格式,變為Unicode格式,才能正常閱讀。

記事本轉換時如果選擇ANSI或者UTF-8仍舊出現亂碼是因為cvs檔案裡的中文或者其他字元的佔位符不同,不符合ANSI或者UTF-8編碼格式,故出現亂碼。

雖然UTF-8也是Unicode的一種,但是佔位符的多少有所差異,我們這裡所說的Unicode其實是UTF-16.

CSV檔案從bugzilla匯出後直接開啟會發生亂碼問題(下圖為一個.csv檔案開啟後亂碼的截圖)

20121108021

解決亂碼問題,需要格式轉換後,才能正常顯示,以下是兩種可以正常的方法:

1. 用RedOffice開啟:

開啟一個Excel表,點選“開啟”

20121108022

¡§¡è 選擇要開啟的.csv檔案,點開啟

20121108023

¡§¡è 進入匯入文字介面:字符集選擇Unicode(UTF-8);分隔符選擇逗號 ,點確定

20121108024

¡§¡è 開啟檔案無亂碼

201211080251

2. 用文字開啟:

開啟記事本,點選開啟

20121108026

¡§¡è 檔案型別為“所有檔案(*.*)”,選擇要開啟的.csv檔案,編碼為UTF-8,點開啟

20121108027

¡§¡è選擇另存為

201211080281

¡§¡è另存為的編碼為Unicode,點選儲存

20121108029

¡§¡è 開啟檔案無亂碼

201211080301

注:

另存為的格式一定要是Unicode,如果選擇ANSI格式,則仍舊會有亂碼

20121108031

另存為ANSI格式後,仍舊有部分內容為亂碼

20121108032

轉載於:https://my.oschina.net/tadcat/blog/149246