encode 跟 decode的問題 #7
-
老師,我在處理TWSE(證交所)的CSV下載連結,要進行CSV裡面資料整理再存到另一個CSV檔中,但不是很懂為何原本的檔案是big5hkscs 的編碼,但存入csv檔中如果要用encoding='utf-8' 中文字全部都會是亂碼(看一些網頁介紹這樣就可以轉換成想要的編碼) ,只能用encoding='big5hkscs '中文字才不會是亂碼,不知道是哪邊的問題再麻煩老師提點一下謝謝喔!! import csv // url= 'https://www.twse.com.tw/zh/trading/historical/mi-stock20.html' with open('MI_INDEX20_20240205.csv', 'r', encoding='big5hkscs') as f: with open('copy_csv.csv', 'w', encoding='utf-8', newline='') as f: |
Beta Was this translation helpful? Give feedback.
Replies: 1 comment 1 reply
-
這是 Excel 的問題。如果你用文字編輯器(如 notepad++)打開轉碼後的文件,可以看到正確顯示的中文字,編碼也是 utf-8
|
Beta Was this translation helpful? Give feedback.
這是 Excel 的問題。如果你用文字編輯器(如 notepad++)打開轉碼後的文件,可以看到正確顯示的中文字,編碼也是 utf-8
但是 Excel 開啟文件時,需要先辨認文件開頭的一段特殊字串,才能使用正確的編碼,詳情可 google "excel utf-8 bon 編碼"
解決方法:把
utf-8
改成utf-8-sig
即可