2018-03-29から1日間の記事一覧

Mojibake Data Cleaning

KaggleのData Cleaning Challengeでファイルのエンコード方式の推測コードを知ったのでメモ 以下python import chardetopen("unknown-encoding-file.csv", "rb") as f: result = chardet.detect(f.read(10000))print(result) これを実行するとencoding: "Win…