ひとメモ

主にプログラミングのメモ

ツイート履歴をpandasでcsvファイルに書き出し→読み込みするとズレる問題

www.hitowaft.work

上の記事に関連して小ネタを一つ。

ツイート履歴(tweet.jsから読み込んだもの)を編集した後に、再度csvファイルに書き出し(pandasのto_csv)、その後pd.read_csv()で読み込んだデータで、以下写真のようにnaが増えてしまうことがありました。

print(original_data.isnull().sum())
print(reloaded_data.isnull().sum())
f:id:hwhw:20200512132305p:plainf:id:hwhw:20200512132311p:plain

その場合は書き出す際にline_terminatorを以下のように指定すればOK。

df.to_csv('tweet_data.csv', index=False, line_terminator='\r\n')