
皆さんこんにちは
データの持ち方が全く同じのCSVファイルをまとめるにしても
非常に手間がかかるのでPythonやExcelでまとめるときに使う為ものを
記しておきます。
【前提】
データの構成(列数)がまったく同じであること。
使うものは
・python3.x
・jupyter Notebook
・csv
CSVファイルは同じフォルダにまとめておきましょう。
【やり方】
1.ジュピターで以下のライブラリをインポート
import pandas as pd
import glob
2.読み込むファイルのリストをパスから指定
csv_files = glob.glob(‘[[csvを入れているフォルダのパス]]/*.csv’)
3.読み込むファイルのリストを確認します
以下のコードででリストを表示します。
for a in csv_files:
print(a)
4.CSVファイルの中身を追加していくリストの準備
結合をするためのリストを用意します。
以下のコードで準備可能です。
data_list = []
5.読み込むファイルのリストを走らせる
for file in csv_files:
data_list.append(pd.read_csv(file))
6.リストを行の方向(縦方向)に結合する
df = pd.concat(data_list, axis=0, sort=True)
※axis=1にすると横方向に結合されます
7.CSVを吐き出す
df.to_csv(“[[csvを入れているフォルダのパス]]/unions.csv”,index=False)
この手順でCSVファイルの結合が可能です。
手間のかかることはPythonでやってしまいましょう。
コメントを残す