【Python】pandas使い方まとめⅡ~JupyterNotebookで表示する行数を増やす~
1. 目的
自分自身備忘録としてまとめています。 なので、深く掘り下げてはいませんが、他の方の役にも立てば幸いです。
2. 悩み事
超有名なirisデータセットを例に使います。
#データ読み込み from sklearn.datasets import load_iris iris = load_iris() #データフレームとして整形 import pandas as pd df = pd.DataFrame(iris.data, columns=iris.feature_names) df['target'] = iris.target df.loc[df['target'] == 0, 'target'] = "setosa" df.loc[df['target'] == 1, 'target'] = "versicolor" df.loc[df['target'] == 2, 'target'] = "virginica" df
見ての通り、データを読み込みデータフレームとして表示しようとしたところ、150行中最初の5行と最後の5行しか表示されず、間は「・・・」となってしまっています。
3. 早速、コードを
3.1 表示行数を変える
#maxの表示可能行数がわかる pd.get_option("display.max_rows") #表示行数を指定する(今回は150行を指定) pd.set_option('display.max_rows', 150) df
一つ目のコードは現在の表示可能行数を示します。先ほどはこれが150より小さかったため、間が端折られてしまいました。
お気づきの方もいるかもしれませんが、この"display.max_rows"が10以上でも、表示しようとしている全体の行数より小さかった場合、強制的に10行になります。 (今回"display.max_rows"= 60でしたが150以下だったので、10行しか表示されませんでした。)
今回は150まで表示するように指定したので、右側のカーソルで一番下まですべて確認できるようになりました。
3.2 表示列数を変える
#列 ver. pd.get_option("display.max_columns") pd.set_option('display.max_columns', 150)
特徴量が多くなると、今度はカラムが増え、データフレームが横に伸びていきます。
これについても同様に上のコードを実行しておくことで、表示列数をコントロールすることができます。
4. まとめ
今回は以上です。
統計量などの代表値で概観を把握することも大事ですが、今回のように生のデータを目視できる状態を作りたいときもあると思います。
その際にはぜひ、こちらを参考にしていただければと思います。