nyの個人的Tipsまとめ

ITやデータサイエンスのことを中心にアウトプットのために更新していきます。

【Python】pandas使い方まとめⅡ~JupyterNotebookで表示する行数を増やす~

1. 目的

 自分自身備忘録としてまとめています。  なので、深く掘り下げてはいませんが、他の方の役にも立てば幸いです。

2. 悩み事

 超有名なirisデータセットを例に使います。

#データ読み込み
from sklearn.datasets import load_iris
iris = load_iris()
#データフレームとして整形
import pandas as pd
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target
df.loc[df['target'] == 0, 'target'] = "setosa"
df.loc[df['target'] == 1, 'target'] = "versicolor"
df.loc[df['target'] == 2, 'target'] = "virginica"

df

f:id:ny7777:20210911135303p:plain

 見ての通り、データを読み込みデータフレームとして表示しようとしたところ、150行中最初の5行と最後の5行しか表示されず、間は「・・・」となってしまっています。

3. 早速、コードを

3.1 表示行数を変える

#maxの表示可能行数がわかる
pd.get_option("display.max_rows")

#表示行数を指定する(今回は150行を指定)
pd.set_option('display.max_rows', 150)

df

f:id:ny7777:20210911135507p:plain  一つ目のコードは現在の表示可能行数を示します。先ほどはこれが150より小さかったため、間が端折られてしまいました。

お気づきの方もいるかもしれませんが、この"display.max_rows"が10以上でも、表示しようとしている全体の行数より小さかった場合、強制的に10行になります。 (今回"display.max_rows"= 60でしたが150以下だったので、10行しか表示されませんでした。)

 今回は150まで表示するように指定したので、右側のカーソルで一番下まですべて確認できるようになりました。

3.2 表示列数を変える

#列 ver.
pd.get_option("display.max_columns")
pd.set_option('display.max_columns', 150)

 特徴量が多くなると、今度はカラムが増え、データフレームが横に伸びていきます。

 これについても同様に上のコードを実行しておくことで、表示列数をコントロールすることができます。

4. まとめ

 今回は以上です。

 統計量などの代表値で概観を把握することも大事ですが、今回のように生のデータを目視できる状態を作りたいときもあると思います。

 その際にはぜひ、こちらを参考にしていただければと思います。