Pandas DataFrameの「大きさ」を把握!行数・列数・要素数の取得方法 📏


 

Pandasでデータ分析を始める際、まず知りたいのがDataFrameの「大きさ」、つまり行数列数、そして**全要素数(サイズ)**ではないでしょうか。これらの情報は、データの全体像を把握し、その後の分析計画を立てる上で非常に重要です。

この記事では、DataFrameのこれら3つの主要な情報を取得する方法を、初心者の方にも分かりやすいように解説します。


 

DataFrameの「大きさ」を知る重要性 💡

 

データ分析において、DataFrameのサイズを把握することは、以下のような点で役立ちます。

  • データ規模の確認: 処理にどれくらいの時間がかかるか、メモリは足りるかなどの目安になります。

  • エラーチェック: 想定外の行数や列数になっている場合、データ読み込みや前処理に問題があったと気づけます。

  • ループ処理の制御: 特定の行数や列数に基づいて処理を分岐させる際に必要です。


 

行数、列数、全要素数の取得方法 📊

 

PandasのDataFrameには、これらの情報を簡単に取得できる便利な属性やメソッドが用意されています。

 

1. 行数と列数をまとめて取得する: .shape

 

DataFrame行数列数を同時に取得するには、.shape属性を使います。これはタプルとして(行数, 列数)の形式で返されます。

Python
 
import pandas as pd

# サンプルDataFrameを作成
df = pd.DataFrame({
    '名前': ['Alice', 'Bob', 'Charlie', 'David'],
    '年齢': [25, 30, 35, 40],
    '都市': ['Tokyo', 'Osaka', 'Nagoya', 'Fukuoka']
})

# .shapeで行数と列数を取得
rows, cols = df.shape
print(f"行数: {rows}, 列数: {cols}")
# 出力例: 行数: 4, 列数: 3

 

2. 行数のみを取得する: len() または .shape[0]

 

DataFrame行数だけを知りたい場合は、Pythonの組み込み関数len()を使うか、.shape属性の最初の要素(インデックス0)にアクセスします。

Python
 
import pandas as pd

df = pd.DataFrame({
    '名前': ['Alice', 'Bob', 'Charlie', 'David'],
    '年齢': [25, 30, 35, 40],
    '都市': ['Tokyo', 'Osaka', 'Nagoya', 'Fukuoka']
})

# len()で取得
print(f"行数 (len()): {len(df)}")

# .shape[0]で取得
print(f"行数 (.shape[0]): {df.shape[0]}")
# 出力例:
# 行数 (len()): 4
# 行数 (.shape[0]): 4

 

3. 列数のみを取得する: .shape[1]

 

列数だけを知りたい場合は、.shape属性の2番目の要素(インデックス1)にアクセスします。

Python
 
import pandas as pd

df = pd.DataFrame({
    '名前': ['Alice', 'Bob', 'Charlie', 'David'],
    '年齢': [25, 30, 35, 40],
    '都市': ['Tokyo', 'Osaka', 'Nagoya', 'Fukuoka']
})

# .shape[1]で取得
print(f"列数 (.shape[1]): {df.shape[1]}")
# 出力例: 列数 (.shape[1]): 3

 

4. 全要素数を取得する: .size

 

DataFrameに含まれる全ての要素の数(行数 × 列数)を取得するには、.size属性を使います。

Python
 
import pandas as pd

df = pd.DataFrame({
    '名前': ['Alice', 'Bob', 'Charlie', 'David'],
    '年齢': [25, 30, 35, 40],
    '都市': ['Tokyo', 'Osaka', 'Nagoya', 'Fukuoka']
})

# .sizeで全要素数を取得
print(f"全要素数 (.size): {df.size}")
# 出力例: 全要素数 (.size): 12 (4行 × 3列 = 12要素)

 

まとめ

 

PandasのDataFrame行数列数全要素数を取得する方法は非常に簡単です。

  • 行数と列数: .shape

  • 行数のみ: len(df) または df.shape[0]

  • 列数のみ: df.shape[1]

  • 全要素数: df.size

これらの属性やメソッドを使いこなすことで、Pandasを使ったデータ分析の第一歩をスムーズに踏み出せるでしょう。データ処理の各段階でこれらの情報を確認する習慣をつければ、予期せぬエラーの早期発見にも繋がり、より堅牢な分析コードを書けるようになります。