Pandasのバージョン確認はこれで完璧!pd.show_versions()徹底解説 🐼
Pandasを使ってデータ分析を行う際、環境の確認は非常に重要です。特に、コードがうまく動作しない時にまず確認すべきなのが、Pandasのバージョンです。バージョンによって利用できる機能や挙動が異なるため、自分が使っているPandasのバージョンを把握しておくことは、スムーズな開発に繋がります。
この記事では、Pandasのバージョン情報を詳しく確認できる便利な機能pd.show_versions()に焦点を当て、その使い方や出力される情報について詳しく解説します。
pd.show_versions()とは?
pd.show_versions()は、Pandas、Numpy、Pythonなどの主要なライブラリのバージョン情報だけでなく、システム環境(OS、Pythonのビット数など)までまとめて表示してくれる関数です。これにより、開発環境の全体像を把握し、問題発生時の原因特定に役立てることができます。
pd.show_versions()の基本的な使い方
使い方は非常に簡単です。Pandasをインポートした後、pd.show_versions()を実行するだけです。
import pandas as pd
pd.show_versions()
pd.show_versions()の出力内容 📜
pd.show_versions()を実行すると、以下のような情報が出力されます。
INSTALLED VERSIONS (インストールされているバージョン)
このセクションでは、Pandas、Numpy、Python、そしてPandasが依存している主要なライブラリのバージョンが一覧で表示されます。
-
Python: 使用しているPythonのバージョンが表示されます。
-
pandas: 現在インストールされているPandasのバージョンです。
-
numpy: Pandasが内部で利用しているNumpyのバージョンです。
-
他の依存ライブラリ:
pytz、dateutil、matplotlib、scipy、IPythonなど、Pandasに関連する様々なライブラリのバージョンが表示されます。
サンプル出力例:
INSTALLED VERSIONS
------------------
commit : 0f438a6ccf377d04e54e449a62ad52945d81084b
python : 3.9.13.final.0
python-bits : 64
OS : Windows
OS-release : 10
Version : 10.0.19045
machine : AMD64
build : Release
processor : AMD64 Family 23 Model 112 Stepping 0, AuthenticAMD
byteorder : little
LC_ALL : None
LANG : ja_JP.cp932
LOCALE : ja_JP.cp932
pandas : 2.0.3
numpy : 1.24.4
pytz : 2023.3
dateutil : 2.8.2
setuptools : 67.8.0
pip : 23.1.2
Cython : None
matplotlib : 3.7.1
scipy : 1.10.1
sphinx : None
numexpr : 2.8.4
bottleneck : 1.3.5
blosc : None
fastparquet : None
fsspec : 2023.5.0
openpyxl : 3.1.2
xlrd : 2.0.1
lxml.etree : 4.9.2
bs4 : 4.12.2
html5lib : 1.1
gcsfs : None
s3fs : None
pymysql : None
psycopg2 : None
jinja2 : 3.1.2
IPython : 8.14.0
pandas_datareader: None
tqdm : 4.65.0
システム情報 (OS, Pythonのビット数など)
このセクションでは、OSの種類やバージョン、Pythonが32ビット版か64ビット版かといったシステムに関する情報が表示されます。これは、特定の環境でのみ発生する問題のデバッグに役立ちます。
-
OS: 使用しているオペレーティングシステム(例: Windows, Linux, macOS)。
-
python-bits: Pythonのビット数(32または64)。
-
machine: マシンのアーキテクチャ。
-
LOCALE: ロケール情報。
なぜpd.show_versions()が便利なのか? 🤔
1. 環境の再現性
他の開発者とコードを共有する際、pd.show_versions()の出力結果を共有することで、相手も同じ環境を構築しやすくなります。これは、**「私の環境では動くのに!」**といった問題を避けるために非常に重要です。
2. デバッグの効率化
エラーが発生した際に、使用しているライブラリのバージョンが古すぎたり、逆に新しすぎて互換性の問題が発生していることがあります。pd.show_versions()の出力を見ることで、これらの可能性を迅速に排除したり、原因を特定したりすることができます。
3. 情報収集の簡略化
例えば、Stack Overflowなどのコミュニティで質問をする際、自分の環境情報を正確に伝えることは、適切な回答を得るために不可欠です。pd.show_versions()の結果をそのまま貼り付けるだけで、必要な情報を網羅的に提供できます。
まとめ
pd.show_versions()は、Pandasを使った開発において、環境の確認やデバッグを効率的に行うための強力なツールです。何か問題が発生した際には、まずこの関数を実行して、ご自身の開発環境を把握することをおすすめします。



