Pandasのバージョン確認はこれで完璧!pd.show_versions()徹底解説 🐼


 

Pandasを使ってデータ分析を行う際、環境の確認は非常に重要です。特に、コードがうまく動作しない時にまず確認すべきなのが、Pandasのバージョンです。バージョンによって利用できる機能や挙動が異なるため、自分が使っているPandasのバージョンを把握しておくことは、スムーズな開発に繋がります。

この記事では、Pandasのバージョン情報を詳しく確認できる便利な機能pd.show_versions()に焦点を当て、その使い方や出力される情報について詳しく解説します。


 

pd.show_versions()とは?

 

pd.show_versions()は、Pandas、Numpy、Pythonなどの主要なライブラリのバージョン情報だけでなく、システム環境(OS、Pythonのビット数など)までまとめて表示してくれる関数です。これにより、開発環境の全体像を把握し、問題発生時の原因特定に役立てることができます。

 

pd.show_versions()の基本的な使い方

 

使い方は非常に簡単です。Pandasをインポートした後、pd.show_versions()を実行するだけです。

Python
 
import pandas as pd

pd.show_versions()

 

pd.show_versions()の出力内容 📜

 

pd.show_versions()を実行すると、以下のような情報が出力されます。

 

INSTALLED VERSIONS (インストールされているバージョン)

 

このセクションでは、PandasNumpyPython、そしてPandasが依存している主要なライブラリのバージョンが一覧で表示されます。

  • Python: 使用しているPythonのバージョンが表示されます。

  • pandas: 現在インストールされているPandasのバージョンです。

  • numpy: Pandasが内部で利用しているNumpyのバージョンです。

  • 他の依存ライブラリ: pytzdateutilmatplotlibscipyIPythonなど、Pandasに関連する様々なライブラリのバージョンが表示されます。

サンプル出力例:

INSTALLED VERSIONS
------------------
commit           : 0f438a6ccf377d04e54e449a62ad52945d81084b
python           : 3.9.13.final.0
python-bits      : 64
OS               : Windows
OS-release       : 10
Version          : 10.0.19045
machine          : AMD64
build            : Release
processor        : AMD64 Family 23 Model 112 Stepping 0, AuthenticAMD
byteorder        : little
LC_ALL           : None
LANG             : ja_JP.cp932
LOCALE           : ja_JP.cp932

pandas           : 2.0.3
numpy            : 1.24.4
pytz             : 2023.3
dateutil         : 2.8.2
setuptools       : 67.8.0
pip              : 23.1.2
Cython           : None
matplotlib       : 3.7.1
scipy            : 1.10.1
sphinx           : None
numexpr          : 2.8.4
bottleneck       : 1.3.5
blosc            : None
fastparquet      : None
fsspec           : 2023.5.0
openpyxl         : 3.1.2
xlrd             : 2.0.1
lxml.etree       : 4.9.2
bs4              : 4.12.2
html5lib         : 1.1
gcsfs            : None
s3fs             : None
pymysql          : None
psycopg2         : None
jinja2           : 3.1.2
IPython          : 8.14.0
pandas_datareader: None
tqdm             : 4.65.0

 

システム情報 (OS, Pythonのビット数など)

 

このセクションでは、OSの種類やバージョン、Pythonが32ビット版か64ビット版かといったシステムに関する情報が表示されます。これは、特定の環境でのみ発生する問題のデバッグに役立ちます。

  • OS: 使用しているオペレーティングシステム(例: Windows, Linux, macOS)。

  • python-bits: Pythonのビット数(32または64)。

  • machine: マシンのアーキテクチャ。

  • LOCALE: ロケール情報。


 

なぜpd.show_versions()が便利なのか? 🤔

 

 

1. 環境の再現性

 

他の開発者とコードを共有する際、pd.show_versions()の出力結果を共有することで、相手も同じ環境を構築しやすくなります。これは、**「私の環境では動くのに!」**といった問題を避けるために非常に重要です。

 

2. デバッグの効率化

 

エラーが発生した際に、使用しているライブラリのバージョンが古すぎたり、逆に新しすぎて互換性の問題が発生していることがあります。pd.show_versions()の出力を見ることで、これらの可能性を迅速に排除したり、原因を特定したりすることができます。

 

3. 情報収集の簡略化

 

例えば、Stack Overflowなどのコミュニティで質問をする際、自分の環境情報を正確に伝えることは、適切な回答を得るために不可欠です。pd.show_versions()の結果をそのまま貼り付けるだけで、必要な情報を網羅的に提供できます。


 

まとめ

 

pd.show_versions()は、Pandasを使った開発において、環境の確認やデバッグを効率的に行うための強力なツールです。何か問題が発生した際には、まずこの関数を実行して、ご自身の開発環境を把握することをおすすめします。