2025年8月16日 / 最終更新日 : 2025年8月16日 fujifuji コラム

Pandasで時系列データのタイムゾーンを完璧に処理！tz_localizeとtz_convert徹底解説

Pandasで時系列データを扱う際、タイムゾーンの扱いは非常に重要です。特に、異なる地域やシステムからのデータを統合する際には、タイムゾーンの概念を正しく理解し、適切に処理しないと、思わぬ時間ずれや誤った分析結果につながる可能性があります。

Pandasには、タイムゾーンを扱うための強力なメソッドとして**tz_localizeとtz_convert**があります。この記事では、これらのメソッドの基本的な使い方から、時系列データ分析におけるタイムゾーン処理のベストプラクティスまでを、分かりやすく解説します。

時系列データとタイムゾーンの基礎知識

なぜタイムゾーン処理が必要なのか？

例えば、「2024年7月1日 09:00」という時刻があったとします。これが東京時間（JST）であれば午前9時ですが、ロンドン時間（GMT）であれば深夜1時、ニューヨーク時間（EDT）であれば前日の午後8時になります。このように、同じ「9:00」でもタイムゾーンが異なれば、実際の時刻は大きく変わってしまいます。

正確なデータ分析や国際的な協力において、タイムゾーンの統一は不可欠です。

UTC (協定世界時) の重要性

UTC (Coordinated Universal Time) は、世界の標準時として広く使われています。タイムゾーンをまたぐデータを扱う際には、一度データをUTCに変換し、そこから必要なタイムゾーンに変換するという手順が推奨されます。これにより、時間計算の誤りを防ぎ、データの一貫性を保つことができます。

Pandas `tz_localize`メソッドで「タイムゾーン情報なし」のデータに情報を付与

tz_localizeメソッドは、タイムゾーン情報が明示されていない（”naive”な）DatetimeIndexやSeries/DataFrameにタイムゾーン情報を付与する際に使用します。これは、データが取得されたタイムゾーンが分かっている場合に使う操作です。

`tz_localize`の基本的な使い方

まずは、タイムゾーン情報を持たない（naiveな）Seriesを作成します。

Python 

import pandas as pd

# タイムゾーン情報を持たないSeriesの作成 (UTC+09:00のデータと仮定)
s_naive = pd.Series(
    [10, 20, 15],
    index=pd.to_datetime(['2024-07-01 09:00', '2024-07-01 10:00', '2024-07-01 11:00'])
)
print("元のnaiveなSeries:\n", s_naive)

# タイムゾーンを日本時間 (JST) に設定
s_localized_jst = s_naive.tz_localize('Asia/Tokyo')
print("\nJSTにtz_localizeしたSeries:\n", s_localized_jst)

この例では、元のs_naiveはタイムゾーン情報を持っていませんでしたが、tz_localize('Asia/Tokyo')を使うことで、インデックスにJSTのタイムゾーン情報が付与されました。この操作では、時間の値自体は変わりません。

`ambiguous`引数: 夏時間の扱い

夏時間（Daylight Saving Time: DST）の導入・終了日には、同じ「現地時刻」が2回現れたり（秋）、存在しなかったり（春）する場合があります。tz_localizeには、このような曖昧な時刻の扱いに対応するためのambiguous引数があります。

'NaT' (デフォルト): 曖昧な時刻をNaT (Not a Time) にする
'infer': DSTの規則から推測する（推奨）
'infer_dst': 夏時間側として解釈する
'nonexistent': 存在しない時刻をNaTにする
配列のようなオフセットを指定

通常はambiguous='infer'を使用するのが便利です。

Python 

# 例: 存在するが曖昧な時刻 (2024年は夏時間なし)
# 例えば、アメリカの夏時間開始日などでは、午前2時台がスキップされたり重複したりする
# サンプルでは強制的にambiguousなケースをシミュレートすることは難しいですが、概念として重要です。
# 参考: https://pytz.sourceforge.net/#localized-times-and-ambiguity

Pandas `tz_convert`メソッドで「タイムゾーン情報あり」のデータを別タイムゾーンに変換

tz_convertメソッドは、既にタイムゾーン情報を持っている（”aware”な）DatetimeIndexやSeries/DataFrameのタイムゾーンを、別のタイムゾーンに変換する際に使用します。これは、異なるタイムゾーン間でデータを比較・分析する際に不可欠な操作です。

`tz_convert`の基本的な使い方

先ほどtz_localizeでJSTに変換したSeriesを使って、UTCやニューヨーク時間に変換してみましょう。

Python 

# JSTにtz_localizeされたSeriesを使用
# s_localized_jst = pd.Series(
#     [10, 20, 15],
#     index=pd.to_datetime(['2024-07-01 09:00', '2024-07-01 10:00', '2024-07-01 11:00']).tz_localize('Asia/Tokyo')
# )

print("JSTのSeries:\n", s_localized_jst)

# UTCに変換
s_converted_utc = s_localized_jst.tz_convert('UTC')
print("\nUTCにtz_convertしたSeries:\n", s_converted_utc)

# ニューヨーク時間 (America/New_York) に変換
s_converted_ny = s_localized_jst.tz_convert('America/New_York')
print("\nニューヨーク時間にtz_convertしたSeries:\n", s_converted_ny)

この例では、元のJSTのデータが、UTCでは深夜、ニューヨーク時間では前日の午後に変換されていることが分かります。tz_convertでは、実際の時刻がタイムゾーンに合わせて調整されます。

注意点：`tz_convert`はnaiveなデータには使えない

tz_convertは、タイムゾーン情報が既に付与されているデータに対してのみ使用できます。タイムゾーン情報がないデータにtz_convertを適用しようとするとエラーが発生します。

Python 

# エラーになる例 (実行しない)
# s_naive.tz_convert('UTC') # -> TypeError: Cannot convert tz-naive to tz-aware

タイムゾーン処理のベストプラクティス

国際的な時系列データを扱う際の推奨される手順は以下の通りです。

データの読み込み: タイムゾーン情報がない状態で読み込む（もしあればそのまま利用）。
tz_localizeでタイムゾーンを付与: データがどの現地時間で取得されたか分かっている場合は、そのタイムゾーン情報をtz_localizeで付与します。
tz_convertでUTCに統一: 複数タイムゾーンのデータがある場合、分析前に一度すべてのデータをUTCに変換して統一します。UTCは夏時間の影響を受けないため、計算がシンプルになります。
必要に応じて現地時間に変換: 分析結果を表示したり、特定のタイムゾーンのシステムに渡したりする際に、最終的に必要なタイムゾーンにtz_convertで戻します。

この流れを意識することで、タイムゾーンによる複雑な問題を回避し、正確な時系列分析を行うことができます。

まとめ

Pandasのtz_localizeとtz_convertメソッドは、時系列データのタイムゾーン処理に不可欠な機能です。

tz_localize(tz): タイムゾーン情報がない（naiveな）データに、指定したタイムゾーンtzの情報を付与します。時刻の値は変わりません。
tz_convert(tz): タイムゾーン情報がある（awareな）データを、指定したタイムゾーンtzに変換します。時刻の値はタイムゾーンに合わせて調整されます。
国際的なデータを扱う際は、一度tz_localizeで現地時間を付与し、その後tz_convertでUTCに統一してから分析し、必要に応じて最終的な表示タイムゾーンにtz_convertで戻すのがベストプラクティスです。

これらのメソッドを使いこなすことで、タイムゾーンの壁を越え、グローバルな時系列データを正確かつ効率的に分析できるようになります。ぜひ、ご自身のデータで試してみてください。

プログラミング学習に関するお役立ちコンテンツ

Pandas 時系列データの「頻度 (freq)」を徹底解説！効率的な指定方法 🚀

カテゴリー: コラム

Pandasで時系列データのタイムゾーンを完璧に処理！tz_localizeとtz_convert徹底解説

時系列データとタイムゾーンの基礎知識

なぜタイムゾーン処理が必要なのか？

UTC (協定世界時) の重要性

Pandas `tz_localize`メソッドで「タイムゾーン情報なし」のデータに情報を付与

`tz_localize`の基本的な使い方

`ambiguous`引数: 夏時間の扱い

Pandas `tz_convert`メソッドで「タイムゾーン情報あり」のデータを別タイムゾーンに変換

`tz_convert`の基本的な使い方

注意点：`tz_convert`はnaiveなデータには使えない

タイムゾーン処理のベストプラクティス

まとめ

プログラミング学習に関するお役立ちコンテンツ

Pandas shiftでデータを行列方向にずらす！時系列分析に必須の操作

Pandasで時系列データのOHLC（四本値）を効率的に算出・ダウンサンプリング

時系列データとタイムゾーンの基礎知識

なぜタイムゾーン処理が必要なのか？

UTC (協定世界時) の重要性

Pandas tz_localizeメソッドで「タイムゾーン情報なし」のデータに情報を付与

tz_localizeの基本的な使い方

ambiguous引数: 夏時間の扱い

Pandas tz_convertメソッドで「タイムゾーン情報あり」のデータを別タイムゾーンに変換

tz_convertの基本的な使い方

注意点：tz_convertはnaiveなデータには使えない

タイムゾーン処理のベストプラクティス

まとめ

プログラミング学習に関するお役立ちコンテンツ

Pandas shiftでデータを行列方向にずらす！時系列分析に必須の操作

Pandasで時系列データのOHLC（四本値）を効率的に算出・ダウンサンプリング

Pandas `tz_localize`メソッドで「タイムゾーン情報なし」のデータに情報を付与

`tz_localize`の基本的な使い方

`ambiguous`引数: 夏時間の扱い

Pandas `tz_convert`メソッドで「タイムゾーン情報あり」のデータを別タイムゾーンに変換

`tz_convert`の基本的な使い方

注意点：`tz_convert`はnaiveなデータには使えない