包括的なガイド:Pandasのto_datetimeを使ったデータ処理の方法
Published on
データ分析と操作のための最も堅牢なPythonライブラリの1つがPandasです。時系列分析に非常に役立つPandasの柔軟な機能の1つが to_datetime()
関数です。このガイドでは、Pandasの to_datetime()
関数を使用して日付データを効果的に変換する方法について説明します。
Pythonでデータ可視化を素早く作成したいですか?
PyGWalker は、Jupyter Notebookベースの環境内でデータ分析および視覚化のワークフローをスピードアップするのに役立つオープンソースのPythonプロジェクトです。
PyGWalker (opens in a new tab) は、Pandas Dataframe(またはPolars Dataframe)をビジュアル UIに変換し、変数をドラッグアンドドロップしてグラフを簡単に作成できます。次のコードを使用して、次のようにします。
pip install pygwalker
import pygwalker as pyg
gwalker = pyg.walk(df)
これらのオンラインノートブックで今すぐPyGWalkerを実行できます。
そして、GitHubで⭐️をお願いします!
Kaggle NotebookでPyGWalkerを実行 (opens in a new tab) | Google ColabでPyGWalkerを実行 (opens in a new tab) | PyGWalkerに⭐️を付ける (opens in a new tab) |
---|---|---|
(opens in a new tab) | (opens in a new tab) | (opens in a new tab) |
Pandasの to_datetime()
関数の理解
Pandasの to_datetime()
関数は、日付の変換に柔軟で包括的なアプローチを提供します。これは、Pandasによって提供される広範な日付機能、例えばリサンプリングなどを活用する場合に便利です。
to_datetime()
の構文は以下のようになります。
pd.to_datetime(arg, errors='raise', dayfirst=False, yearfirst=False, utc=None, format=None, exact=True, unit=None, infer_datetime_format=False, origin='unix', cache=True)
この関数の主要なパラメータを分解してみましょう。
to_datetime()
のパラメータ
to_datetime()
関数を使用する場合、次の主要なパラメータを取り扱います。
-
arg
:実際に日付オブジェクトに変換したいデータです。int、float、string、datetime、list、tuple、Series、DataFrame、またはdictなど、多数のデータ型を受け付ける柔軟なパラメータです。 -
format
:このパラメータは、文字列をDateTimeオブジェクトに変換する際にPandasに解釈方法を指示します。 -
origin
:タイムスタンプを開始したい参照日。デフォルトでは「unix」と設定され、1970年01月01日に対応しています。独自のoriginを設定することもできます。 -
unit
:整数データがoriginに対してどの単位であるかを指定できます。たとえば、unit='s'として20203939を渡すと、Pandasはこれをoriginから20,203,939秒離れたと解釈します。 -
dayfirst
、yearfirst
:これらのパラメータは、dayまたはyearがフォーマットの最初に来る場合にPandasが日付を解析するのを助けます。
DateTimeフォーマットコード
フォーマットコードは、PandasにDateTime文字列がどのようなフォーマットであるかを指示するために不可欠です。いくつかの主要なフォーマットコードを以下に示します。
- %Y:世紀付きの年
- %m:月の数、ゼロパッド
- %d:日付、ゼロパッド
- %H:時間(24時間)、ゼロパッド
- %M:分、ゼロパッド
- %S:秒、ゼロパッド
- %f:マイクロ秒、ゼロパッド
to_datetime()
の使用例
パラメータとフォーマットコードの理解ができたので、いくつかの例を示します。
文字列を日付時刻オブジェクトに変換する
import pandas as pd
date_string = '2023-05-30'
date_object = pd.to_datetime(date_string)
print(date_object)
formatパラメータを使用して日付フォーマットを変更する
import pandas as pd
date_string = '30-05-2023'
date_object = pd.to_datetime(date_string, format='%d-%m-%Y')
print(date_object)
unitパラメータを使用して異なる時間単位を処理する
import pandas as pd
seconds_since_epoch = 160945
date_object = pd.to_datetime(seconds_since_epoch, unit='s')
print(date_object)
結論
Pandas to_datetime()
関数は、データ分析のツールキットで欠かせないツールです。日付を取り扱う際の柔軟性は非常に貴重です。このガイドを通じて、この関数を使用して日付を変換および操作する方法を正確に理解することができました。
import BeehiivEmbed from '../../../components/BeehiivEmbed';
<BeehiivEmbed />
の日本語訳は、「import BeehiivEmbed from '../../../components/BeehiivEmbed';
」というコードでBeehiivEmbedコンポーネントをインポートした後、<BeehiivEmbed />
というタグでそのコンポーネントを呼び出すことを意味します。