Una guía completa: Cómo usar Pandas to_datetime para el procesamiento de datos
Published on
Una de las bibliotecas de Python más robustas para el análisis y manipulación de datos es Pandas. Una función versátil dentro de Pandas que ayuda significativamente en el análisis de series de tiempo es la función to_datetime()
. En esta guía, profundizaremos en cómo puedes utilizar la función to_datetime()
de Pandas para convertir tus datos de fecha de manera efectiva.
¿Quieres crear visualizaciones de datos rápidamente en Python?
PyGWalker es un proyecto de código abierto de Python que puede ayudar a acelerar el flujo de trabajo de análisis y visualización de datos directamente dentro de entornos basados en Jupyter Notebook.
PyGWalker (opens in a new tab) convierte tu DataFrame de Pandas (o DataFrame de Polars) en una interfaz de usuario visual donde puedes arrastrar y soltar variables para crear gráficos con facilidad. Simplemente usa el siguiente código:
pip install pygwalker
import pygwalker as pyg
gwalker = pyg.walk(df)
Puedes usar PyGWalker ahora mismo con estas libretas en línea:
¡Y no olvides darnos ⭐️ en GitHub!
Comprendiendo la función Pandas to_datetime()
Pandas to_datetime()
ofrece un enfoque flexible y completo para manejar conversiones de fechas. Convierte eficientemente una representación de cadena de una fecha en un formato de fecha real, lo cual es útil al aprovechar la vasta funcionalidad de fechas proporcionada por Pandas, como el remuestreo.
La sintaxis de to_datetime()
es la siguiente:
pd.to_datetime(arg, errors='raise', dayfirst=False, yearfirst=False, utc=None, format=None, exact=True, unit=None, infer_datetime_format=False, origin='unix', cache=True)
Desglosemos los parámetros clave de esta función.
Parámetros de to_datetime()
Aquí están los parámetros principales con los que interactuarás al usar la función to_datetime()
:
-
arg
: Estos son los datos reales que deseas convertir en un objeto de fecha y hora. Es un parámetro flexible que acepta numerosos tipos de datos como int, float, string, datetime, list, tuple, Series, DataFrame o dict. -
format
: Este parámetro indica a Pandas cómo interpretar tus cadenas al convertirlas en objetos DateTime. -
origin
: La fecha de referencia desde la cual deseas que comiencen tus marcas de tiempo. De manera predeterminada, se establece en 'unix', lo cual corresponde a 1970-01-01. También puedes establecer tu propio origen. -
unit
: Esto te permite especificar la unidad que representa tus datos enteros, en relación con el origen. Por ejemplo, si pasas20203939
con la unidad 's', Pandas lo interpretará como 20,203,939 segundos desde el origen. -
dayfirst
yyearfirst
: Estos parámetros ayudan a Pandas a analizar fechas si tu día o año aparece primero en tu formato, respectivamente.
Códigos de formato de fecha y hora
Los códigos de formato son esenciales para indicarle a Pandas en qué formato se encuentra tu cadena de fecha y hora. Aquí hay algunos códigos de formato clave:
- %Y: Año con siglo
- %m: Número de mes, ceros a la izquierda
- %d: Día del mes, ceros a la izquierda
- %H: Hora (formato de 24 horas), ceros a la izquierda
- %M: Minuto, ceros a la izquierda
- %S: Segundo, ceros a la izquierda
- %f: Microsegundo, ceros a la izquierda
Ejemplos de uso de to_datetime()
Ahora que entendemos los parámetros y los códigos de formato, veamos algunos ejemplos.
Convertir una cadena en un objeto de fecha y hora
import pandas as pd
cadena_fecha = '2023-05-30'
objeto_fecha = pd.to_datetime(cadena_fecha)
print(objeto_fecha)
Cambiar el formato de fecha usando el parámetro format
import pandas as pd
cadena_fecha = '30-05-2023'
objeto_fecha = pd.to_datetime(cadena_fecha, format='%d-%m-%Y')
print(objeto_fecha)
Manejar diferentes unidades de tiempo con el parámetro unit
import pandas as pd
segundos_desde_epoch = 160945
9200
objeto_fecha = pd.to_datetime(segundos_desde_epoch, unit='s')
print(objeto_fecha)
Conclusión
En conclusión, la función to_datetime()
de Pandas es una herramienta indispensable en tu conjunto de herramientas de análisis de datos. La flexibilidad que ofrece al tratar con fechas es invaluable. Con esta guía, ahora tienes una comprensión sólida de cómo convertir y manipular fechas utilizando esta función.