Cómo crear un DataFrame vacío en Pandas
Published on
Como científico de datos, trabajar con conjuntos de datos es algo cotidiano. El conjunto de datos puede estar en forma de un archivo CSV (valores separados por comas), un archivo JSON (Notación de Objetos JavaScript), una base de datos SQL (Lenguaje de Consultas Estructurado) o una API externa (Interfaz de Programación de Aplicaciones). Una vez que tenemos el conjunto de datos, debemos trabajar en él para extraer patrones y conocimientos. Para hacer esto, utilizamos diversas herramientas y bibliotecas, una de las cuales es Pandas.
Pandas es una biblioteca de Python ampliamente utilizada para la manipulación y análisis de datos. Proporciona una interfaz fácil de usar para la limpieza, transformación y visualización de datos. DataFrame, Series e Index son los principales componentes de Pandas. En este artículo, nos centraremos en DataFrame y aprenderemos cómo crear un DataFrame vacío en Pandas.
¿Quieres crear visualizaciones de datos rápidamente en Python?
PyGWalker es un Proyecto de Python de código abierto que puede ayudar a acelerar el flujo de trabajo de análisis y visualización de datos directamente dentro de entornos basados en Jupyter Notebook.
PyGWalker (opens in a new tab) convierte tu DataFrame de Pandas (o DataFrame de Polars) en una interfaz de visualización donde puedes arrastrar y soltar variables para crear gráficos con facilidad. Simplemente usa el siguiente código:
pip install pygwalker
import pygwalker as pyg
gwalker = pyg.walk(df)
Puedes ejecutar PyGWalker en este momento con estos cuadernos en línea:
¡Y no olvides dar una ⭐️ en GitHub!
¿Qué es un DataFrame?
Un DataFrame es una estructura de datos bidimensional etiquetada con columnas de tipos potencialmente diferentes. Es similar a una hoja de cálculo o una tabla SQL, donde los datos se organizan en un formato tabular. Está compuesto por filas y columnas, donde cada fila representa un registro y cada columna representa una característica o atributo de ese registro. Un DataFrame es una estructura de datos versátil que puede contener varios tipos de datos, incluyendo enteros, flotantes, cadenas e incluso otras estructuras de datos de Pandas. Se pueden realizar operaciones en un DataFrame, como filtrado, recorte, unión y agregación.
¿Por qué necesitamos un DataFrame vacío?
Un DataFrame vacío es un DataFrame sin filas ni columnas. A veces es útil crear un DataFrame vacío y luego llenarlo más tarde con datos o agregar datos a él. Por ejemplo, si queremos almacenar datos sobre diferentes productos en un DataFrame, podemos crear un DataFrame vacío con columnas como ProductID, ProductName, ProductDescription, Price, etc., y luego llenarlo con datos de diferentes fuentes.
¿Cómo crear un DataFrame vacío?
Existen varias formas de crear un DataFrame vacío en Pandas. Aquí cubriremos tres métodos:
Método 1: Usando el constructor DataFrame()
La forma más fácil de crear un DataFrame vacío es utilizar el constructor DataFrame(). Este constructor devuelve un DataFrame vacío sin columnas ni filas. Aquí tienes un ejemplo:
import pandas as pd
df = pd.DataFrame()
print(df)
Output:
Empty DataFrame
Columns: []
Index: []
Podemos ver que el DataFrame df no tiene columnas ni filas. Para agregar columnas, simplemente podemos asignar una lista de nombres de columna a df.columns. Por ejemplo:
df.columns = ['ProductID', 'ProductName', 'ProductDescription', 'Price']
print(df)
Output:
Empty DataFrame
Columns: [ProductID, ProductName, ProductDescription, Price]
Index: []
Ahora, hemos creado un DataFrame vacío con cuatro columnas.
Método 2: Usando el constructor dict()
El segundo método para crear un DataFrame vacío es utilizar el constructor dict(). Este método crea un diccionario vacío y luego lo convierte en un DataFrame. Aquí tienes un ejemplo:
import pandas as pd
data = dict(ProductID=[], ProductName=[], ProductDescription=[], Price=[])
df = pd.DataFrame(data)
print(df)
Output:
Empty DataFrame
Columns: [ProductID, ProductName, ProductDescription, Price]
Index: []
Al igual que en el método anterior, podemos agregar columnas asignando una lista de nombres de columna a df.columns.
Método 3: Usando el método from_dict()
El tercer método para crear un DataFrame vacío es utilizar el método from_dict(). Este método crea un DataFrame a partir de un diccionario de listas vacías. Aquí tienes un ejemplo:
import pandas as pd
data = {'ProductID': [], 'ProductName': [], 'ProductDescription': [], 'Price': []}
df = pd.DataFrame.from_dict(data)
print(df)
Output:
Empty DataFrame
Columns: [ProductID, ProductName, ProductDescription, Price]
Index: []
Columnas: [IDProducto, NombreProducto, DescripcionProducto, Precio] Index: []
Una vez más, podemos agregar columnas asignando una lista de nombres de columna a df.columns.
## ¿Cómo comprobar si un DataFrame está vacío?
A veces, es posible que queramos verificar si un DataFrame está vacío o no. Podemos hacer esto utilizando el atributo `empty` de un DataFrame. Este atributo devuelve True si el DataFrame está vacío; de lo contrario, devuelve False. Aquí hay un ejemplo:
```python
import pandas as pd
data = {'IDProducto': [1, 2, 3], 'NombreProducto': ['A', 'B', 'C'], 'DescripcionProducto': ['Desc1', 'Desc2', 'Desc3'], 'Precio': [10.0, 20.0, 30.0]}
df = pd.DataFrame(data)
print(df.empty) # False
empty_df = pd.DataFrame()
print(empty_df.empty) # True
Salida:
False
True
En este ejemplo, primero creamos un DataFrame df
con algunos datos. Luego, usamos el atributo empty
para verificar si está vacío o no. Como df
tiene algunos datos, df.empty
devuelve False.
Luego creamos un DataFrame vacío empty_df
utilizando el primer método, y nuevamente verificamos si está vacío usando el atributo empty
, que devuelve True.
Conclusión
Crear un DataFrame vacío es una operación común en el análisis de datos. En este artículo, hemos aprendido cómo crear un DataFrame vacío utilizando varios métodos en Pandas. También hemos aprendido cómo comprobar si un DataFrame está vacío o no. Ahora puedes comenzar a experimentar con los DataFrames de Pandas y mejorar tus habilidades de análisis de datos.