Wie man eine Spalte in Pandas umbenennt: Verständlich erklärt
Published on
Datenanalyse ist eine entscheidende Aufgabe in der datengetriebenen Welt von heute. Es erfordert das Bereinigen, Organisieren und Umwandeln von Rohdaten in ein verständliches und aussagekräftiges Format. Eine der grundlegendsten Aufgaben bei der Datenanalyse ist die Umbenennung von Spalten, da sie die Daten informativer und verständlicher macht.
In diesem Tutorial werden wir untersuchen, wie man Spalten in einem Pandas DataFrame mit verschiedenen Methoden umbenennt. Wir werden bewährte Methoden, Tipps und Tricks diskutieren, um Ihre Datenanalyse klarer und prägnanter zu machen. Fangen wir an!
Möchten Sie schnell Datenvisualisierungen aus einer Python Pandas Dataframe erstellen, ohne Code zu schreiben?
PyGWalker ist eine Python-Bibliothek für explorative Datenanalyse mit Visualisierung. PyGWalker (opens in a new tab) kann Ihren Workflow für Datenanalyse und Datenvisualisierung in Jupyter Notebook vereinfachen, indem es Ihren Pandas DataFrame (und Polars DataFrame) in eine Tableau-ähnliche Benutzeroberfläche für visuelle Exploration umwandelt.
Was ist die Umbenennung von DataFrame-Spalten?
Bevor wir uns ins Codieren stürzen, lassen Sie uns zunächst verstehen, was die Umbenennung von Spalten in einem Pandas DataFrame ist und warum sie wichtig ist.
In einem Pandas DataFrame werden Spalten als eindeutige Bezeichner benannt, die eine Spalte von einer anderen unterscheiden. Manchmal sind diese eindeutigen Bezeichner nicht aussagekräftig oder inkonsistent mit den Daten, was zu Verwirrung und Fehlinterpretation führen kann. In solchen Fällen hilft die Umbenennung von Spalten, diese aussagekräftiger und verständlicher zu machen.
Die Umbenennung von Spalten ist ein Vorgang, bei dem der Name einer oder mehrerer Spalten in einem Pandas DataFrame geändert wird. Dies geschieht entweder durch Auswahl der Spaltenbezeichnungen oder ihrer Indizes. Es verbessert die Lesbarkeit der Daten und hilft dabei, die Beziehungen zwischen verschiedenen Spalten zu verstehen.
Wie benennt man eine Spalte in einem Pandas DataFrame um?
Pandas bietet verschiedene Möglichkeiten, Spalten in einem DataFrame umzubenennen. Wir werden die am häufigsten verwendeten Methoden und bewährten Methoden zur Umbenennung von Spalten erkunden.
Umbenennen einer einzelnen Spalte
Beginnen wir mit der einfachsten Methode zur Umbenennung einer einzelnen Spalte in einem Pandas DataFrame. Wir verwenden die Methode rename
, um das zu tun.
# Erstellen Sie ein Beispieldatenframe
import pandas as pd
data = {'Name': ['John', 'Alex', 'Peter'],
'Age': [25, 24, 28],
'Gender': ['Male', 'Male', 'Male']}
df = pd.DataFrame(data)
# Benennen Sie die Spalte 'Age' in 'Years' um
df = df.rename(columns={'Age': 'Years'})
# DataFrame ausgeben
print(df)
Ausgabe:
Name Years Gender
0 John 25 Male
1 Alex 24 Male
2 Peter 28 Male
Hier haben wir ein Beispieldatenframe mit den Spalten Name
, Age
und Gender
erstellt. Wir haben die Methode rename
verwendet, um den Namen der Spalte Age
in Years
zu ändern. Die rename
-Methode nimmt ein Wörterbuch als Eingabe an, wobei die Schlüssel die alten Spaltennamen und die Werte die neuen Spaltennamen sind.
Mehrere Spalten umbenennen
Das Umbenennen einer einzelnen Spalte ist einfach, aber was ist, wenn wir mehrere Spalten auf einmal umbenennen möchten? In solchen Fällen können wir dieselbe Methode rename
mit einem Wörterbuch aus alten und neuen Spaltennamen verwenden.
# Erstellen Sie ein Beispieldatenframe
import pandas as pd
data = {'Name': ['John', 'Alex', 'Peter'],
'Age': [25, 24, 28],
'Department': ['IT', 'HR', 'Marketing']}
df = pd.DataFrame(data)
# Benennen Sie die Spalten 'Age' und 'Department' um
df = df.rename(columns={'Age': 'Years', 'Department': 'Dept'})
# DataFrame ausgeben
print(df)
Ausgabe:
Name Years Dept
0 John 25 IT
1 Alex 24 HR
2 Peter 28 Marketing
Hier haben wir zwei Spalten, Age
in Years
und Department
in Dept
, umbenannt, indem wir die Methode rename
mit einem Wörterbuch aus alten und neuen Spaltennamen verwendet haben.
Spalten mit der Methode set_axis
umbenennen
Eine weitere Möglichkeit, Spalten in einem Pandas DataFrame umzubenennen, besteht darin, die Methode set_axis
zu verwenden. Es handelt sich um eine flexible und bequeme Methode, mit der Spalten durch Auswahl ihrer Indizes oder Labels umbenannt werden können.
# Erstellen Sie ein Beispieldatenframe
import pandas as pd
data = {'Name': ['John', 'Alex', 'Peter'],
'Age': [25, 24, 28],
'Gender': ['Male', 'Male', 'Male']}
df = pd.DataFrame(data)
# Benennen Sie die Spalten 'Age' und 'Gender' nach Index um
df.columns = df.columns.set_axis(['a', 'Years', 'b'], axis=1, inplace=False)
# DataFrame ausgeben
print(df)
Ausgabe:
Name Years b
0 John 25 Male
1 Alex 24 Male
2 Peter 28 Male
Hier haben wir die Methode set_axis
verwendet, um die Spalten mit Indexpositionen umzubenennen. Die Methode nimmt drei Parameter - Labels, Axis und Inplace - an. Wir haben die Labels auf die neuen Spaltennamen und die Axis auf 1 gesetzt, was für Spalten steht. Der Inplace-Parameter ist auf False gesetzt, um ein neues DataFrame zurückzugeben.
Spalten mit List Comprehension umbenennen
Wir können auch Spalten in einem Pandas DataFrame mit List Comprehension umbenennen. Es handelt sich um eine einfache und elegante Methode, mit der mehrere Spalten auf einmal umbenannt werden können.
# Erstellen Sie ein Beispieldatenframe
import pandas as pd
data = {'Name': ['John', 'Alex', 'Peter'],
'Age': [25, 24, 28],
'Department': ['IT', 'HR', 'Marketing']}
df = pd.DataFrame(data)
# Benennen Sie die Spalten 'Age' und 'Department' mit List Comprehension um
df.columns = [col.replace('_', ' ').title() for col in df.columns]
# DataFrame ausgeben
print(df)
Ausgabe:
Name Age Department
0 John 25 IT
1 Alex 24 HR
2 Peter 28 Marketing
Hier haben wir die Listenkomprehension verwendet, um die Spalten durch Ersetzen der Unterstriche durch Leerzeichen und Umwandeln des ersten Buchstabens in Großbuchstaben mit der title()
-Methode umzubenennen.
DataFrame nach Index umbenennen
Das Umbenennen einer Spalte nach Index ist auch in Pandas DataFrame möglich. Wir können die rename
-Methode mit einem Wörterbuch alter und neuer Spaltenindexpositionen verwenden.
# Beispiel DataFrame erstellen
import pandas as pd
data = {'Name': ['John', 'Alex', 'Peter'],
'Alter': [25, 24, 28],
'Abteilung': ['IT', 'HR', 'Marketing']}
df = pd.DataFrame(data)
# Umbenennen der Spalte '2' in 'Abteilung' nach Index
df = df.rename(columns={2: 'Abteilung'})
# DataFrame anzeigen
print(df)
Ausgabe:
Name Alter Abteilung
0 John 25 IT
1 Alex 24 HR
2 Peter 28 Marketing
Hier haben wir die rename
-Methode verwendet, um die Spalte mit dem Index 2 in Abteilung
umzubenennen.
DataFrame-Spalte mit Liste umbenennen
Wir können auch Spalten in Pandas DataFrame umbenennen, indem wir eine Liste von Spaltennamen auswählen. Schauen wir uns an, wie das geht.
# Beispiel DataFrame erstellen
import pandas as pd
data = {'Name': ['John', 'Alex', 'Peter'],
'Alter': [25, 24, 28],
'Abteilung': ['IT', 'HR', 'Marketing']}
df = pd.DataFrame(data)
# Umbenennen der Spalten 'Name' und 'Abteilung' mit einer Liste von Spaltennamen
df.columns = ['ID', 'Jahre', 'Abteilung']
# DataFrame anzeigen
print(df)
Ausgabe:
ID Jahre Abteilung
0 John 25 IT
1 Alex 24 HR
2 Peter 28 Marketing
Hier haben wir eine Liste von Spaltennamen verwendet, um die Spalten Name
und Abteilung
in ID
bzw. Abteilung
umzubenennen.
Fazit
In diesem Tutorial haben wir gelernt, wie man Spalten in Pandas DataFrame mit verschiedenen Methoden umbenennt - rename
-Methode, set_axis
-Methode, Listenkomprehension, Umbenennen nach Index und Umbenennen mit einer Liste. Wir haben auch bewährte Verfahrensweisen, Tipps und Tricks erforscht, um Ihre Datenanalyse organisierter und informativer zu gestalten.
Die Umbenennung von Spalten ist ein wichtiger Schritt in der Datenanalyse, da sie die Lesbarkeit der Daten verbessert und hilft, die Beziehungen zwischen verschiedenen Spalten zu verstehen. Durch die Verwendung der oben diskutierten Methoden können Sie Spalten in Pandas DataFrame leicht umbenennen und Ihre Datenanalyse effektiver und effizienter gestalten.
Wir hoffen, dass dieses Tutorial hilfreich und informativ war. Viel Spaß beim Codieren!
Links:
- Dict to DataFrame in Pandas
- Eine Spalte zu einem DataFrame in Pandas hinzufügen
- Erstellen eines DataFrame in R
- DataFrame in Pandas sortieren
- Eine Zeile zu einem DataFrame in Pandas hinzufügen
- Erstellen eines leeren DataFrame in Pandas
Häufig gestellte Fragen
-
Wie kann man eine Spalte in einem DataFrame umbenennen?
Um eine Spalte in einem DataFrame umzubenennen, können Sie die Methode
rename()
in pandas verwenden. Geben Sie den alten Spaltennamen und den neuen Spaltennamen mit einem Wörterbuch oder einer Zuordnung an. Diese Methode ermöglicht es Ihnen, eine einzelne Spalte oder mehrere Spalten auf einmal umzubenennen. -
Wie benennt man eine Spalte nach Spaltenindex in Pandas um?
In pandas können Sie eine Spalte nach Spaltenindex mit der Methode
rename()
und dem Parametercolumns
umbenennen. Übergeben Sie ein Wörterbuch, bei dem die Schlüssel die aktuellen Spaltenindizes sind und die Werte die neuen Spaltennamen sind. Diese Methode ermöglicht es Ihnen, Spalten basierend auf ihrer Position im DataFrame umzubenennen. -
Wie kann man mehrere Spalten in einem DataFrame umbenennen?
Um mehrere Spalten in einem DataFrame umzubenennen, können Sie die Methode
rename()
mit dem Parametercolumns
verwenden. Übergeben Sie ein Wörterbuch, bei dem die Schlüssel die aktuellen Spaltennamen sind und die Werte die neuen Spaltennamen sind. Diese Methode ermöglicht es Ihnen, mehrere Spalten gleichzeitig umzubenennen und bietet Flexibilität bei der Umbenennung von Spalten basierend auf spezifischen Kriterien.