Eine neue Spalte zu einer Pandas DataFrame hinzufügen: Methoden und Techniken
Published on
Das Arbeiten mit DataFrames ist ein wesentlicher Bestandteil der Datenanalyse und Datenwissenschaft. Pandas ist eine weit verbreitete Bibliothek für die Datenmanipulation und -analyse und bietet eine benutzerfreundliche und flexible Möglichkeit, mit DataFrames zu arbeiten. Ein DataFrame ist eine zweidimensionale dataStruktur mit benannten Spalten unterschiedlicher Typen. Es ist wie eine Tabellenkalkulation oder eine SQL-Tabelle, aber mit mehr Leistung und Flexibilität. In diesem Artikel werden wir lernen, wie man einer bestehenden Pandas DataFrame eine neue Spalte hinzufügt. Wir werden auch verschiedene Methoden und Techniken diskutieren, um eine neue Spalte in einem Pandas DataFrame einzufügen.
Möchten Sie schnell Datenvisualisierungen in Python erstellen?
PyGWalker ist ein Open Source Python-Projekt, das den Workflow der Datenanalyse und -visualisierung direkt in einer Jupyter Notebook-basierten Umgebung beschleunigen kann.
PyGWalker (opens in a new tab) verwandelt Ihren Pandas Dataframe (oder Polars Dataframe) in eine visuelle Benutzeroberfläche, in der Sie Variablen per Drag & Drop ziehen und ablegen können, um Diagramme mit Leichtigkeit zu erstellen. Verwenden Sie einfach den folgenden Code:
pip install pygwalker
import pygwalker as pyg
gwalker = pyg.walk(df)
Sie können PyGWalker jetzt direkt mit diesen Online-Notebooks ausführen:
Und vergessen Sie nicht, uns auf GitHub ein ⭐️ zu geben!
Was ist ein Pandas DataFrame?
Ein Pandas DataFrame ist eine zweidimensionale Datenstruktur mit benannten Achsen. Es ist wie eine Tabellenkalkulation oder eine SQL-Tabelle, aber mit mehr Leistung und Flexibilität. Ein DataFrame kann aus verschiedenen Eingabe-Datenformaten wie CSV, Excel, SQL-Datenbanken und anderen erstellt werden. Ein DataFrame kann mit verschiedenen Methoden und Funktionen der Pandas-Bibliothek manipuliert und analysiert werden.
Wie fügt man eine neue Spalte zu einem Pandas DataFrame hinzu?
Um einer bestehenden Pandas DataFrame eine neue Spalte hinzuzufügen, können verschiedene Methoden und Techniken verwendet werden. Der häufigste Weg, eine neue Spalte hinzuzufügen, ist die Verwendung der einfachen Zuweisung. Schauen wir uns ein Beispiel an.
Angenommen, wir haben einen DataFrame mit zwei Spalten: 'Name' und 'Alter'.
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Alter': [25, 30, 35, 40]
}
df = pd.DataFrame(data)
print(df)
Ausgabe:
Name Alter
0 Alice 25
1 Bob 30
2 Charlie 35
3 David 40
Nun möchten wir eine neue Spalte 'Gehalt' zum DataFrame hinzufügen. Wir können die einfache Zuweisung wie folgt verwenden.
df['Gehalt'] = [50000, 60000, 70000, 80000]
print(df)
Ausgabe:
Name Alter Gehalt
0 Alice 25 50000
1 Bob 30 60000
2 Charlie 35 70000
3 David 40 80000
Wir sehen, dass eine neue Spalte 'Gehalt' zum DataFrame hinzugefügt wurde.
Unterschiedliche Methoden zum Einfügen einer neuen Spalte in ein Pandas DataFrame
Es gibt verschiedene Methoden und Techniken, um eine neue Spalte in ein Pandas DataFrame einzufügen. Lassen Sie uns diese nacheinander diskutieren.
Methode 1: Einfache Zuweisung
Wie wir im vorherigen Beispiel gesehen haben, können wir eine neue Spalte zu einem DataFrame mit Hilfe der einfachen Zuweisung hinzufügen. Wir können einer neuen Spaltenbezeichnung im DataFrame eine Liste oder ein numpy Array zuweisen, wie im folgenden Beispiel gezeigt.
df['NeueSpalte'] = [1, 2, 3, 4]
Methode 2: Insert-Methode
Eine andere Möglichkeit, eine neue Spalte in einem Pandas DataFrame einzufügen, ist die Verwendung der insert
-Methode. Die insert
-Methode nimmt drei Argumente entgegen: loc
, column
und value
. loc
ist der Index der Spalte, wo wir die neue Spalte einfügen möchten. column
ist der Name der neuen Spalte und value
ist der Wert, den wir der neuen Spalte zuweisen möchten.
df.insert(loc=1, column='NeueSpalte', value=[1, 2, 3, 4])
Methode 3: Concatenate-Methode
Wir können auch zwei DataFrames entlang der Achse 1 konkatenieren, um eine neue Spalte zu einem vorhandenen DataFrame hinzuzufügen. Die neue Spalte wird auf der rechten Seite des vorhandenen DataFrames hinzugefügt. Die concat
-Methode nimmt zwei DataFrames als Argumente entgegen und konkateniert sie entlang der Achse 1.
df2 = pd.DataFrame({'NeueSpalte': [1, 2, 3, 4]})
df = pd.concat([df, df2], axis=1)
Methode 4: Assign-Methode
Die assign
-Methode ermöglicht es uns, eine neue Spalte in einem DataFrame zu erstellen und ein neues DataFrame mit der neuen Spalte zurückzugeben. Sie nimmt ein Wörterbuch als Argument, wobei jeder Schlüssel den Namen einer neuen Spalte repräsentiert und jeder Wert die Werte der neuen Spalte repräsentiert.
df = df.assign(NeueSpalte=[1, 2, 3, 4])
Kann ich eine vorhandene Spalte in einem Pandas DataFrame überschreiben und gleichzeitig eine neue Spalte hinzufügen?
Ja, wir können eine vorhandene Spalte in einem Pandas DataFrame überschreiben und gleichzeitig eine neue Spalte hinzufügen. Wenn wir Werte einer Spalte zuweisen, werden die vorhandenen Werte dieser Spalte durch die neuen Werte ersetzt.
df['Alter'] = [26, 31, 36, 41]
Wie kann ich Spalten an einer bestimmten Position in einem Pandas DataFrame einfügen?
Wir können Spalten an einer bestimmten Position in einem Pandas DataFrame mit der insert
Methode einfügen. Der Parameter loc
gibt die Position an, an der die Spalte eingefügt werden soll. Wir können den Ganzzahlindex der Spalte verwenden, um ihre Position anzugeben.
df.insert(2, 'NeueSpalte', [1, 2, 3, 4])
Wir können auch den Spaltennamen verwenden, um ihre Position anzugeben.
df.insert(df.columns.get_loc("Alter"), 'NeueSpalte', [1, 2, 3, 4])
Fazit
In diesem Artikel haben wir gelernt, wie wir eine neue Spalte zu einem vorhandenen Pandas DataFrame hinzufügen können. Wir haben verschiedene Methoden und Techniken diskutiert, um eine neue Spalte in einem Pandas DataFrame einzufügen, einschließlich einfacher Zuweisung, insert Methode, concatenate Methode und assign Methode. Wir haben auch besprochen, wie wir eine vorhandene Spalte überschreiben können, während wir eine neue Spalte hinzufügen, und wie wir Spalten an einer bestimmten Position in einem Pandas DataFrame einfügen können. Mit diesen Techniken können Sie Ihre DataFrames effizient und effektiv manipulieren.