So konvertieren Sie Pandas Dataframe in Numpy Array
Published on
Wenn Sie sich mit Datenanalyse auskennen, haben Sie wahrscheinlich sowohl mit Pandas DataFrames als auch mit NumPy-Arrays gearbeitet. Während DataFrames fortgeschrittene Datenmanipulationsfähigkeiten bieten, eignen sich NumPy-Arrays ideal für numerische Operationen auf großen Datensätzen.
In diesem Artikel werden wir untersuchen, wie man einen Pandas DataFrame einfach in ein NumPy-Array konvertiert. Wir werden alles von Syntax und Codebeispielen bis hin zu bewährten Methoden und hilfreichen Tipps abdecken. Also, ob Sie Anfänger oder ein erfahrener Datenwissenschaftler sind, lesen Sie weiter, um zu erfahren, wie Sie Ihre Datenanalysefähigkeiten problemlos erweitern können.
Möchten Sie schnell Datenvisualisierungen aus Python Pandas Dataframe ohne Code erstellen?
PyGWalker ist eine Python-Bibliothek für Explorative Datenanalyse mit Visualisierung. PyGWalker (opens in a new tab) kann Ihren Workflow zur Datenanalyse und Datenvisualisierung in Jupyter Notebook vereinfachen, indem es Ihren Pandas-Dataframe (und Polars-Dataframe) in eine Tableau-ähnliche Benutzeroberfläche für die visuelle Exploration umwandelt.
Was ist ein Pandas DataFrame?
Ein Pandas DataFrame ist eine 2-dimensionale, änderbare, tabellarische Datenstruktur, die häufig zum Manipulieren und Analysieren von Daten verwendet wird. Es ähnelt einem Spreadsheet oder einer SQL-Tabelle und kann eine Vielzahl von Datentypen wie Ganzzahlen, Gleitkommazahlen und Zeichenketten enthalten.
In Pandas wird ein DataFrame mithilfe von Dictionaries oder durch das Lesen von CSV-, Excel- oder anderen Arten von Datendateien erstellt. Sie können ein DataFrame auf verschiedene Arten manipulieren, z. B. das Auswählen von Zeilen und Spalten, Sortieren, Filtern und Aggregieren von Daten.
Was ist ein NumPy-Array?
Ein NumPy-Array ist dagegen ein mehrdimensionaler Container von Elementen des gleichen Typs und gleicher Größe. Es kann verschiedene numerische Datentypen wie Ganzzahlen, Gleitkommazahlen und komplexe Zahlen enthalten.
NumPy-Arrays eignen sich aufgrund ihrer Fähigkeit, mathematische Berechnungen auf ganzen Arrays ohne Schleifen oder Iterationen durchzuführen, ideal für numerische Operationen. Sie bieten auch eine Vielzahl von mathematischen Funktionen und werden häufig für wissenschaftliches Rechnen und Datenanalyse verwendet.
Schritte zur Konvertierung eines Pandas DataFrame in ein NumPy-Array
Die Konvertierung eines Pandas DataFrame in ein NumPy-Array ist einfach. Die folgenden Schritte geben den Vorgang vor:
- Installieren Sie das NumPy-Paket, falls es noch nicht installiert ist:
pip install numpy
- Importieren Sie die Pandas und NumPy-Pakete:
import pandas as pd
import numpy as np
- Erstellen Sie ein Pandas DataFrame mithilfe eines Dictionaries:
data = {'Name': ['John', 'Jane', 'Sam'],
'Age': [25, 29, 36],
'Sex': ['Male', 'Female', 'Male']}
df = pd.DataFrame(data)
- Konvertieren Sie das DataFrame mit der Methode
to_numpy()
in ein NumPy-Array:
npArray = df.to_numpy()
Nachdem Sie die obigen Schritte befolgt haben, sollten Sie ein NumPy-Array haben, das dieselben Daten wie Ihr Pandas DataFrame enthält.
Codebeispiele
Um Ihr Verständnis zu festigen, sind hier einige Codebeispiele, die zeigen, wie man Pandas DataFrames in NumPy-Arrays in verschiedenen Szenarien konvertiert.
Konvertieren Sie eine einzelne Spalte in ein NumPy-Array
Wenn Sie ein DataFrame mit einer einzigen Spalte haben, können Sie es mit dem folgenden Code-Snippet in ein NumPy-Array konvertieren:
df = pd.DataFrame({'A': [1, 2, 3, 4, 5]})
npArray = df['A'].to_numpy()
Konvertieren Sie mehrere Spalten in ein NumPy-Array
Sie können auch mehrere Spalten aus einem DataFrame in ein NumPy-Array konvertieren. Betrachten Sie den folgenden Code:
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})
npArray = df[['A', 'B']].to_numpy()
Hier wählen wir die Spalten 'A' und 'B' aus, die in unser NumPy-Array aufgenommen werden sollen.
Konvertieren Sie ausgewählte Zeilen in ein NumPy-Array
Wenn Sie eine Teilmenge von Zeilen aus Ihrem DataFrame in ein NumPy-Array konvertieren möchten, können Sie die Methode iloc
verwenden. Zum Beispiel:
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})
npArray = df.iloc[1:3, :].to_numpy()
Dieser Code-Ausschnitt wählt Zeilen 1 bis 3 aus dem DataFrame aus und enthält alle Spalten im resultierenden NumPy-Array.
Konvertieren Sie alle Spalten außer einer in ein NumPy-Array
Um eine bestimmte Spalte aus Ihrem DataFrame auszuschließen, wenn Sie es in ein NumPy-Array konvertieren, können Sie die Spalten angeben, die Sie explizit einschließen möchten. Zum Beispiel:
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10], 'C': [11, 12, 13, 14, 15]})
npArray = df[['A', 'B']].to_numpy()
Dieser Code-Ausschnitt wählt die Spalten 'A' und 'B' aus dem DataFrame aus, was zu einem NumPy-Array führt, das nur diese Spalten enthält.
Fazit
In diesem umfassenden Leitfaden haben wir gezeigt, wie man einen Pandas DataFrame in ein NumPy-Array in Python konvertiert. Wir haben die Syntax demonstriert und mehrere Codebeispiele bereitgestellt, um zu zeigen, wie DataFrames in verschiedenen Szenarien konvertiert werden können. Wir hoffen, dass Sie diesen Leitfaden hilfreich fanden und dass er Ihnen helfen wird, Ihre Datenanalysefähigkeiten zu erweitern. Durch die Nutzung der Stärken von DataFrames und NumPy-Arrays können Sie Ihre Datenanalyse auf ein neues Niveau bringen. Viel Spaß beim Codieren!
Häufig gestellte Fragen
-
Wie konvertiert man Tabellendaten in das JSON-Format?
Um Tabellendaten in das JSON-Format zu konvertieren, können Sie über die Zeilen der Tabelle iterieren und für jede Zeile ein Wörterbuch erstellen, wobei die Schlüssel die Spaltennamen und die Werte die entsprechenden Werte in der Zeile sind. Sie können dann diese Wörterbücher in einer Liste speichern und die Funktion
json.dumps()
verwenden, um die Liste in das JSON-Format zu konvertieren. -
Wie konvertiert man eine Tabelle in JSON in Python?
In Python können Sie eine Tabelle in JSON-Format konvertieren, indem Sie die
pandas
-Bibliothek verwenden. Laden Sie die Tabellendaten in einpandas
-DataFrame und verwenden Sie dann dieto_json()
-Methode, um das DataFrame in JSON-Format zu konvertieren. Sie können verschiedene Optionen für die JSON-Konvertierung angeben, z.B. das Ausrichten der JSON-Ausgabe als Datensätze, Spalten oder Werte. -
Wie konvertiert man eine Liste in JSON in Python?
In Python können Sie eine Liste in JSON-Format konvertieren, indem Sie die Funktion
json.dumps()
verwenden. Übergeben Sie die Liste als Argument anjson.dumps()
und es wird eine JSON-formatierte Zeichenketten-Repräsentation der Liste zurückgeben. Sie können auch zusätzliche Optionen angeben, z.B. das Einrücken der JSON-Ausgabe für eine bessere Lesbarkeit.