Plotly Express: Verständlich erklärt
Published on
Die Datenvisualisierung ist ein wichtiger Aspekt der Datenanalyse und des maschinellen Lernens. Sie ermöglicht es uns, komplexe Datensätze zu verstehen und Einsichten zu gewinnen, die aus rohen Daten nicht offensichtlich wären. Ein Tool, das diesen Prozess unglaublich einfach gemacht hat, ist Plotly Express.
Plotly Express ist eine Oberfläche auf hoher Ebene zur Datenvisualisierung. Es vereinfacht den Prozess der Erstellung komplexer Plots und erleichtert Anfängern den Einstieg in die Erstellung atemberaubender Visualisierungen. Egal, ob Sie Anfänger oder erfahrener Programmierer sind, dieser umfassende Leitfaden zeigt Ihnen, wie Sie das volle Potenzial von Plotly Express ausschöpfen können.
Was ist Plotly Express?
Plotly Express, oft abgekürzt als PX, ist ein Wrapper für Plotly.py, der den Prozess der Erstellung komplexer Plots vereinfacht. Es bietet eine Oberfläche auf hoher Ebene für die Plotly-Bibliothek, was bedeutet, dass Sie mit weniger Code atemberaubende Visualisierungen erstellen können.
Plotly Express unterstützt eine große Vielfalt von Diagrammen, darunter Streudiagramme, Liniendiagramme, Balkendiagramme und mehr. Es unterstützt auch Animationen, so dass interaktive Diagramme erstellt werden können, die sich im Laufe der Zeit oder als Reaktion auf Benutzerinteraktionen ändern.
Eine der wichtigsten Funktionen von Plotly Express ist die Integration mit Pandas DataFrames. Dies bedeutet, dass Sie DataFrame-Objekte direkt an Plotly Express-Funktionen übergeben können, was die Arbeit mit großen Datensätzen erleichtert.
Plotly Express vs Plotly Graph Objects
Während Plotly Express und Plotly Graph Objects beide Teil des Plotly-Ökosystems sind, dienen sie unterschiedlichen Zwecken. Plotly Graph Objects ist eine Oberfläche auf niedriger Ebene, die mehr Kontrolle und Anpassungsoptionen bietet. Plotly Express hingegen ist eine Oberfläche auf hoher Ebene, die den Prozess der Erstellung von Plots vereinfacht.
Für Anfänger ist Plotly Express oft die bessere Wahl. Es ist einfacher zu bedienen und erfordert weniger Code, um komplexe Visualisierungen zu erstellen. Wenn Sie jedoch mehr Kontrolle über Ihre Plots benötigen oder benutzerdefinierte Visualisierungen erstellen möchten, finden Sie in Plotly Graph Objects möglicherweise mehr Möglichkeiten.
Arten von Visualisierungen mit Plotly Express
Plotly Express unterstützt eine breite Palette von Visualisierungen. Hier sind einige der häufigsten Arten:
-
Streudiagramme: Streudiagramme werden verwendet, um die Beziehung zwischen zwei numerischen Variablen darzustellen. Sie eignen sich gut zur Identifizierung von Trends, Mustern und Ausreißern in Ihren Daten.
-
Liniendiagramme: Liniendiagramme werden verwendet, um Daten im Laufe der Zeit darzustellen. Sie werden häufig in Zeitreihenanalysen und zur Verfolgung von Veränderungen im Laufe der Zeit verwendet.
-
Balkendiagramme: Balkendiagramme werden verwendet, um die Häufigkeit, Anzahl oder andere Merkmale unterschiedlicher Kategorien zu vergleichen. Sie eignen sich gut für kategoriale Daten.
-
Histogramme: Histogramme werden verwendet, um die Verteilung einer einzigen numerischen Variable darzustellen. Sie sind nützlich, um die Streuung und Schiefe Ihrer Daten zu verstehen.
-
Boxplots: Boxplots werden verwendet, um die statistische Zusammenfassung einer numerischen Variable darzustellen. Sie zeigen den Median, Quartile und potenzielle Ausreißer in Ihren Daten.
-
Heatmaps: Heatmaps werden verwendet, um die Korrelation zwischen zwei oder mehr Variablen darzustellen. Sie eignen sich gut zur Identifizierung von Mustern und Clustern in Ihren Daten.
Jede dieser Visualisierungen kann mit nur wenigen Codezeilen in Plotly Express erstellt werden. Im nächsten Abschnitt werden wir uns einige Beispiele ansehen, wie man diese Plots erstellt.
Importieren von Plotly Express in Python
Bevor Sie mit Plotly Express Visualisierungen erstellen können, müssen Sie es in Ihre Python-Umgebung importieren. Wenn Sie Plotly noch nicht installiert haben, können Sie dies mit dem Befehl pip
tun:
pip install plotly
Sobald Plotly installiert ist, können Sie Plotly Express wie folgt importieren:
import plotly.express as px
Mit importiertem Plotly Express sind Sie bereit, atemberaubende Visualisierungen zu erstellen!
Erstellen von Visualisierungen mit Plotly Express
Die Erstellung von Visualisierungen mit Plotly Express ist unkompliziert. Fangen wir mit einem einfachen Streudiagramm an. Zuerst benötigen wir einige Daten. Für dieses Beispiel verwenden wir den integrierten iris
Datensatz:
df = px.data.iris()
Jetzt können wir ein Streudiagramm der Kelchbreite gegen die Kelchlänge erstellen:
fig = px.scatter(df, x="sepal_width", y="sepal_length")
fig.show()
In nur drei Zeilen Code haben wir ein Streudiagramm erstellt! Aber Plotly Express kann noch viel mehr als nur Streudiagramme. Erstellen wir nun ein Liniendiagramm mit dem Datensatz gapminder
:
df = px.data.gapminder().query("country=='Canada'")
fig = px.line(df, x="year", y="lifeExp", title='Lebenserwartung in Kanada')
fig.show()
Auch hier haben wir in nur wenigen Zeilen Code ein Liniendiagramm erstellt, das die Lebenserwartung in Kanada im Laufe der Zeit zeigt.
Anpassen von Plots in Plotly Express
Eine der Stärken von Plotly Express sind die Anpassungsoptionen. Sie können die Farben, Beschriftungen und andere Aspekte Ihrer Plots leicht ändern.
Als Beispiel passen wir unser vorheriges Streudiagramm an. Wir färben die Punkte nach Arten und ändern die Beschriftungen:
fig = px.scatter(df, x="sepal_width", y="sepal_length", color="species",
labels={
"sepal_width": "Kelchbreite (cm)",
"sepal_length": "Kelchlänge (cm)",
"species": "Arten"
},
title="Iris Kelchdimensionen")
fig.show()
Durch diese Anpassungen ist unser Plot viel informativer. Wir können die Arten leicht unterscheiden und die Beschriftungen sind klarer.
Plotly Express vs. andere Bibliotheken
Wenn es um die Datenvisualisierung in Python geht, gibt es mehrere Bibliotheken zur Auswahl. Zwei der beliebtesten, abgesehen von Plotly Express, sind Matplotlib und Seaborn.
Matplotlib ist eine Low-Level-Bibliothek, die eine große Flexibilität bietet, aber auf Kosten der Einfachheit. Obwohl Sie praktisch jede Visualisierung erstellen können, die Sie sich vorstellen können, erfordert es oft viel Code, um dies zu tun.
Seaborn ist eine High-Level-Bibliothek, die auf Matplotlib aufbaut. Sie vereinfacht den Prozess der Erstellung komplexerer Visualisierungen, erfordert jedoch immer noch eine beträchtliche Menge an Code für die Anpassung.
Plotly Express hingegen findet einen Kompromiss zwischen Einfachheit und Flexibilität. Es ermöglicht Ihnen die Erstellung komplexer Visualisierungen mit minimalem Code und bietet auch eine Vielzahl von Anpassungsoptionen. Darüber hinaus bietet die interaktive Natur der Plotly Express-Plots einen erheblichen Vorteil gegenüber statischen Plots, die mit Matplotlib oder Seaborn erstellt wurden.
Möchten Sie Data Visualisierungen schnell und ohne Code aus einem Python Pandas Dataframe erstellen?
PyGWalker ist eine Python-Bibliothek für Explorative Datenanalyse mit Visualisierung. PyGWalker (opens in a new tab) kann Ihren Datenanalyse- und Datenvisualisierungsworkflow in Jupyter Notebook vereinfachen, indem es Ihren Pandas-Dataframe (und Polars-Dataframe) in eine benutzerfreundliche Oberfläche im Tableau-Stil für visuelle Exploration verwandelt.
Hinzufügen von Legenden und anderen Elementen in Plotly Express
Das Hinzufügen von Legenden, Titeln und Beschriftungen zu Ihren Plotly Express-Plots ist unkompliziert. Die meisten davon können direkt in der Plotting-Funktion selbst erledigt werden. Um beispielsweise einen Titel zu Ihrem Plot hinzuzufügen, können Sie den title
-Parameter verwenden:
fig = px.scatter(df, x="sepal_width", y="sepal_length", color="species", title="Iris Sepal Dimensions")
fig.show()
Um Achsenbeschriftungen hinzuzufügen, können Sie den labels
-Parameter verwenden, wie wir es in den vorherigen Beispielen gesehen haben. Legenden werden automatisch hinzugefügt, wenn Sie den color
-Parameter verwenden, um zwischen verschiedenen Kategorien in Ihren Daten zu unterscheiden.
Für fortschrittlichere Anpassungen können Sie die update_layout
-Methode verwenden:
fig.update_layout(
title="Iris Sepal Dimensions",
xaxis_title="Sepal Width (cm)",
yaxis_title="Sepal Length (cm)",
legend_title="Species",
font=dict(
family="Courier New, monospace",
size=18,
color="RebeccaPurple"
)
)
Dies ermöglicht Ihnen die Anpassung der Schriftart, Größe und Farbe Ihres Titels, Ihrer Beschriftungen und Legende.
Nun gehen wir zu einigen häufig gestellten Fragen zu Plotly Express über.
Häufig gestellte Fragen
-
Was ist Plotly Express? Plotly Express ist eine High-Level-Datenvisualisierungsbibliothek in Python. Es ist ein Wrapper für Plotly.py, der den Prozess der Erstellung komplexer Plots vereinfacht.
-
Wie unterscheidet sich Plotly Express von Plotly Graph Objects? Plotly Express ist eine High-Level-Schnittstelle für Plotly, was bedeutet, dass Sie komplexe Plots mit weniger Code erstellen können. Plotly Graph Objects hingegen ist eine Low-Level-Schnittstelle, die mehr Kontrolle und Anpassungsmöglichkeiten bietet.
-
Welche Arten von Visualisierungen können mit Plotly Express erstellt werden? Plotly Express unterstützt eine Vielzahl von Visualisierungen, darunter Streudiagramme, Liniendiagramme, Balkendiagramme, Histogramme, Boxplots und Heatmaps. Es unterstützt auch Animationen.
-
Ist Plotly Express für Anfänger geeignet? Ja, Plotly Express ist benutzerfreundlich gestaltet und erfordert weniger Code, um komplexe Visualisierungen zu erstellen. Daher ist es eine gute Wahl für Anfänger.
-
Wie kann Plotly Express in Python importiert werden? Sie können Plotly Express in Python mit folgender Codezeile importieren:
import plotly.express as px
.