Skip to content
Anleitungen
Seaborn
­čôŐ Seaborn Boxplot Tutorial: Erstellen Sie benutzerdefinierte Boxplots in Python

­čôŐ Seaborn Boxplot Tutorial: Erstellen Sie benutzerdefinierte Boxplots in Python

Boxplots sind ein essentielles Werkzeug im Bereich der Datenwissenschaften, um eine statistische Zusammenfassung von Daten zu geben und die Verteilung der Daten besser zu verstehen. Sie sind besonders n├╝tzlich w├Ąhrend der explorativen Datenanalyse (EDA) in Datenwissenschaftsprojekten. In diesem Tutorial werden wir uns darauf konzentrieren, Boxplots mit der Seaborn-Bibliothek in Python zu erstellen, einem leistungsstarken Werkzeug f├╝r statistische Grafiken und Datenvisualisierung. Wir werden uns die Funktion seaborn.boxplot, ihre Syntax und Anpassungsm├Âglichkeiten genauer anschauen.

Seaborn ist eine Python-Datenvisualisierungsbibliothek, basierend auf matplotlib. Sie bietet eine benutzerfreundliche Oberfl├Ąche f├╝r attraktive und informative statistische Grafiken. Eine der Hauptfunktionen von Seaborn ist die M├Âglichkeit, Boxplots zu erstellen, welche graphische Darstellungen der F├╝nf-Zahlen-Zusammenfassung unserer Daten sind. Die Funktion seaborn.boxplot() ist ein leistungsstarkes Werkzeug, mit dem wir diese Plots einfach und flexibel erstellen k├Ânnen.

Wollen Sie schnell Datenvisualisierungen von Python Pandas Dataframe ohne Code erstellen?

PyGWalker ist eine Python-Bibliothek f├╝r explorative Datenanalyse mit Visualisierung. PyGWalker (opens in a new tab) kann Ihren Jupyter Notebook Datenanalyse- und Datenvisualisierungsworkflow vereinfachen, indem es Ihren Pandas Dataframe (und polars Dataframe) in eine Tableau-├Ąhnliche Benutzeroberfl├Ąche f├╝r visuelle Exploration umwandelt.

PyGWalker for Data visualization (opens in a new tab)

Was ist ein Seaborn Boxplot und wie wird er verwendet?

Ein Seaborn Boxplot ist eine Methode zur grafischen Darstellung von Gruppen numerischer Daten durch ihre Quartile. Er bietet eine visuelle Zusammenfassung der Daten, wobei die Box den Interquartilsbereich (die mittleren 50% der Daten) repr├Ąsentiert, die Linie innerhalb der Box ist der Median und die Whiskers repr├Ąsentieren den Datenbereich. Ausrei├čer, wenn vorhanden, werden als einzelne Punkte au├čerhalb der Whiskers dargestellt.

Boxplots werden verwendet, um Verteilungen zwischen verschiedenen Datens├Ątzen zu vergleichen. Zum Beispiel k├Ânnen Sie die Verteilung der Testergebnisse zwischen verschiedenen Klassenr├Ąumen vergleichen oder die Verteilung der Temperaturen in verschiedenen Monaten. Die Funktion seaborn.boxplot macht es einfach, diese Plots zu erstellen und nach Bedarf anzupassen.

Erstellen eines Seaborn Boxplots in Python

Um einen Seaborn Boxplot zu erstellen, m├╝ssen Sie zun├Ąchst die Seaborn-Bibliothek importieren. Dies k├Ânnen Sie mit der folgenden Zeile Code tun:

import seaborn as sns

Als n├Ąchstes m├╝ssen Sie Ihre Daten laden. Seaborn kann Pandas Dataframes verarbeiten, also k├Ânnen Sie Ihre Daten in einen Dataframe laden und ihn dann der Funktion seaborn.boxplot ├╝bergeben. Hier ist ein Beispiel:

## Laden des Beispiel-Datensatzes "tips"
tips = sns.load_dataset("tips")
 
## Erstellen eines Boxplots
sns.boxplot(x=tips["total_bill"])

In diesem Beispiel laden wir den eingebauten Datensatz "tips" von Seaborn und erstellen einen Boxplot der Gesamtrechnungsbetr├Ąge.

Anpassen des Erscheinungsbilds eines Seaborn Boxplots

Seaborn Boxplots k├Ânnen auf verschiedene Weise angepasst werden, um ihr Erscheinungsbild zu verbessern und sie informativer zu machen. Hier sind ein paar Beispiele, wie Sie Ihren Seaborn Boxplots anpassen k├Ânnen:

Ändern der Ausrichtung

Standardm├Ą├čig erstellt Seaborn vertikale Boxplots. Sie k├Ânnen jedoch horizontale Boxplots erstellen, indem Sie die Parameter x und y vertauschen. Hier ist ein Beispiel:

## Erstellen eines horizontalen Boxplots
sns.boxplot(y=tips["total_bill"])

Hinzuf├╝gen einer Farbe (Hue)

Sie k├Ânnen Ihrem Boxplot einen Hue-Parameter hinzuf├╝gen, um die Boxen nach einer anderen kategorischen Variable aufzuteilen. Dies kann n├╝tzlich sein, um Verteilungen zwischen verschiedenen Gruppen zu vergleichen. Hier ist ein Beispiel:

## Erstellen eines Boxplots mit Hue
sns.boxplot(x="day", y="total_bill", hue="smoker", data=tips)

In diesem Beispiel erstellen wir einen Boxplot der Gesamtrechnungsbetr├Ąge f├╝r jeden Tag, aufgeteilt nach der Frage, ob der Kunde Raucher ist oder nicht.

Anpassen der Boxfarben

Seaborn erm├Âglicht es Ihnen, die Farben Ihrer Boxplots anzupassen. Dies k├Ânnen Sie tun, indem Sie ein Farbschema (color palette) an den Parameter palette der Boxplot-Funktion ├╝bergeben. Hier ist ein Beispiel:

## Erstellen eines Boxplots mit benutzerdefinierten Farben
sns.boxplot(x="day", y="total_bill", hue="smoker", data=tips, palette="Set3")

In diesem Beispiel verwenden wir das Farbschema "Set3", um unsere Boxplots einzuf├Ąrben.

Ändern der Whiskers

Standardm├Ą├čig repr├Ąsentieren die Whiskers eines Seaborn Boxplots den Datenbereich, wobei Ausrei├čer ausgeschlossen werden. Sie k├Ânnen dies jedoch ├Ąndern, indem Sie einen anderen Wert an den Parameter whis der Boxplot-Funktion ├╝bergeben. Zum Beispiel k├Ânnen Sie whis auf 0.5 setzen, um die Whiskers die 5. und 95. Perzentile darstellen zu lassen. Hier ist ein Beispiel:

## Erstellen eines Boxplots mit benutzerdefinierten Whiskers
sns.boxplot(x="day", y="total_bill", data=tips, whis=0.5)

Seaborn Boxplot vs Violinplot

Seaborn bietet einen weiteren Typ von Plot namens Violinplot an, der einen Boxplot mit einer Kernverteilungssch├Ątzung (Kernel Density Estimation) kombiniert, um eine detailliertere Beschreibung der Verteilung der Werte zu liefern. W├Ąhrend Boxplots hervorragend geeignet sind, um eine Zusammenfassung der Daten zu liefern, k├Ânnen Violinplots ein genaueres Bild der Verteilung liefern.

Allerdings k├Ânnen Violinplots komplexer zu interpretieren sein und m├Âglicherweise nicht f├╝r alle Zielgruppen geeignet sein. Boxplots hingegen sind einfach und weit verbreitet verst├Ąndlich, wodurch sie f├╝r viele Situationen eine gute Wahl sind.

Hier ist ein Beispiel, wie Sie in Seaborn einen Violinplot erstellen k├Ânnen:

## Erstellen eines Violinplots
sns.violinplot(x="day", y="total_bill", data=tips)

Interpretieren eines Seaborn-Boxplots

Die Interpretation eines Seaborn-Boxplots erfordert das Verst├Ąndnis der verschiedenen Komponenten des Diagramms. Die Box in der Mitte repr├Ąsentiert den Interquartilbereich (IQR), der den Bereich zwischen dem ersten Quartil (25. Perzentil) und dem dritten Quartil (75. Perzentil) darstellt. Die Linie innerhalb der Box ist der Median oder das 50. Perzentil der Daten. Die Whiskers repr├Ąsentieren den Bereich der Daten innerhalb von 1,5 mal dem IQR. Datenpunkte au├čerhalb dieses Bereichs gelten als Ausrei├čer und werden als einzelne Punkte dargestellt.

Hier ist ein Beispiel, wie man einen Seaborn-Boxplot interpretiert:

## Erstelle einen Boxplot
sns.boxplot(x="day", y="total_bill", data=tips)

In diesem Boxplot kann man die durchschnittliche Gesamtrechnung f├╝r jeden Tag sehen, dargestellt durch die Linie innerhalb jeder Box. Die Boxen repr├Ąsentieren den IQR, also kann man den Bereich der Gesamtrechnungen f├╝r die mittleren 50% der Kunden an jedem Tag sehen. Die Whiskers zeigen den Bereich der Gesamtrechnungen innerhalb von 1,5 mal dem IQR und alle Punkte au├čerhalb dieses Bereichs sind Ausrei├čer.

Anmerkungen zu Seaborn-Boxplots

Seaborn-Boxplots k├Ânnen mit zus├Ątzlichen Informationen versehen werden. Zum Beispiel k├Ânnen Sie den Median, Quartile oder Ausrei├čer mit ihren Werten annotieren. Hier ist ein Beispiel, wie man Anmerkungen zu einem Seaborn-Boxplot hinzuf├╝gt:

## Erstelle einen Boxplot
ax = sns.boxplot(x="day", y="total_bill", data=tips)
 
## F├╝ge Anmerkungen hinzu
for patch in ax.artists:
    r, g, b, a = patch.get_facecolor()
    patch.set_facecolor((r, g, b, .3))
    x = patch.get_x()
    y = patch.get_y()
    width = patch.get_width()
    height = patch.get_height()
    ax.text(x+width/2, y+height/2, "{:.2f}".format(height), ha='center', va='center')
 
plt.show()

In diesem Beispiel f├╝gen wir Anmerkungen zu dem Boxplot hinzu, die die H├Âhe jeder Box anzeigen, was den IQR darstellt.

Fazit

Zusammenfassend sind Seaborn-Boxplots ein leistungsf├Ąhiges Werkzeug zur Visualisierung und Verst├Ąndnis der Verteilung Ihrer Daten. Mit der Seaborn-Bibliothek k├Ânnen Sie attraktive und informative Boxplots mit nur wenigen Zeilen Code erstellen. Egal, ob Sie einen neuen Datensatz erkunden oder einen Bericht vorbereiten, Seaborn-Boxplots k├Ânnen Ihnen die n├Âtigen Einblicke liefern.

FAQs

Was ist ein Seaborn-Boxplot und wie wird er verwendet?

Ein Seaborn-Boxplot ist eine grafische Darstellung der Verteilung eines Datensatzes, die den Median, die Quartile und Ausrei├čer der Daten zeigt. Er wird verwendet, um die Verteilung von Daten zu visualisieren und zu verstehen und um Verteilungen zwischen verschiedenen Datengruppen zu vergleichen.

Wie erstelle ich einen Seaborn-Boxplot in Python?

Sie k├Ânnen einen Seaborn-Boxplot in Python mit der Funktion seaborn.boxplot() erstellen. Sie m├╝ssen Ihre Daten an diese Funktion ├╝bergeben und das Aussehen des Boxplots mit verschiedenen Parametern anpassen k├Ânnen.

Wie kann ich das Aussehen eines Seaborn-Boxplots anpassen?

Sie k├Ânnen das Aussehen eines Seaborn-Boxplots auf verschiedene Weisen anpassen, einschlie├člich der ├änderung der Ausrichtung, Hinzuf├╝gen eines Farbtons, Anpassung der Farben und ├ändern der Whiskers. Sie k├Ânnen auch Anmerkungen hinzuf├╝gen, um zus├Ątzliche Informationen bereitzustellen.