seaborn categorical data
Data Visualization, Python

Tutorial Seaborn : Mengenal Categorical plots

Categorical plots adalah visualisasi seaborn dengan melakukan agregasi nilai per kolom yang berbentuk kategori

Beberapa jenis visualisasinya antara lain

  • barplot
  • countplot
  • boxplot
  • violinplot
  • stripplot
  • swarmplot

Untuk menggunakan jenis plot ini secara umum bentuk sintaknya adalah seperti ini

categoricalplot([x, y, data, hue])
x = Nilai sumbu X
y = Nilai sumbu Y
data = DataFrame
hue = Nilai sumbu Z (untuk memperdetail visualisasi dari kolom lainnya)

Let’s Code

Sekarang kita akan coba membuat visualisasi grafik categorical data. Kita akan coba gunakan dataset tips. dataset ini adalah data yang meyimpan informasi tentang tip yang diberikan pengunjung kepada pelayan restoran

barplot

barplot digunakan untuk agregasi categorical data dalam bentuk bar

Pertama kita load library seaborn dan load dataset tips

Kita akan plot sumbu X dengan jenis kelamin dan Y adalah agregasi nilai dari tips yan diberikan

tips = sns.load_dataset('tips')
sns.barplot(x='sex', y='tip', data=tips)

Hasilnya adalah

Kita juga bisa mencoba-coba mengganti sumbu X dengan kategori lain misalnya day atau time

Dengan adanya fungsi ini akan sangat mudah dalam memahami agregasi nilai berdasarkan atribut kategori

Untuk fungsi lainnya kita cukup mengganti fungis barplot() menjadi boxplot(), violinplot() dan sebagainya

boxplot

Boxplot digunakan untuk menampilkan data numerik dengan 5 ukuran

  • nilai terkecil (Min)
  • kuartil pertama (Q1)
  • kuartir tengah (Q2)
  • kuartil pertama (Q3)
  • nilai terbesar (Max)

Di dalam Boxplot juga ditujukkan outlier yang biasanya dalam bentuk titik

langsung kita coba untuk menampilkan data dalam bentuk boxplot untuk melihat nilai min, Q1, Q2, Q3 dan max

Kita juga bisa menggunakan argument hue untuk menampilkan data yang lebih detail.

Misalnya melihat distribusi tip di setiap hari untuk masing-masing pelanggan laki-laki dan perempuan

Violinplot

Violinplot merupakan grafik yang mirip boxplot tetapi menggunakan kernel density untuk mempermudah memahami distribusi data lebih baik

Stripplot

Dengan stripplot() kita dapat membuat grafik scatterplot berdasarkan kategori

countplot

countplot digunakan untuk menjumlah data berdasarkan kategorinya

Oke.. cukup sekian pengenalan visualisasi jenis categorical data.. silahkan dieksplor lebih lanjut dengan kombinasi Library Pandas

Leave a Reply

Your email address will not be published. Required fields are marked *