Categorical plots adalah visualisasi seaborn dengan melakukan agregasi nilai per kolom yang berbentuk kategori
Beberapa jenis visualisasinya antara lain
- barplot
- countplot
- boxplot
- violinplot
- stripplot
- swarmplot
Untuk menggunakan jenis plot ini secara umum bentuk sintaknya adalah seperti ini
categoricalplot([x, y, data, hue])
x = Nilai sumbu X y = Nilai sumbu Y data = DataFrame hue = Nilai sumbu Z (untuk memperdetail visualisasi dari kolom lainnya)
Contents
Let’s Code
Sekarang kita akan coba membuat visualisasi grafik categorical data. Kita akan coba gunakan dataset tips. dataset ini adalah data yang meyimpan informasi tentang tip yang diberikan pengunjung kepada pelayan restoran
barplot
barplot digunakan untuk agregasi categorical data dalam bentuk bar
Pertama kita load library seaborn dan load dataset tips
Kita akan plot sumbu X dengan jenis kelamin dan Y adalah agregasi nilai dari tips yan diberikan
tips = sns.load_dataset('tips') sns.barplot(x='sex', y='tip', data=tips)
Hasilnya adalah
Kita juga bisa mencoba-coba mengganti sumbu X dengan kategori lain misalnya day atau time
Dengan adanya fungsi ini akan sangat mudah dalam memahami agregasi nilai berdasarkan atribut kategori
Untuk fungsi lainnya kita cukup mengganti fungis barplot() menjadi boxplot(), violinplot() dan sebagainya
boxplot
Boxplot digunakan untuk menampilkan data numerik dengan 5 ukuran
- nilai terkecil (Min)
- kuartil pertama (Q1)
- kuartir tengah (Q2)
- kuartil pertama (Q3)
- nilai terbesar (Max)
Di dalam Boxplot juga ditujukkan outlier yang biasanya dalam bentuk titik
langsung kita coba untuk menampilkan data dalam bentuk boxplot untuk melihat nilai min, Q1, Q2, Q3 dan max
Kita juga bisa menggunakan argument hue untuk menampilkan data yang lebih detail.
Misalnya melihat distribusi tip di setiap hari untuk masing-masing pelanggan laki-laki dan perempuan
Violinplot
Violinplot merupakan grafik yang mirip boxplot tetapi menggunakan kernel density untuk mempermudah memahami distribusi data lebih baik
Stripplot
Dengan stripplot() kita dapat membuat grafik scatterplot berdasarkan kategori
countplot
countplot digunakan untuk menjumlah data berdasarkan kategorinya
Oke.. cukup sekian pengenalan visualisasi jenis categorical data.. silahkan dieksplor lebih lanjut dengan kombinasi Library Pandas