Distribution plot cocok digunakan untuk menampilkan visualisasi distribusi dari data numerik di seaborn
Beberapa jenis visualisasinya antara lain
- displot
- jointplot
- pairplot
Displot digunakan untuk membuat histogram dengan beberapa parameter seperti bins, hist, kde
Contents
Lets Code
Kita akan menggunakan dataset tips untuk distribution plot
displot
displot digunakan untuk membuat histogram. Misalnya kita ingin membuat distribusi tip yang diberikan pelanggan dengan dengan interval 20
tips = sns.load_dataset('tips') sns.distplot(tips['tip'], bins=20, kde=True)
Hasilnya adalah
jointplot
Jointplot digunakan untuk menganalisis kombinasi 2 data numerik untuk melihat korelasinya
Misalnya kita ingin melihat korelasi distribusi variabel total bil dan tip.. apakah semakin besar total bil pelanggan akan memberikan tip yang semakin besar
Kita juga harus tentukan sumbu X dan sumbu Y
tips = sns.load_dataset('tips') sns.jointplot(x=tips['tip'], y=tips['tip'], data=tips)
Kita bisa lihat hasil visualisasi bahwa hubungan total bil dengan tip berbanding lurus artinya semakin kecil total bil, tip yang diberikan juga semakin kecil begitu juga sebaliknya
pairplot
pairplot dapat membantu kita untuk melihat distribusi atribut tunggal atau hubungan 2 atribut data
Kita tidak perlu menentukan nilai sumbu X dan sumbu Y karena semua korelasi atribut akan ditampilkan
tips = sns.load_dataset('tips') sns.pairplot(data=tips)
Hasilnya adalah