본문 바로가기

머신러닝/시각화

[파이썬] Seaborn distribution plot 정리(distplot, jointplot, pairplot, rugplot)

파이썬의 seaborn 중 distribution 을 표현하는 displot에 대해 정리하고자 한다.

먼저 seaborn 을 임포트 한 이후 기본 데이터인 tips를 불러온다.

import seaborn as sns
%matplotlib inline
tips = sns.load_dataset('tips')
tips

1. distplot

distplot 의 기본 그래프를 그려주면 아래와 같이 나온다.

sns.distplot(tips['total_bill'])

 

만약 파란 선을 없애주고 싶다면 kde=False 옵션을 준다.

sns.distplot(tips['total_bill'], kde=False)

 

bins 옵션을 준다. bins가 10개면 위의 그래프를 10개로 나눠 표시하겠다는 것이고 30개이면 30개로 나눠 표기하겠다는 말이다.

sns.distplot(tips['total_bill'], kde=False, bins=30)

 

 

2. Jointplot

scatter과 bar를 합치고 싶을 때에는 seaborn 의 jointplot을 쓰면 된다.

우선 data로 데이터를 주고, x축 y축에 표기할 데이터를 각각 쓴다.

sns.jointplot(x='total_bill', y='tip', data=tips)

kind 옵션에 변화를 주면서 데이터의 모양을 변화시킬 수도 있다.

sns.jointplot(x='total_bill', y='tip', data=tips, kind='hex')

sns.jointplot(x='total_bill', y='tip', data=tips, kind='reg')

 

sns.jointplot(x='total_bill', y='tip', data=tips, kind='kde')

 

 

 

3. Pairplot

 

pairplot은 각각 쌍의 그래프를 보여준다.

sns.pairplot(tips)

 

 

sns.pairplot(tips, hue='sex')

4. rugplot

rugplot은 각각의 밀도를 보여준다. 1번과 비교해보면 밀도가 높은 것이 크기가 큰 데이터이다.