파이썬의 seaborn 중 distribution 을 표현하는 displot에 대해 정리하고자 한다.
먼저 seaborn 을 임포트 한 이후 기본 데이터인 tips를 불러온다.
import seaborn as sns
%matplotlib inline
tips = sns.load_dataset('tips')
tips
1. distplot
distplot 의 기본 그래프를 그려주면 아래와 같이 나온다.
sns.distplot(tips['total_bill'])
만약 파란 선을 없애주고 싶다면 kde=False 옵션을 준다.
sns.distplot(tips['total_bill'], kde=False)
bins 옵션을 준다. bins가 10개면 위의 그래프를 10개로 나눠 표시하겠다는 것이고 30개이면 30개로 나눠 표기하겠다는 말이다.
sns.distplot(tips['total_bill'], kde=False, bins=30)
2. Jointplot
scatter과 bar를 합치고 싶을 때에는 seaborn 의 jointplot을 쓰면 된다.
우선 data로 데이터를 주고, x축 y축에 표기할 데이터를 각각 쓴다.
sns.jointplot(x='total_bill', y='tip', data=tips)
kind 옵션에 변화를 주면서 데이터의 모양을 변화시킬 수도 있다.
sns.jointplot(x='total_bill', y='tip', data=tips, kind='hex')
sns.jointplot(x='total_bill', y='tip', data=tips, kind='reg')
sns.jointplot(x='total_bill', y='tip', data=tips, kind='kde')
3. Pairplot
pairplot은 각각 쌍의 그래프를 보여준다.
sns.pairplot(tips)
sns.pairplot(tips, hue='sex')
4. rugplot
rugplot은 각각의 밀도를 보여준다. 1번과 비교해보면 밀도가 높은 것이 크기가 큰 데이터이다.