wefree 2022. 10. 8. 19:56
import seaborn as sns
import pandas as pd


df = sns.load_dataset('titanic')

df.info()
df.describe()

df.count()
df['age'].count()

df.mean()
df['age'].mean()

cond = df['alive'] == 'yes'
df[cond]['age'].mean()
df.loc[cond, 'age'].mean()

# skipna=True가 기본으로 설정 되어 있습니다.
# skipna=False로 설정하게 된다면, NaN 값이 있는 column은 NaN 값으로 출력 됩니다.
df.mean(skipna=False)

pd.Series([4, 5, 1, 2, 3]).median()  # 3.0
pd.Series([1, 2, 3, 4, 5, 6]).median()  # 3.5

df['age'].min()
df['age'].max()

df['age'].quantile(0.1)
df['who'].unique()
df['who'].nunique()  # 고유 개수 출력
df['who'].mode()  # 최빈값

df['age'].agg(['min', 'max', 'count', 'mean'])

 

참고: https://www.udemy.com/course/pandas-i/