In [1]:
import pandas as pd
import seaborn as sns
In [2]:
df = sns.load_dataset('titanic')
df.head(2)
Out[2]:
survived pclass sex age sibsp parch fare embarked class who adult_male deck embark_town alive alone
0 0 3 male 22.0 1 0 7.2500 S Third man True NaN Southampton no False
1 1 1 female 38.0 1 0 71.2833 C First woman False C Cherbourg yes False
In [3]:
df = df.loc[:, ['age', 'fare']]
df.head()
Out[3]:
age fare
0 22.0 7.2500
1 38.0 71.2833
2 26.0 7.9250
3 35.0 53.1000
4 35.0 8.0500

4.1. Series를 받고 Series를 리턴하는 함수 매핑 -> DataFrame 반환¶

In [4]:
def missing_value(series: pd.Series) -> pd.Series:
    return series.isnull()
In [5]:
result = df.apply(missing_value, axis=0)  # axis=0 은 기본 값이므로 생략 가능
result.head()  # DataFrame 반환
Out[5]:
age fare
0 False False
1 False False
2 False False
3 False False
4 False False

4.2. Series를 받고 하나의 값을 반환하는 함수 매핑 -> Series 반환¶

In [6]:
def min_max(x: pd.Series) -> float:
    return x.max() - x.min()
In [7]:
result = df.apply(min_max)  # axis=0 은 기본 값이므로 생략 가능
result  # Series 반환. 각 열이 Series의 인덱스가 됨
Out[7]:
age      79.5800
fare    512.3292
dtype: float64