Pandas DataFrame 함수 매핑 - apply()

DataFrame의 열 혹은 행에 특정 함수를 적용하고 싶을때는 apply()를 사용한다.

DataFrame.apply() 를 이용해, 열별 혹은 행별로 함수를 적용할 수 있다.

def min_max(x: pd.Series) -> float:  
    return x.max() - x.min()

result = df.apply(min_max)  # axis=0 은 기본 값이므로 생략 가능

df['add'] = df.apply(lambda x : x['age'] + x['fare'], axis=1)  # lambda 활용

Series 객체의 개별 원소에 함수를 적용하는 경우이다.
각 원소에 함수를 적용해서 만들어진 Series를 반환해준다.

DataFrame의 개별 원소에 특정 함수를 매핑하려면, applymap() 메소드를 활용한다.

DataFrame의 apply(매핑함수, axis=0) 메소드를 호출하면, DataFrame의 각 열을 매핑 함수의 인자로 전달한다.
매핑 함수의 return type에 따라 결과 type이 달라진다.

  • Series를 리턴하는 함수 매핑 -> DataFrame 반환
  • 값을 리턴하는 함수 매핑 -> Series 반환
axis=1을 적용하면, DataFrame의 각 행을 매핑 함수의 인자로 전달한다.
인자로 넘기는 Series의 index가 원래 DataFrame의 colums 라서 axis=1 이다.

DataFrame 객체에 함수를 매핑하려면 pipe() 메소드를 활용한다.
매핑 함수의 return type에 따라 결과 type 이 달라진다.

  • DataFrame을 리턴하는 함수 매핑 -> DataFrame 반환
  • Series를 리턴하는 함수 매핑 -> Series 반환
  • 값을 리턴하는 함수 매핑 -> 값 반환
