ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 새로운 데이터 타입으로 변환
    Python/Pandas 2023. 1. 18. 07:23
    반응형
    df.convert_dtypes()

    https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.convert_dtypes.html

    1.0 버전에 추가됨.

    공식 문서의 예를 살펴보자. 

    >>> df = pd.DataFrame(
    ...     {
    ...         "a": pd.Series([1, 2, 3], dtype=np.dtype("int32")),
    ...         "b": pd.Series(["x", "y", "z"], dtype=np.dtype("O")),
    ...         "c": pd.Series([True, False, np.nan], dtype=np.dtype("O")),
    ...         "d": pd.Series(["h", "i", np.nan], dtype=np.dtype("O")),
    ...         "e": pd.Series([10, np.nan, 20], dtype=np.dtype("float")),
    ...         "f": pd.Series([np.nan, 100.5, 200], dtype=np.dtype("float")),
    ...     }
    ... )

    판다스에서는 int형과 NaN이 같이 사용된 경우 float형이 된다. 

    이를 df.convert_dtypes()으로 변환하면,
    Int(첫 글자가 대문자)형으로 바뀌고,
    이는 Int와 NA를 정확히 표현한다. 

     

    이렇게 새로 도입된 pd.NA는 np.nan과는 약간의 차이가 있다. 

    반응형
Designed by Tistory.