5.3.6 널(Null) 값 채우기

로그마리오 2024. 12. 25. 22:35

2024. 12. 25. 22:35

# import pandas as pd  # bricks는 import가 없어도 됨
# import pyspark.pandas as ps # bricks는 import가 없어도 됨

my_list = [['male', 1, None], ['female', 2, 3], ['male', 3, 4]]
#-- pd --
dp = pd.DataFrame(my_list, columns=['A', 'B', 'C'])
dp.head()

#-- ps --
ds = spark.createDataFrame(my_list, ['A', 'B', 'C'])
ds.show()

#-- pd --
dp.fillna(-99)
#-- ps --
ds.fillna(-99).show()

#-- pd --
# 주의 : 특정 컬럼을 선택해야 합니다.
dp.A.replace(['male','female'],['1', '0'], inplace=True)
dp
#-- ps --
# 주의 : na를 대체하면서 동시에 특정 열의 값을 대체하지 못합니다.
# 이 경우 특정 열의 대체 값만 진행됩니다.
ds.na.replace(['male', 'female'],['1', '0']).show()

'Python > Spark' 카테고리의 다른 글

AI Agent 구축 (2)	2025.04.30
5.3.13 열 결합하기(Concat) (0)	2025.01.08
5.3.11 조인(Join) (0)	2025.01.07
5.3.9 컬럼 삭제하기(Drop) (0)	2024.12.25
5.1 RDD 생성 (0)	2024.12.15

데이터 활용과 투자이야기

5.3.6 널(Null) 값 채우기

'Python > Spark' 카테고리의 다른 글

+ Recent posts

티스토리툴바