# import pandas as pd # bricks는 import가 없어도 됨
# import pyspark.pandas as ps # bricks는 import가 없어도 됨
my_list = [['male', 1, None], ['female', 2, 3], ['male', 3, 4]]
#-- pd --
dp = pd.DataFrame(my_list, columns=['A', 'B', 'C'])
dp.head()
#-- ps --
ds = spark.createDataFrame(my_list, ['A', 'B', 'C'])
ds.show()
#-- pd --
dp.fillna(-99)
#-- ps --
ds.fillna(-99).show()
#-- pd --
# 주의 : 특정 컬럼을 선택해야 합니다.
dp.A.replace(['male','female'],['1', '0'], inplace=True)
dp
#-- ps --
# 주의 : na를 대체하면서 동시에 특정 열의 값을 대체하지 못합니다.
# 이 경우 특정 열의 대체 값만 진행됩니다.
ds.na.replace(['male', 'female'],['1', '0']).show()