ฉันกำลังพยายามกรองดาต้าเฟรม PySpark ที่มีNone
ค่าเป็นแถว:
df.select('dt_mvmt').distinct().collect()
[Row(dt_mvmt=u'2016-03-27'),
Row(dt_mvmt=u'2016-03-28'),
Row(dt_mvmt=u'2016-03-29'),
Row(dt_mvmt=None),
Row(dt_mvmt=u'2016-03-30'),
Row(dt_mvmt=u'2016-03-31')]
และฉันสามารถกรองได้อย่างถูกต้องด้วยค่าสตริง:
df[df.dt_mvmt == '2016-03-31']
# some results here
แต่สิ่งนี้ล้มเหลว:
df[df.dt_mvmt == None].count()
0
df[df.dt_mvmt != None].count()
0
แต่มีค่าแน่นอนในแต่ละประเภท เกิดอะไรขึ้น?