จะปล่อยค่า Null จาก dynamic loop ที่สร้างจาก Python ได้อย่างไร?


11

ฉันมี data-frame เช่นนี้:

   ORDER_NO         2401        2504         2600
    2020020         2019-12-04  2019-12-10   2019-12-12 
    2020024         2019-12-25  NaN          2019-12-20
    2020034         NaN         NaN          2019-12-20
    2020020         2019-12-12  2019-12-15   2019-12-18

ฉันกำลังสร้าง XML จากกรอบข้อมูลด้านบน ฉันต้องการลบค่า Null ที่ถูกใส่ใน XML รหัสของฉันควรวางคอลัมน์และค่าแถวนั้นจาก XML

รหัสของฉัน

header = """<ORD>{}</ORD>"""
body ="""
<osi:ORDSTSINF types:STSCDE="{}">
<DTM>{}</DTM>"""

cols = df.columns
for row in df.itertuples():
    with open(f'{row[1]}.xml', 'w') as f:
        f.write(header.format(row[1]))
        for c, r in zip(row[2:], cols[1:]):
            f.write(body.format(r, c))

เอาท์พุทปัจจุบันสำหรับบันทึก 2

<ORD>2020024</ORD>
<osi:ORDSTSINF types:STSCDE="2401">
<DTM>2019-12-25</DTM>
<osi:ORDSTSINF types:STSCDE="2504">
<DTM>NaN</DTM>
<osi:ORDSTSINF types:STSCDE="2600">
<DTM>2019-12-20</DTM>

ผลลัพธ์ที่คาดหวังสำหรับบันทึก 2

 <ORD>2020024</ORD>
    <osi:ORDSTSINF types:STSCDE="2401">
    <DTM>2019-12-25</DTM>
    <osi:ORDSTSINF types:STSCDE="2600">
    <DTM>2019-12-20</DTM>

วิธีนี้สามารถทำได้ใน Python

คำตอบ:


6

stack

ธรรมชาติลดลงเป็นโมฆะ

header = """<ORD>{}</ORD>"""
body ="""
<osi:ORDSTSINF types:STSCDE="{}">
<DTM>{}</DTM>"""

for o, d in df.set_index('ORDER_NO').stack().groupby('ORDER_NO'):
    with open(f'{o}.xml', 'w') as f:
        f.write(header.format(o))
        for (o, s), date in d.iteritems():
            f.write(body.format(s, date))

รายละเอียด

df.set_index('ORDER_NO').stack()

ORDER_NO      
2020020   2401   2019-12-04
          2504   2019-12-10
          2600   2019-12-12
2020024   2401   2019-12-25
          2600   2019-12-20
2020034   2600   2019-12-20
2020020   2401   2019-12-12
          2504   2019-12-15
          2600   2019-12-18

BTW

ทางออกของคุณจะดีกับ if

header = """<ORD>{}</ORD>"""
body ="""
<osi:ORDSTSINF types:STSCDE="{}">
<DTM>{}</DTM>"""

cols = df.columns
for row in df.itertuples():
    with open(f'{row[1]}.xml', 'w') as f:
        f.write(header.format(row[1]))
        for c, r in zip(row[2:], cols[1:]):
            if pd.notna(c):
                f.write(body.format(r, c))

ฉันเพิ่งเพิ่มส่วนท้าย ( footer = """<END>123</END>"") แต่เอาต์พุตกำลังมาในบรรทัดเดียวกัน<DTM>2020-03-29</DTM><END>123</END>แทนที่จะเป็นบรรทัดใหม่
Ria Alves

1
เมื่อคุณใช้f.writeมันไม่ไม่คิดที่จะนำ'\n'สำหรับคุณ คุณได้รูปแบบbodyสตริงของคุณ ระบุส่วนท้ายของคุณด้วยfooter = """\n<END>123</END>"""
piRSquared
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.