วิธีแปลงดัชนีของดาต้าดาต้าแพนด้าให้เป็นคอลัมน์?


456

ดูเหมือนว่าจะค่อนข้างชัดเจน แต่ฉันไม่สามารถหาวิธีแปลงดัชนีของเฟรมข้อมูลเป็นคอลัมน์ได้

ตัวอย่างเช่น:

df=
        gi       ptt_loc
 0  384444683      593  
 1  384444684      594 
 2  384444686      596  

ถึง,

df=
    index1    gi       ptt_loc
 0  0     384444683      593  
 1  1     384444684      594 
 2  2     384444686      596  

คำตอบ:


764

ทั้ง:

df['index1'] = df.index

หรือ.reset_index:

df.reset_index(level=0, inplace=True)

ดังนั้นหากคุณมีเฟรมหลายดัชนีพร้อมดัชนี 3 ระดับเช่น:

>>> df
                       val
tick       tag obs        
2016-02-26 C   2    0.0139
2016-02-27 A   2    0.5577
2016-02-28 C   6    0.0303

และคุณต้องการแปลงระดับ 1 ( tick) และ 3 ( obs) ในดัชนีเป็นคอลัมน์คุณจะทำ:

>>> df.reset_index(level=['tick', 'obs'])
          tick  obs     val
tag                        
C   2016-02-26    2  0.0139
A   2016-02-27    2  0.5577
C   2016-02-28    6  0.0303

4
โปรดจำไว้ว่าคุณต้องทำเช่นนี้ n ครั้งสำหรับทุกดัชนีที่คุณมี (เช่นถ้าคุณมีดัชนีสองตัวคุณต้องทำสองครั้ง)
dval

34
ด้วยdf.reset_index(level=df.index.names, inplace=True)หนึ่งสามารถแปลง multiindex ทั้งมอบไว้ในคอลัมน์
Venti

2
คุณสามารถมีดัชนีในคอลัมน์ที่คุณเพิ่งเพิ่มไปยัง dataframe เพื่อให้คอลัมน์ที่แท้จริงและดัชนี?
bretcj7

2
หากคุณต้องการแปลง multiindex ทั้งหมดเพียงแค่การใช้งานdf.reset_index()ซึ่งย้ายครบถ้วนของดัชนีลงในคอลัมน์ (คอลัมน์หนึ่งต่อระดับ) และสร้างดัชนี int จาก 0 ถึง len (DF) -1
BallpointBen

2
การกำหนดให้กับคอลัมน์เช่นdf['index1'] = df.indexส่งคืนคำเตือน: "ค่ากำลังพยายามตั้งค่าบนสำเนาของส่วนหนึ่งจาก DataFrame" ใช้ฟังก์ชัน df.assign () แทนดังที่แสดงด้านล่าง
John Mark

36

สำหรับ MultiIndex คุณสามารถแยก subindex โดยใช้

df['si_name'] = R.index.get_level_values('si_name') 

โดยที่si_nameชื่อของ subindex


26

เพื่อให้ความชัดเจนมากขึ้นลองดู DataFrame ที่มีสองระดับในดัชนี (MultiIndex)

index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'], 
                                    ['North', 'South']], 
                                   names=['State', 'Direction'])

df = pd.DataFrame(index=index, 
                  data=np.random.randint(0, 10, (6,4)), 
                  columns=list('abcd'))

ป้อนคำอธิบายรูปภาพที่นี่

reset_indexวิธีเรียกว่ามีค่าเริ่มต้นที่แปลงระดับดัชนีคอลัมน์และใช้ง่ายRangeIndexเป็นดัชนีใหม่

df.reset_index()

ป้อนคำอธิบายรูปภาพที่นี่

ใช้levelพารามิเตอร์เพื่อควบคุมระดับดัชนีที่จะถูกแปลงเป็นคอลัมน์ หากเป็นไปได้ให้ใช้ชื่อระดับซึ่งมีความชัดเจนยิ่งขึ้น หากไม่มีชื่อระดับคุณสามารถอ้างถึงแต่ละระดับตามตำแหน่งจำนวนเต็มซึ่งเริ่มต้นที่ 0 จากภายนอก คุณสามารถใช้ค่าสเกลาร์ได้ที่นี่หรือรายการดัชนีทั้งหมดที่คุณต้องการรีเซ็ต

df.reset_index(level='State') # same as df.reset_index(level=0)

ป้อนคำอธิบายรูปภาพที่นี่

ในเหตุการณ์ที่เกิดขึ้นได้ยากที่คุณต้องการเก็บรักษาดัชนีและเปลี่ยนดัชนีเป็นคอลัมน์คุณสามารถทำสิ่งต่อไปนี้:

# for a single level
df.assign(State=df.index.get_level_values('State'))

# for all levels
df.assign(**df.index.to_frame())

15

rename_axis + reset_index

ก่อนอื่นคุณสามารถเปลี่ยนชื่อดัชนีเป็นป้ายกำกับที่ต้องการจากนั้นยกระดับเป็นซีรี่ส์:

df = df.rename_axis('index1').reset_index()

print(df)

   index1         gi  ptt_loc
0       0  384444683      593
1       1  384444684      594
2       2  384444686      596

สิ่งนี้สามารถใช้งานได้กับMultiIndexdataframes ด้วย:

print(df)
#                        val
# tick       tag obs        
# 2016-02-26 C   2    0.0139
# 2016-02-27 A   2    0.5577
# 2016-02-28 C   6    0.0303

df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()

print(df)

       index1 index2  index3     val
0  2016-02-26      C       2  0.0139
1  2016-02-27      A       2  0.5577
2  2016-02-28      C       6  0.0303

4

หากคุณต้องการใช้reset_indexวิธีการและรักษาดัชนีที่มีอยู่ของคุณคุณควรใช้:

df.reset_index().set_index('index', drop=False)

หรือจะเปลี่ยนมันในสถานที่:

df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)

ตัวอย่างเช่น:

print(df)
          gi  ptt_loc
0  384444683      593
4  384444684      594
9  384444686      596

print(df.reset_index())
   index         gi  ptt_loc
0      0  384444683      593
1      4  384444684      594
2      9  384444686      596

print(df.reset_index().set_index('index', drop=False))
       index         gi  ptt_loc
index
0          0  384444683      593
4          4  384444684      594
9          9  384444686      596

และหากคุณต้องการกำจัดป้ายกำกับดัชนีคุณสามารถทำได้:

df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
   index         gi  ptt_loc
0      0  384444683      593
4      4  384444684      594
9      9  384444686      596

2
df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1

    new     gi     ptt
0    0      232    342
1    1      66     56 
2    2      34     662
3    3      43     123

5
ฉันขอแนะนำให้เพิ่มการสนทนาเกี่ยวกับสาเหตุที่คุณคิดว่าคำตอบนี้ดีกว่าคำตอบที่มีอยู่ ...
dmcgrandle

0

วิธีที่ง่ายมากในการทำเช่นนี้คือการใช้วิธี reset_index () สำหรับ data frame df ใช้รหัสด้านล่าง:

df.reset_index(inplace=True)

ด้วยวิธีนี้ดัชนีจะกลายเป็นคอลัมน์และโดยใช้ inplace เป็น True จะเป็นการเปลี่ยนแปลงแบบถาวร


1
คำตอบนี้แตกต่างจากคำตอบที่ยอมรับโดย alread อย่างไร
Annosz
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.