ฉันจะพล็อต Pandas DataFrames ที่แยกเป็นพล็อตย่อยได้อย่างไร


129

ฉันมี Pandas DataFrames สองสามตัวที่ใช้มาตราส่วนค่าเดียวกัน แต่มีคอลัมน์และดัชนีต่างกัน เมื่อเรียกใช้df.plot()ฉันจะได้ภาพพล็อตแยกต่างหาก สิ่งที่ฉันต้องการจริงๆคือให้พวกเขาทั้งหมดอยู่ในพล็อตเรื่องเดียวกับเรื่องยิบย่อย แต่น่าเสียดายที่ฉันไม่สามารถหาวิธีแก้ปัญหาได้และจะขอขอบคุณเป็นอย่างสูงสำหรับความช่วยเหลือ

คำตอบ:


252

คุณสามารถสร้างพล็อตย่อยด้วยตัวเองด้วย matplotlib จากนั้นพล็อตดาต้าเฟรมบนพล็อตย่อยเฉพาะโดยใช้axคีย์เวิร์ด ตัวอย่างสำหรับ 4 พล็อตย่อย (2x2):

import matplotlib.pyplot as plt

fig, axes = plt.subplots(nrows=2, ncols=2)

df1.plot(ax=axes[0,0])
df2.plot(ax=axes[0,1])
...

นี่คืออาร์เรย์ซึ่งถือขวานแผนแตกต่างกันและคุณสามารถเข้าถึงหนึ่งเพียงแค่การจัดทำดัชนีaxes หากคุณต้องการใช้ร่วมกันแกน x แล้วคุณสามารถให้การaxes
sharex=Trueplt.subplots


33
โปรดทราบว่า.subplots()ส่งคืนระบบพิกัดที่แตกต่างกันอย่างน่ารำคาญโดยขึ้นอยู่กับขนาดของอาร์เรย์ของพล็อตย่อยที่คุณกำลังสร้าง ดังนั้นหากคุณกลับมาย่อย ๆ ที่พูดnrows=2, ncols=1คุณจะต้องดัชนีแกนเป็นและaxes[0] axes[1]ดูstackoverflow.com/a/21967899/1569221
canary_in_the_data_mine

3
@canary_in_the_data_mine ขอบคุณที่เป็นที่น่ารำคาญจริงๆ ... ความคิดเห็นของคุณบันทึกฉันบางเวลา :) ไม่สามารถคิดออกว่าทำไมผมได้รับIndexError: too many indices for array
snd

9
@canary_in_the_data_mine นั่นเป็นเพียงสิ่งที่น่ารำคาญหาก.subplot()มีการใช้อาร์กิวเมนต์เริ่มต้นสำหรับ กำหนดsqueeze=Falseให้บังคับ.subplot()ให้ส่งคืนndarrayแถวและคอลัมน์เสมอในกรณีใด ๆ
Martin

73

คุณสามารถดู e.gs. ในเอกสารแสดงคำตอบของ joris นอกจากนี้จากเอกสารนี้คุณยังสามารถตั้งค่าsubplots=Trueและlayout=(,)ภายในplotฟังก์ชันแพนด้า:

df.plot(subplots=True, layout=(1,2))

นอกจากนี้คุณยังสามารถใช้fig.add_subplot()ซึ่งใช้พารามิเตอร์ตารางแผนเช่น 221, 222, 223, 224, และอื่น ๆ ที่อธิบายไว้ในโพสต์ที่นี่ ตัวอย่างที่ดีของพล็อตบนกรอบข้อมูลแพนด้ารวมถึงพล็อตย่อยสามารถดูได้ในสมุดบันทึก ipythonนี้


2
แม้ว่าคำตอบของ joris จะยอดเยี่ยมสำหรับการใช้งาน matplotlib ทั่วไป แต่ก็ยอดเยี่ยมสำหรับทุกคนที่ต้องการใช้แพนด้าเพื่อการแสดงข้อมูลอย่างรวดเร็ว ยังสอดรับกับคำถามได้ดีกว่าเล็กน้อย
Little Bobby Tables

โปรดทราบว่าsubplotsและlayoutkwargs จะสร้างหลายพล็อตสำหรับดาต้าเฟรมเดียวเท่านั้น สิ่งนี้เกี่ยวข้อง แต่ไม่ใช่วิธีแก้ปัญหาสำหรับคำถามของ OP ในการพล็อตดาต้าเฟรมหลายรายการในพล็อตเดียว
Austin A

1
นี่คือคำตอบที่ดีกว่าสำหรับการใช้งาน Pandas ล้วนๆ สิ่งนี้ไม่จำเป็นต้องนำเข้า matplotlib โดยตรง (แม้ว่าโดยปกติแล้วคุณควรจะยังlayout=(df.shape[1], 1)ไงก็ตาม) และไม่จำเป็นต้องมีการวนซ้ำสำหรับรูปร่างที่กำหนดเอง (สามารถใช้เช่น)
Anatoly Makarevich

20

คุณสามารถใช้รูปแบบที่คุ้นเคย Matplotlib โทรfigureและแต่คุณก็จำเป็นต้องระบุแกนปัจจุบันใช้subplot plt.gca()ตัวอย่าง:

plt.figure(1)
plt.subplot(2,2,1)
df.A.plot() #no need to specify for first axis
plt.subplot(2,2,2)
df.B.plot(ax=plt.gca())
plt.subplot(2,2,3)
df.C.plot(ax=plt.gca())

ฯลฯ ...


7

คุณสามารถพล็อตพล็อตย่อยหลาย ๆ เฟรมข้อมูลแพนด้าโดยใช้ matplotlib ด้วยเคล็ดลับง่ายๆในการสร้างรายการเฟรมข้อมูลทั้งหมด จากนั้นใช้ for loop สำหรับการพล็อตเรื่องย่อย

รหัสการทำงาน:

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# dataframe sample data
df1 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df2 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df3 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df4 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df5 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df6 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
#define number of rows and columns for subplots
nrow=3
ncol=2
# make a list of all dataframes 
df_list = [df1 ,df2, df3, df4, df5, df6]
fig, axes = plt.subplots(nrow, ncol)
# plot counter
count=0
for r in range(nrow):
    for c in range(ncol):
        df_list[count].plot(ax=axes[r,c])
        count=+1

ใส่คำอธิบายภาพที่นี่

การใช้รหัสนี้คุณสามารถลงจุดย่อยในการกำหนดค่าใด ๆ คุณต้องการเพียงแค่กำหนดจำนวนแถวและจำนวนคอลัมน์nrow ncolนอกจากนี้คุณต้องสร้างรายการกรอบข้อมูลdf_listที่คุณต้องการพล็อต


2
ให้ความสนใจกับการพิมพ์ผิดในแถวสุดท้าย: ไม่ใช่count =+1แต่count +=1
PEBKAC

4

คุณสามารถใช้สิ่งนี้:

fig = plt.figure()
ax = fig.add_subplot(221)
plt.plot(x,y)

ax = fig.add_subplot(222)
plt.plot(x,z)
...

plt.show()

3

คุณอาจไม่จำเป็นต้องใช้นุ่นเลย นี่คือพล็อตความถี่แมว matplotlib:

ใส่คำอธิบายภาพที่นี่

x = np.linspace(0, 2*np.pi, 400)
y = np.sin(x**2)

f, axes = plt.subplots(2, 1)
for c, i in enumerate(axes):
  axes[c].plot(x, y)
  axes[c].set_title('cats')
plt.tight_layout()

1

จากการตอบสนองของ @joris ด้านบนหากคุณได้สร้างการอ้างอิงไปยังพล็อตย่อยแล้วคุณสามารถใช้ข้อมูลอ้างอิงได้เช่นกัน ตัวอย่างเช่น,

ax1 = plt.subplot2grid((50,100), (0, 0), colspan=20, rowspan=10)
...

df.plot.barh(ax=ax1, stacked=True)

0

วิธีสร้างพล็อตหลายรายการจากพจนานุกรมของดาต้าเฟรมที่มีข้อมูลยาว (เป็นระเบียบเรียบร้อย)

  • สมมติฐาน

    • มีพจนานุกรมของดาต้าเฟรมข้อมูลที่เป็นระเบียบเรียบร้อยหลายรายการ
      • สร้างโดยการอ่านจากไฟล์
      • สร้างโดยการแยกดาต้าเฟรมเดียวออกเป็นหลายดาต้าเฟรม
    • หมวดหมู่catอาจทับซ้อนกัน แต่ดาต้าเฟรมทั้งหมดอาจไม่มีค่าทั้งหมดของcat
    • hue='cat'
  • เนื่องจากดาต้าเฟรมกำลังถูกทำซ้ำจึงไม่รับประกันว่าสีจะถูกแมปเหมือนกันสำหรับแต่ละพล็อต

    • ต้องสร้างแมปสีที่กำหนดเองจาก'cat'ค่าเฉพาะสำหรับดาต้าเฟรมทั้งหมด
    • เนื่องจากสีจะเหมือนกันให้วางหนึ่งตำนานไว้ที่ด้านข้างของแปลงแทนที่จะเป็นตำนานในทุกพล็อต

นำเข้าและข้อมูลสังเคราะห์

import pandas as pd
import numpy as np  # used for random data
import random  # used for random data
import matplotlib.pyplot as plt
from matplotlib.patches import Patch  # for custom legend
import seaborn as sns
import math import ceil  # determine correct number of subplot


# synthetic data
df_dict = dict()
for i in range(1, 7):
    np.random.seed(i)
    random.seed(i)
    data_length = 100
    data = {'cat': [random.choice(['A', 'B', 'C']) for _ in range(data_length)],
            'x': np.random.rand(data_length),
            'y': np.random.rand(data_length)}
    df_dict[i] = pd.DataFrame(data)


# display(df_dict[1].head())

  cat         x         y
0   A  0.417022  0.326645
1   C  0.720324  0.527058
2   A  0.000114  0.885942
3   B  0.302333  0.357270
4   A  0.146756  0.908535

สร้างการแมปสีและพล็อต

# create color mapping based on all unique values of cat
unique_cat = {cat for v in df_dict.values() for cat in v.cat.unique()}  # get unique cats
colors = sns.color_palette('husl', n_colors=len(unique_cat))  # get a number of colors
cmap = dict(zip(unique_cat, colors))  # zip values to colors

# iterate through dictionary and plot
col_nums = 3  # how many plots per row
row_nums = math.ceil(len(df_dict) / col_nums)  # how many rows of plots
plt.figure(figsize=(10, 5))  # change the figure size as needed
for i, (k, v) in enumerate(df_dict.items(), 1):
    plt.subplot(row_nums, col_nums, i)  # create subplots
    p = sns.scatterplot(data=v, x='x', y='y', hue='cat', palette=cmap)
    p.legend_.remove()  # remove the individual plot legends
    plt.title(f'DataFrame: {k}')

plt.tight_layout()
# create legend from cmap
patches = [Patch(color=v, label=k) for k, v in cmap.items()]
# place legend outside of plot; change the right bbox value to move the legend up or down
plt.legend(handles=patches, bbox_to_anchor=(1.06, 1.2), loc='center left', borderaxespad=0)
plt.show()

ใส่คำอธิบายภาพที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.