Heatmap ใน matplotlib ด้วย pcolor?


100

ฉันต้องการสร้างแผนที่ความร้อนเช่นนี้ (แสดงในFlowingData ): แผนที่ความร้อน

แหล่งข้อมูลอยู่ที่นี่แต่ข้อมูลแบบสุ่มและป้ายกำกับจะใช้ได้ดีเช่น

import numpy
column_labels = list('ABCD')
row_labels = list('WXYZ')
data = numpy.random.rand(4,4)

การสร้างแผนที่ความร้อนนั้นง่ายพอใน matplotlib:

from matplotlib import pyplot as plt
heatmap = plt.pcolor(data)

และฉันยังพบข้อโต้แย้งcolormap ที่ดูถูกต้อง:heatmap = plt.pcolor(data, cmap=matplotlib.cm.Blues)

แต่นอกเหนือจากนั้นฉันไม่สามารถหาวิธีแสดงป้ายกำกับสำหรับคอลัมน์และแถวและแสดงข้อมูลในการวางแนวที่เหมาะสม (จุดเริ่มต้นที่ด้านซ้ายบนแทนที่จะเป็นด้านล่างซ้าย)

ความพยายามที่จะจัดการheatmap.axes(เช่นheatmap.axes.set_xticklabels = column_labels) ทั้งหมดล้มเหลว ฉันขาดอะไรไปที่นี่?


คำถามเกี่ยวกับแผนที่ความร้อนนี้มีความทับซ้อนกันมาก- อาจเป็นข้อมูลที่ดีสำหรับคุณที่นั่น
John Lyon

เทคนิคฉลากจากโพสต์นี้อาจช่วยให้stackoverflow.com/questions/6352740/matplotlib-label-each-bin
tacaswell

คำตอบ:


123

นี่มันสายไปแล้ว แต่นี่คือการใช้ python ของฉันในแผนที่ความร้อน NBA ที่ไหลลื่น

อัปเดต: 1/4/2014 : ขอบคุณทุกคน

# -*- coding: utf-8 -*-
# <nbformat>3.0</nbformat>

# ------------------------------------------------------------------------
# Filename   : heatmap.py
# Date       : 2013-04-19
# Updated    : 2014-01-04
# Author     : @LotzJoe >> Joe Lotz
# Description: My attempt at reproducing the FlowingData graphic in Python
# Source     : http://flowingdata.com/2010/01/21/how-to-make-a-heatmap-a-quick-and-easy-solution/
#
# Other Links:
#     http://stackoverflow.com/questions/14391959/heatmap-in-matplotlib-with-pcolor
#
# ------------------------------------------------------------------------

import matplotlib.pyplot as plt
import pandas as pd
from urllib2 import urlopen
import numpy as np
%pylab inline

page = urlopen("http://datasets.flowingdata.com/ppg2008.csv")
nba = pd.read_csv(page, index_col=0)

# Normalize data columns
nba_norm = (nba - nba.mean()) / (nba.max() - nba.min())

# Sort data according to Points, lowest to highest
# This was just a design choice made by Yau
# inplace=False (default) ->thanks SO user d1337
nba_sort = nba_norm.sort('PTS', ascending=True)

nba_sort['PTS'].head(10)

# Plot it out
fig, ax = plt.subplots()
heatmap = ax.pcolor(nba_sort, cmap=plt.cm.Blues, alpha=0.8)

# Format
fig = plt.gcf()
fig.set_size_inches(8, 11)

# turn off the frame
ax.set_frame_on(False)

# put the major ticks at the middle of each cell
ax.set_yticks(np.arange(nba_sort.shape[0]) + 0.5, minor=False)
ax.set_xticks(np.arange(nba_sort.shape[1]) + 0.5, minor=False)

# want a more natural, table-like display
ax.invert_yaxis()
ax.xaxis.tick_top()

# Set the labels

# label source:https://en.wikipedia.org/wiki/Basketball_statistics
labels = [
    'Games', 'Minutes', 'Points', 'Field goals made', 'Field goal attempts', 'Field goal percentage', 'Free throws made', 'Free throws attempts', 'Free throws percentage',
    'Three-pointers made', 'Three-point attempt', 'Three-point percentage', 'Offensive rebounds', 'Defensive rebounds', 'Total rebounds', 'Assists', 'Steals', 'Blocks', 'Turnover', 'Personal foul']

# note I could have used nba_sort.columns but made "labels" instead
ax.set_xticklabels(labels, minor=False)
ax.set_yticklabels(nba_sort.index, minor=False)

# rotate the
plt.xticks(rotation=90)

ax.grid(False)

# Turn off all the ticks
ax = plt.gca()

for t in ax.xaxis.get_major_ticks():
    t.tick1On = False
    t.tick2On = False
for t in ax.yaxis.get_major_ticks():
    t.tick1On = False
    t.tick2On = False

ผลลัพธ์มีลักษณะดังนี้: แผนที่ความร้อน nba ที่ไหลเหมือนข้อมูล

มีโน๊ตบุ๊ค ipython กับทุกรหัสนี้เป็นที่นี่ ฉันได้เรียนรู้มากมายจาก 'ล้นดังนั้นหวังว่าจะมีคนพบว่าสิ่งนี้มีประโยชน์


1
รหัสด้านบนไม่ทำงานในโน้ตบุ๊ก iPythnon ฉันได้ทำการแก้ไขเล็กน้อยโดยเปลี่ยน nba_sort = nba_norm.sort ('PTS', ascending = True, inplace = True) เป็น nba_sort = nba_norm.copy () nba_sort.sort ('PTS', ascending = True, inplace = True) เนื่องจากการจัดเรียงทำงานโดยผลข้างเคียงไม่ใช่โดยการส่งคืนฟังก์ชัน! ขอบคุณสำหรับตัวอย่างคอนเรตที่ยอดเยี่ยม!
Yu Shen

1
อืม ... ดูเหมือนว่าคุณจะถูกต้อง ไม่แน่ใจว่าทั้งหมดนี้เกี่ยวกับอะไร ฉันจะแก้ไขรหัส ขอบคุณ!
BubbleGuppies

อะไรคือวิธีที่ง่ายที่สุดในการสร้างกราฟิกเช่นนี้ แต่แสดงค่าของสถิติในตาราง คือฉันต้องการสร้างแบบpcolorนี้ แต่มีค่าตัวเลขแสดงด้วย หรือ: ฉันต้องการสร้าง matplotlib tableที่เป็นสีของเซลล์ ฉันได้เห็นวิธีแก้ปัญหาอื่น ๆ แล้วและมันก็น่าเกลียดสวยงาม นี่ดูดีมากถ้าฉันรู้วิธีการซ้อนทับตัวเลข
8one6

ใช่. ฉันสะดุดในการตอบคำถามของคนอื่น: stackoverflow.com/a/21167108/2501018
8one6

@joelotz คุณยินดีที่จะสนับสนุนเวอร์ชัน (แก้ไข) นี้ให้กับเอกสาร matplotlib หรือไม่? ในกรณีนี้ให้เปิด PR หรือส่ง Ping ทางอีเมล (ดูโปรไฟล์ของฉัน)
tacaswell

12

โมดูล python seaborn ใช้ matplotlib และสร้างแผนที่ความร้อนที่ดีมาก

ด้านล่างนี้เป็นการใช้งานกับซีบอร์นที่ออกแบบมาสำหรับโน้ตบุ๊ก ipython / jupyter

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
# import the data directly into a pandas dataframe
nba = pd.read_csv("http://datasets.flowingdata.com/ppg2008.csv", index_col='Name  ')
# remove index title
nba.index.name = ""
# normalize data columns
nba_norm = (nba - nba.mean()) / (nba.max() - nba.min())
# relabel columns
labels = ['Games', 'Minutes', 'Points', 'Field goals made', 'Field goal attempts', 'Field goal percentage', 'Free throws made', 
          'Free throws attempts', 'Free throws percentage','Three-pointers made', 'Three-point attempt', 'Three-point percentage', 
          'Offensive rebounds', 'Defensive rebounds', 'Total rebounds', 'Assists', 'Steals', 'Blocks', 'Turnover', 'Personal foul']
nba_norm.columns = labels
# set appropriate font and dpi
sns.set(font_scale=1.2)
sns.set_style({"savefig.dpi": 100})
# plot it out
ax = sns.heatmap(nba_norm, cmap=plt.cm.Blues, linewidths=.1)
# set the x-axis labels on the top
ax.xaxis.tick_top()
# rotate the x-axis labels
plt.xticks(rotation=90)
# get figure (usually obtained via "fig,ax=plt.subplots()" with matplotlib)
fig = ax.get_figure()
# specify dimensions and save
fig.set_size_inches(15, 20)
fig.savefig("nba.png")

ผลลัพธ์มีลักษณะดังนี้: แผนที่ความร้อนซีบอร์นเอ็นบีเอ ฉันใช้แมปสี matplotlib Blues แต่โดยส่วนตัวพบว่าสีเริ่มต้นค่อนข้างสวยงาม ฉันใช้ matplotlib เพื่อหมุนป้ายชื่อแกน x เนื่องจากไม่พบไวยากรณ์ของทะเล ตามที่ระบุไว้โดย grexor จำเป็นต้องระบุขนาด (fig.set_size_inches) โดยการลองผิดลองถูกซึ่งฉันพบว่าค่อนข้างน่าหงุดหงิด

ตามที่ระบุไว้โดย Paul H คุณสามารถเพิ่มค่าลงในแผนที่ความร้อนได้อย่างง่ายดาย (หมายเหตุ = True) แต่ในกรณีนี้ฉันไม่คิดว่ามันจะปรับปรุงตัวเลข ข้อมูลโค้ดจำนวนมากถูกนำมาจากคำตอบที่ยอดเยี่ยมของ joelotz


11

ปัญหาหลักคือก่อนอื่นคุณต้องกำหนดตำแหน่งของขีด x และ y ของคุณก่อน นอกจากนี้ยังช่วยในการใช้อินเทอร์เฟซเชิงวัตถุมากขึ้นกับ matplotlib กล่าวคือโต้ตอบกับaxesวัตถุโดยตรง

import matplotlib.pyplot as plt
import numpy as np
column_labels = list('ABCD')
row_labels = list('WXYZ')
data = np.random.rand(4,4)
fig, ax = plt.subplots()
heatmap = ax.pcolor(data)

# put the major ticks at the middle of each cell, notice "reverse" use of dimension
ax.set_yticks(np.arange(data.shape[0])+0.5, minor=False)
ax.set_xticks(np.arange(data.shape[1])+0.5, minor=False)


ax.set_xticklabels(row_labels, minor=False)
ax.set_yticklabels(column_labels, minor=False)
plt.show()

หวังว่าจะช่วยได้


ขอบคุณ @Paul H ที่ทำงานได้อย่างสวยงาม ฉันใช้heatmap.axesทรัพย์สินซึ่งด้วยเหตุผลบางอย่างไม่ได้ทำอะไรเลย
Jason Sundram

คุณรู้วิธีย้ายป้ายชื่อแกน x ไปอยู่ด้านบนหรือไม่? ฉันพยายามอย่างชัดเจน แต่ax.xaxis.set_label_position('top')ไม่มีประโยชน์
Jason Sundram

@JasonSundram คุณควรเปิดคำถามใหม่สำหรับการย้ายตำแหน่งป้ายเพราะมันควรจะได้ผลและมันก็แปลกที่มันไม่ได้
tacaswell

1
@tcaswell จุดดี คำถามใหม่ที่นี่: stackoverflow.com/questions/14406214/…
Jason Sundram

1
@ Tgsmith61591 ฉันจะใช้ฟังก์ชั่นแผนที่ความร้อนของ seaborn การตั้งค่าannot=Trueเมื่อถูกเรียก ( stanford.edu/~mwaskom/software/seaborn/generated/… )
Paul H

3

มีคนแก้ไขคำถามนี้เพื่อลบรหัสที่ฉันใช้ฉันจึงถูกบังคับให้เพิ่มเป็นคำตอบ ขอบคุณทุกคนที่เข้าร่วมตอบคำถามนี้! ฉันคิดว่าคำตอบอื่น ๆ ส่วนใหญ่ดีกว่ารหัสนี้ฉันแค่ทิ้งไว้ที่นี่เพื่อจุดประสงค์ในการอ้างอิง

ด้วยความขอบคุณPaul Hและunutbu (ผู้ตอบคำถามนี้ ) ฉันมีผลลัพธ์ที่ดูดี:

import matplotlib.pyplot as plt
import numpy as np
column_labels = list('ABCD')
row_labels = list('WXYZ')
data = np.random.rand(4,4)
fig, ax = plt.subplots()
heatmap = ax.pcolor(data, cmap=plt.cm.Blues)

# put the major ticks at the middle of each cell
ax.set_xticks(np.arange(data.shape[0])+0.5, minor=False)
ax.set_yticks(np.arange(data.shape[1])+0.5, minor=False)

# want a more natural, table-like display
ax.invert_yaxis()
ax.xaxis.tick_top()

ax.set_xticklabels(row_labels, minor=False)
ax.set_yticklabels(column_labels, minor=False)
plt.show()

และนี่คือผลลัพธ์:

Matplotlib HeatMap

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.