คุณสามารถสังเกตความสัมพันธ์ระหว่างฟีเจอร์ต่างๆได้โดยการวาดแผนที่ความร้อนจากทะเลหรือแมทริกซ์กระจายจากนุ่น
เมทริกซ์กระจาย:
pd.scatter_matrix(dataframe, alpha = 0.3, figsize = (14,8), diagonal = 'kde');
หากคุณต้องการเห็นภาพความเบ้ของแต่ละสถานที่ให้ใช้คู่ซีบรูน
sns.pairplot(dataframe)
Sns Heatmap:
import seaborn as sns
f, ax = pl.subplots(figsize=(10, 8))
corr = dataframe.corr()
sns.heatmap(corr, mask=np.zeros_like(corr, dtype=np.bool), cmap=sns.diverging_palette(220, 10, as_cmap=True),
square=True, ax=ax)
ผลลัพธ์จะเป็นแผนที่ความสัมพันธ์ของคุณสมบัติ ie ดูตัวอย่างด้านล่าง
ความสัมพันธ์ระหว่างร้านขายของชำและผงซักฟอกอยู่ในระดับสูง ในทำนองเดียวกัน:
Pdoducts ที่มีสหสัมพันธ์สูง:
- ร้านขายของชำและผงซักฟอก
ผลิตภัณฑ์ที่มีสหสัมพันธ์ปานกลาง:
- นมและร้านขายของชำ
- นมและผงซักฟอก _ กระดาษ
ผลิตภัณฑ์ที่มีสหสัมพันธ์ต่ำ:
- นมและอาหารสำเร็จรูป
- แช่แข็งและสด
- แช่แข็งและอาหารสำเร็จรูป
จาก Pairplots: คุณสามารถสังเกตความสัมพันธ์ชุดเดียวกันจาก pairplots หรือเมทริกซ์กระจาย แต่จากสิ่งเหล่านี้เราสามารถพูดได้ว่าข้อมูลถูกกระจายตามปกติหรือไม่
หมายเหตุ: กราฟข้างต้นเป็นกราฟเดียวกันที่นำมาจากข้อมูลซึ่งใช้ในการวาดแผนที่ความร้อน