คำถามติดแท็ก model-interpretation

1
การเปรียบเทียบระหว่าง SHAP (คำอธิบายเพิ่มเติมของแชปลีย์) และ LIME (คำอธิบายแบบจำลองผู้ไม่เชื่อเรื่องพระเจ้าแบบท้องถิ่น)
ฉันกำลังอ่านเทคนิคการตีความโมเดลโพสต์ hoc ที่เป็นที่นิยมสองวิธี: LIMEและSHAP ฉันมีปัญหาในการทำความเข้าใจความแตกต่างที่สำคัญในสองเทคนิคนี้ หากต้องการอ้างอิง Scott Lundbergสมองที่อยู่เบื้องหลัง SHAP: ค่า SHAP มาพร้อมกับข้อได้เปรียบในการประมาณกล่องดำของ LIME แต่มาพร้อมกับการรับประกันเชิงทฤษฎีเกี่ยวกับความสอดคล้องและความถูกต้องในท้องถิ่นจากทฤษฎีเกม (คุณลักษณะจากวิธีการอื่น ๆ ที่เรารวมเป็นหนึ่ง) ฉันกำลังมีปัญหาในการทำความเข้าใจว่า ' การรับประกันเชิงทฤษฎีเกี่ยวกับความสอดคล้องและความถูกต้องในท้องถิ่นจากทฤษฎีเกม ' คืออะไร เนื่องจาก SHAP ได้รับการพัฒนาหลังจาก LIME ฉันจึงคิดว่ามันเต็มไปด้วยช่องว่างที่ LIME ไม่สามารถจัดการได้ นู้นคืออะไร? หนังสือของ Christoph Molnar ในบทหนึ่งเกี่ยวกับ Shapley Estimation ฯ : ความแตกต่างระหว่างการทำนายและการคาดคะเนเฉลี่ยนั้นได้รับการกระจายอย่างเป็นธรรมในค่าคุณสมบัติของอินสแตนซ์ - คุณสมบัติประสิทธิภาพแชพลีย์ คุณสมบัตินี้ตั้งค่า Shapley นอกเหนือจากวิธีอื่นเช่น LIME LIME ไม่รับประกันว่าจะสามารถกระจายเอฟเฟกต์ได้อย่างสมบูรณ์แบบ มันอาจทำให้ค่าแชปลีย์เป็นวิธีเดียวที่จะส่งคำอธิบายแบบเต็ม การอ่านสิ่งนี้ฉันเข้าใจว่า SHAP …

4
ถ้าฉันต้องการโมเดลที่ตีความได้มีวิธีอื่นนอกเหนือจาก Linear Regression หรือไม่?
ฉันพบนักสถิติบางคนที่ไม่เคยใช้แบบจำลองอื่นนอกจากการถดถอยเชิงเส้นเพื่อการทำนายเพราะพวกเขาเชื่อว่า "โมเดล ML" เช่นฟอเรสต์แบบสุ่มหรือการเพิ่มระดับความลาดชันนั้นยากที่จะอธิบายหรือ "ไม่สามารถตีความได้" ในการถดถอยเชิงเส้นเนื่องจากชุดของสมมติฐานได้รับการตรวจสอบแล้ว (ความเป็นปกติของข้อผิดพลาด, homoskedasticity, ไม่มีหลาย collinearity), การทดสอบ t มีวิธีการทดสอบความสำคัญของตัวแปร, การทดสอบที่ความรู้ของฉันไม่สามารถใช้ได้ใน ฟอเรสต์แบบสุ่มหรือการส่งเสริมการไล่ระดับสี ดังนั้นคำถามของฉันคือถ้าฉันต้องการสร้างแบบจำลองตัวแปรตามด้วยชุดของตัวแปรอิสระเพื่อประโยชน์ในการตีความฉันควรใช้การถดถอยเชิงเส้นเสมอ?
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.