ชี้แจงเกี่ยวกับการอ่านคำย่อ


10

ต่อไปนี้เป็น Nomogram ที่สร้างขึ้นจากชุดข้อมูล mtcars พร้อมแพ็กเกจ rms สำหรับสูตร:

mpg ~ wt + am + qsec

ป้อนคำอธิบายรูปภาพที่นี่

ตัวแบบนั้นดูดีด้วย R2 ที่ 0.85 และ P <0.00001

> mod

Linear Regression Model

ols(formula = mpg ~ wt + am + qsec, data = mtcars)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       32    LR chi2     60.64    R2       0.850    
sigma 2.4588    d.f.            3    R2 adj   0.834    
d.f.      28    Pr(> chi2) 0.0000    g        6.456    

Residuals

    Min      1Q  Median      3Q     Max 
-3.4811 -1.5555 -0.7257  1.4110  4.6610 

          Coef    S.E.   t     Pr(>|t|)
Intercept  9.6178 6.9596  1.38 0.1779  
wt        -3.9165 0.7112 -5.51 <0.0001 
am         2.9358 1.4109  2.08 0.0467  
qsec       1.2259 0.2887  4.25 0.0002  

ฉันไม่ชัดเจนว่า 'คะแนน', 'คะแนนรวม' และ 'ตัวทำนายเชิงเส้น' เหล่านี้คืออะไร อันไหนที่แสดงถึง mpg, ตัวแปรผลลัพธ์? ฉันจะขอบคุณคำอธิบายใด ๆ

แก้ไข: พิจารณาข้อเสนอแนะที่ยอดเยี่ยมโดย @Glen_b เพื่อให้ง่ายต่อการอ่านคะแนน ฯลฯ ต่อไปนี้อาจเป็นชื่อย่อทางเลือก:

ป้อนคำอธิบายรูปภาพที่นี่

เนื่องจากมีผลลัพธ์หรือตัวแปรตอบกลับที่พร้อมใช้งานจึงสามารถใช้แทนคำว่า 'ตัวทำนายเชิงเส้น' นอกจากนี้ยังอธิบายตนเองได้ว่าต้องการให้อ่านโนโมแกรมอย่างไร


แผนภาพที่ดีในการแก้ไขที่นั่น
Glen_b -Reinstate Monica

คำตอบ:


11

ทีนี้, เนื่องจากแบบจำลองของคุณเป็นแบบเส้นตรง, ด้วย mpg ที่คาดหวังเท่ากับตัวทำนายเชิงเส้น, คุณสามารถอ่าน mpg ได้โดยตรงจากสเกลของตัวทำนายเชิงเส้น

สำหรับตัวแปรแต่ละตัวคุณจะพบค่าของมันในระดับที่เกี่ยวข้อง ตัวอย่างเช่นสมมติว่าเราต้องการค้นหา mpg ที่คาดการณ์ไว้สำหรับรถยนต์ด้วยwt=4, am=1, qsec=18:

ป้อนคำอธิบายรูปภาพที่นี่

ซึ่งให้ MPG ที่คาดการณ์ไว้ประมาณ 18.94 การแทนที่สมการจะให้ 18.95 ดังนั้นมันจึงค่อนข้างใกล้ (ในทางปฏิบัติคุณอาจทำงานให้ถึงจุดที่ใกล้ที่สุดเท่านั้นและเพื่อให้ได้ความแม่นยำของรูปที่ 2 - "19 mpg" - ออกมากกว่าตัวเลข 3-4 เช่นที่นี่)

หนึ่งในประโยชน์หลักของแผนภาพดังกล่าวในใจของฉันคือคุณจะเห็นผลทันทีของการเปลี่ยนแปลงในตัวแปรทำนาย (IV) ที่แตกต่างกันในการตอบสนอง (DV) แม้ว่าคุณไม่ต้องการไดอะแกรมสำหรับการคำนวณใด ๆ แต่ก็สามารถสร้างมูลค่าที่ยอดเยี่ยมในแง่ของการแสดงผลกระทบสัมพัทธ์ของตัวแปร


คำถามติดตามจากความคิดเห็น:

มันทำงานในลักษณะเดียวกันกับการถดถอยแบบไม่เป็นเชิงเส้นหรือพหุนาม

สำหรับกรณีที่ไม่เชิงเส้นในตัวทำนายบางตัวจำเป็นต้องมีการปรับเปลี่ยนเล็กน้อยและชัดเจน ลองจินตนาการว่าเรามีE(Y)Y^=0+x1+(x2)

ที่ใด:

(a)เป็นแบบ monotonic หรือ

(ข)คือไม่ต่อเนื่อง

ไม่ว่าในกรณีใดขนาดของจะทำงานได้เหมือนกัน แต่ในกรณี:x1

(a) สเกลสำหรับจะไม่เป็นแบบเชิงเส้น เช่นถ้าเป็น monotonic ลดลง แต่กำลังสอง (ประมาณ) คุณอาจมีบางสิ่งเช่นนี้:x2

ป้อนคำอธิบายรูปภาพที่นี่

(b) มาตราส่วนที่ไม่ใช่โมโนโพนิสำหรับจะ "แตก" ที่จุดเปลี่ยนและพลิกกลับ เช่นx2

ป้อนคำอธิบายรูปภาพที่นี่

- ที่นี่ฟังก์ชั่นมีค่าต่ำสุดประมาณ(x)x=2.23

เป็นไปได้สำหรับฟังก์ชั่นดังกล่าวที่จะมีจุดเปลี่ยนหลายจุดซึ่งเครื่องชั่งจะแตกและพลิกหลาย ๆ ครั้ง - แต่เส้นแกนมีเพียงสองด้านเท่านั้น

ด้วย Nomograms แบบแต้มแบบนี้ทำให้ไม่ยุ่งยากเนื่องจากอาจขยับส่วนสเกลเพิ่มเติมขึ้นหรือลง (หรือมากกว่าโดยทั่วไปตั้งฉากกับทิศทางของแกน) เล็กน้อยจนกว่าจะไม่มีการเหลื่อมซ้อนกัน

(จุดเปลี่ยนมากกว่าหนึ่งจุดอาจเป็นปัญหาสำหรับ Nomograms ประเภทการจัดแนววิธีแก้ปัญหาหนึ่งที่แสดงในหนังสือของ Harrell คือการชดเชยระดับทั้งหมดจากบรรทัดอ้างอิงเล็กน้อยซึ่งตำแหน่งของค่านั้นถูกนำมาใช้จริง)


Y

ตัวอย่างของทุกสถานการณ์เหล่านี้สามารถพบได้ใน Harrell ของกลยุทธ์การสร้างแบบจำลองการถดถอย



เพียงแค่บันทึกสองด้าน

  1. ฉันอยากเห็นเครื่องชั่งสองจุดที่ด้านบนและด้านล่างของส่วนที่เกี่ยวข้อง ไม่อย่างนั้นมันยากที่จะ "จัดเรียง" อย่างแม่นยำเพราะคุณต้องเดาว่า 'แนวตั้ง' คืออะไร บางสิ่งเช่นนี้

    ป้อนคำอธิบายรูปภาพที่นี่

    อย่างไรก็ตามตามที่ฉันบันทึกไว้ในข้อคิดเห็นสำหรับส่วนสุดท้ายของไดอะแกรม (คะแนนรวมและตัวทำนายเชิงเส้น) อาจเป็นทางเลือกที่ดีกว่าในระดับคะแนนที่สองคือเพียงแค่มีสเกลคู่จากด้านหลังถึงด้านหลัง ด้านข้าง, ตัวทำนายเชิงเส้นที่อีกด้าน), เช่นนี้:

    ป้อนคำอธิบายรูปภาพที่นี่

    ดังนั้นเราจึงไม่จำเป็นต้องรู้ว่า 'แนวตั้ง' คืออะไร

  2. มีเพียงสองทำนายอย่างต่อเนื่องและเป็นปัจจัยไบนารีเดียวเราสามารถค่อนข้างพร้อมสร้างแบบดั้งเดิมมากขึ้นnomogram จัดตำแหน่ง :

    ป้อนคำอธิบายรูปภาพที่นี่

    ในกรณีนี้คุณเพียงแค่ค้นหาwtและqsecค่าในระดับของพวกเขาและเข้าร่วมกับสาย; ที่พวกเขาข้ามmpgแกนเราอ่านออกค่า (ในขณะที่amกำหนดตัวแปรที่ด้านข้างของmpgแกนคุณอ่าน) ในกรณีที่เรียบง่ายเช่นนี้ Nomograms ประเภทนี้จะใช้งานได้เร็วขึ้นและง่ายขึ้น แต่อาจไม่ง่ายที่จะพูดคุยกับผู้ทำนายหลายคน โนโมแกรมแบบจุดในคำถามของคุณ (ตามที่ใช้ในกลยุทธ์การสร้างแบบจำลองการถดถอยและในrmsแพ็คเกจใน R) สามารถเพิ่มตัวแปรเพิ่มเติมได้อย่างราบรื่น นี่อาจเป็นประโยชน์เมื่อต้องรับมือกับการโต้ตอบ


ขอบคุณสำหรับคำอธิบายที่ชัดเจนและมีภาพประกอบ มันทำงานในลักษณะเดียวกันกับการถดถอยแบบไม่เป็นเชิงเส้นหรือพหุนาม
rnso

1
ฉันได้แก้ไขคำตอบของฉันเพื่อตอบคำถามเพิ่มเติมนี้
Glen_b -Reinstate Monica

2
นี่คือเกลนโพสต์ที่น่าตื่นตาตื่นใจ ฉันคิดว่าฉันจะแก้ไขวิธีการnomogramของฟังก์ชั่นplotเพื่อเพิ่มPointsสเกลพิเศษตามค่าเริ่มต้น คำแนะนำยอดเยี่ยม !!
Frank Harrell

1
@ FrankHarrell ไม่เพราะคุณไม่ได้อ่านความสัมพันธ์ระหว่างคะแนนและคะแนนรวม - พวกเขาไม่จำเป็นต้องอยู่ในหน้าเดียวกัน ปัญหาคือการค้นหา 'แนวตั้ง' เพื่อให้คุณสามารถอ่านจากคะแนนรวมถึงตัวทำนายเชิงเส้นอย่างแม่นยำ หากเครื่องชั่งทั้งสองตัวอยู่ใกล้หรือสัมผัสมากกว่าพูดห่างกันสองนิ้วก็ไม่ใช่ปัญหา เมื่อแยกออกเป็นนิ้วข้อผิดพลาดเล็กน้อยในการค้นหาแนวตั้งอาจหมายถึงข้อผิดพลาดเล็กน้อยในผลลัพธ์ คุณยังคงต้องการสเกลสองจุดในส่วนแรกเนื่องจากคุณสามารถมีตัวทำนายจำนวนมากและไม่สามารถอยู่ติดกับมาตราส่วนคะแนนได้
Glen_b -Reinstate Monica

1
@ FrankHarrell โดยส่วนตัวฉันคิดว่ากริดตัดการแสดงผลและมีแนวโน้มที่จะบดบังคุณค่า ฉันหลีกเลี่ยงกริดเมื่อฉันสามารถ พวกเขายังไม่อนุญาตให้มีความแม่นยำในระดับเดียวกันในการรับแนวตั้งเว้นแต่ว่าตารางจะดีเท่ากับสเกล (ซึ่งฉันคิดว่าจะแย่มากต่อการมองเห็น) โดยไม่มีตัวเลือกสำหรับฉันจะจบการแก้ไขในระดับคะแนนที่สอง (เช่นเดียวกับที่ฉันทำที่นี่) เพื่อให้มันอยู่ในสิ่งที่ฉันเห็นว่าเป็นสถานะที่ใช้งานได้สำหรับวัตถุประสงค์ทั้งสองที่ฉันเห็นว่ามันมี (i. ทำการประมาณค่าที่ถูกต้องอย่างสมเหตุสมผลโดยประมาณ เพื่อตอบสนอง) ..
Glen_b
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.