วิธีการอธิบายหรือมองเห็นโมเดลการถดถอยเชิงเส้นหลายแบบ


21

ฉันกำลังพยายามปรับโมเดลการถดถอยเชิงเส้นหลายแบบให้สอดคล้องกับข้อมูลของฉันด้วยพารามิเตอร์อินพุตสองสามตัวบอกว่า 3

(i)F(x)=Ax1+Bx2+Cx3+dor(ii)F(x)=(A B C)T(x1 x2 x3)+d

ฉันจะอธิบายและทำให้โมเดลนี้เป็นจริงได้อย่างไร ฉันนึกถึงตัวเลือกต่อไปนี้:

  1. พูดถึงสมการการถดถอยตามที่อธิบายไว้ใน (ค่าสัมประสิทธิ์ค่าคงที่) พร้อมกับส่วนเบี่ยงเบนมาตรฐานแล้วพล็อตข้อผิดพลาดที่เหลือเพื่อแสดงความแม่นยำของแบบจำลองนี้ (i)

  2. แปลงคู่ของตัวแปรอิสระและตัวแปรตามเช่น:

    ป้อนคำอธิบายรูปภาพที่นี่

  3. เมื่อทราบค่าสัมประสิทธิ์แล้วจุดข้อมูลที่ใช้ในการรับสมการจะถูกรวมเข้ากับค่าจริงของพวกเขา นั่นคือข้อมูลการฝึกอบรมมีค่าใหม่ในรูปแบบแทน , , ,โดยที่ตัวแปรอิสระแต่ละตัวจะถูกคูณด้วยสัมประสิทธิ์ตามลำดับ ดังนั้นเวอร์ชันที่เรียบง่ายนี้สามารถแสดงให้เห็นได้ว่าเป็นการถดถอยอย่างง่ายดังนี้:x x 1 x 2 x 3 ...(i)xx1x2x3

    ป้อนคำอธิบายรูปภาพที่นี่

ฉันสับสนในเรื่องนี้แม้จะผ่านเนื้อหาที่เหมาะสมในหัวข้อนี้ บางคนได้โปรดอธิบายให้ฉันฟังถึงวิธีการ "อธิบาย" โมเดลการถดถอยเชิงเส้นหลายแบบพร้อมกันและวิธีการแสดงให้เห็นด้วยสายตา


2
เอกสารของคุณมีวัตถุประสงค์อะไรและใครคือผู้ชม ฉันจะเริ่มต้นจากการได้รับบทความที่คล้ายกันและค้นหาตัวอย่างเกี่ยวกับวิธีการที่พวกเขาทำในสาขาของคุณเอง ฉันคุ้นเคยกับวรรณคดีชีวการแพทย์และส่วนใหญ่เราใช้ตาราง ภาพประกอบจะเห็นบ่อยขึ้นเมื่อผู้เขียนพยายามอธิบายการโต้ตอบ
Penguin_Knight

@Penguin_Knight นี่เป็นโดเมนวิทยาศาสตร์คอมพิวเตอร์ แต่ฉันคิดว่านี่เป็นชื่อสามัญแทนที่จะ จำกัด เฉพาะบางโดเมน โปรดแก้ไขฉันหากฉันผิด
kris

อืม ... แต่คำถาม ฉันว่าส่วนทั่วไปเพียงอย่างเดียวสำหรับฉันไม่ได้แสดงเกินกว่าที่ควรและให้แน่ใจว่าส่วนประกอบที่จะถูกเน้นย้ำจริงๆได้รับการเน้น แม้จะอยู่ในสาขาของฉันฉันได้เห็นตัวเลือกทั้งสาม 1) การทำเป็นตารางผลลัพธ์เป็นเรื่องธรรมดามากที่สุดรองลงมาคือ 3) แต่ส่วนใหญ่เป็นรูปแบบของการวางแผนการคาดการณ์ผลลัพธ์และจากนั้น 2) แต่สำหรับ 2) ฉันจะใช้สิ่งที่ @gregory_britten แนะนำ: ใช้ X ที่ปรับแล้วแทน X แต่ละตัว
Penguin_Knight

ใช้พล็อตการกระจาย .... ดูที่การกระจายของค่าที่ติดตั้งซึ่งเป็นผลมาจากแบบจำลองและเปรียบเทียบกับการกระจายของค่าจริง
owais qureshi

ฉันรู้ว่านี่เป็นเมื่อหลายปีก่อน แต่ถ้าคุณกลับมาที่นี่คุณช่วยโพสต์ข้อมูลได้ไหม จากนั้นผู้คนจะมีบางสิ่งที่จะทำงานด้วยเพื่อแสดงความเป็นไปได้ที่แตกต่างกัน
gung - Reinstate Monica

คำตอบ:


21

XΔY/Δsd(X). ด้วยวิธีนี้ระยะทางสัมประสิทธิ์มาจากศูนย์จัดอันดับ 'ความสำคัญ' ญาติของพวกเขาและ CI ของพวกเขาให้ความแม่นยำ ฉันคิดว่ามันสรุปความสัมพันธ์ค่อนข้างดีและให้ข้อมูลมากกว่าค่าสัมประสิทธิ์และค่า p.values ​​ตามธรรมชาติของพวกเขา ตัวอย่างด้านล่าง:

ป้อนคำอธิบายรูปภาพที่นี่

YXiYX1+X2+X3XiYavPlots()carlm

ป้อนคำอธิบายรูปภาพที่นี่


ขอบคุณ @gregory_britten สำหรับข้อมูลนี้ ปัญหาที่ฉันมีอยู่มี 8 ตัวแปรอิสระ คุณคิดว่า 'แผนการเพิ่มตัวแปร' จะสมเหตุสมผลสำหรับตัวแปรอินพุทจำนวนมากหรือไม่?
kris

สอดคล้องกับแนวคิดของพล็อตแรกถ้าทำงานใน R ฉันขอแนะนำให้ดูแพ็คเกจ RMS ซึ่งทำให้ง่ายทั้งหมดนี้ สิ่งที่ดีคือเราสามารถขอเปลี่ยนแปลงขั้นตอนที่มีความหมายในความแปรปรวนร่วมได้ดังนั้นจึงไม่จำเป็นต้องสร้างมาตรฐาน
Thomas Speidel

@Suzanne ใช่แน่นอน พล็อตตัวแปรที่เพิ่มเข้ามาช่วยให้คุณมีมุมมองสองมิติสำหรับตัวแปรจำนวนเท่าใดก็ได้ มันอาจจะเปิดเผยโดยเฉพาะอย่างยิ่งในมิติที่สูงขึ้น เรามักจะพบรูปแบบการเปิดเผยในส่วนที่เหลือซึ่งไม่ชัดเจนเลยในการสังเกต Y
gregory_britten

ฉันไม่เข้าใจสัญกรณ์ X1 | X2 & X3 ในบริบทนี้ฉันรู้ว่ามันถูกนำมาใช้ในด้านความน่าจะเป็นอย่างไร แต่ฉันไม่สามารถเข้าใจสิ่งที่มันพูดที่นี่
Casebash

1
@Casebash มันคือการถดถอยบางส่วนใน X1 ที่ได้รับ X2 และ X3 อยู่ในรูปแบบ
gregory_britten

1

เนื่องจากพวกเขาทุกคนเกี่ยวข้องกับการอธิบายผู้ร่วมให้ข้อมูลสำหรับโรคตับแข็งคุณลองทำแผนภูมิฟอง / วงกลมแล้วใช้สีเพื่อระบุ regressors และรัศมีวงกลมที่แตกต่างกันเพื่อบ่งบอกถึงผลกระทบที่สัมพันธ์กับโรคตับแข็งหรือไม่?

ฉันหมายถึงประเภทแผนภูมิ Google ที่มีลักษณะเช่นนี้:ป้อนคำอธิบายรูปภาพที่นี่

และในบันทึกที่ไม่เกี่ยวข้องยกเว้นว่าฉันอ่านแผนการของคุณผิดฉันคิดว่าคุณมีผู้ลงทะเบียนซ้ำซ้อนบางคนอยู่ในนั้น ไวน์เป็นเหล้าอยู่แล้วดังนั้นหากทั้งสองแยกจากกันมันไม่สมเหตุสมผลที่จะเก็บทั้งสองอย่างไว้ถ้าเป้าหมายของคุณคืออธิบายอุบัติการณ์ของโรคตับแข็ง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.