วัตถุประสงค์หลักของการถดถอยเชิงเส้นคือการประมาณความแตกต่างของค่าเฉลี่ยของผลลัพธ์เปรียบเทียบระดับที่อยู่ติดกันของ regressor มีวิธีการหลายประเภท เราคุ้นเคยกับค่าเฉลี่ยเลขคณิตมากที่สุด
AM(X)=(X1+X2+…+Xn)n
AM คือสิ่งที่คาดการณ์ไว้โดยใช้ OLS และตัวแปรที่ไม่แปลงรูป ค่าเฉลี่ยเรขาคณิตแตกต่างกัน:
GM(X)=(X1×X2×…×Xn)−−−−−−−−−−−−−−−−−√n=exp(AM(log(X))
ความแตกต่างของ GM เป็นความแตกต่างแบบทวีคูณ: คุณจ่าย X% ของดอกเบี้ยพิเศษเมื่อสมมติว่าเงินกู้ระดับฮีโมโกลบินของคุณลดลง X% หลังจากเริ่มเมตฟอร์มินอัตราความล้มเหลวของสปริงจะเพิ่มขึ้น X% ในทุกกรณีเหล่านี้ความแตกต่างของค่าเฉลี่ยจะสมเหตุสมผลน้อยกว่า
บันทึกการเปลี่ยนแปลงประมาณการความแตกต่างค่าเฉลี่ยเรขาคณิต หากคุณเข้าสู่ระบบเปลี่ยนผลและรูปแบบไว้ในการถดถอยเชิงเส้นโดยใช้สเปคสูตรต่อไปนี้: log(y) ~ x
ค่าสัมประสิทธิ์ความแตกต่างค่าเฉลี่ยของผลบันทึกการเปรียบเทียบหน่วยที่อยู่ติดกันของXสิ่งนี้ไม่มีประโยชน์จริงเราจึงยกกำลังพารามิเตอร์และตีความค่านี้เป็นความแตกต่างของค่าเฉลี่ยเรขาคณิต X e β 1β1Xeβ1
ยกตัวอย่างเช่นในการศึกษาของปริมาณไวรัสเอชไอวีต่อไปนี้การบริหารงาน 10 สัปดาห์ของศิลปะเราอาจประเมินค่าเฉลี่ยเรขาคณิต prepost ของ0.40 นั่นหมายความว่าอะไรก็ตามที่โหลดไวรัสอยู่ที่ระดับพื้นฐานมันลดลงโดยเฉลี่ย60%หรือลดลง 0.6 เท่าเมื่อติดตามผล หากโหลดเท่ากับ 10,000 ที่พื้นฐานโมเดลของฉันจะทำนายว่าจะเป็น 4,000 ในการติดตามถ้าเป็น 1,000 ที่พื้นฐานโมเดลของฉันจะทำนายว่าจะเป็น 400 ในการติดตามผล (ความแตกต่างเล็กน้อยในระดับดิบ แต่ สัดส่วนเดียวกัน)eβ1=0.40
นี่คือความแตกต่างที่สำคัญจากคำตอบอื่น ๆ : แบบแผนของการคูณสัมประสิทธิ์การบันทึกโดย 100 มาจากการประมาณเมื่อมีขนาดเล็ก ถ้าค่าสัมประสิทธิ์ (โยล็อก) เป็น 0.05 พูดแล้วและการตีความคือ 5% "เพิ่มขึ้น" ในผลสำหรับ 1 หน่วย "เพิ่มขึ้น" ในXแต่ถ้าค่าสัมประสิทธิ์คือ 0.5 แล้วและเราแปลความหมายนี้เป็น 65% "เพิ่มขึ้น" ใน สำหรับ 1 หน่วย "เพิ่มขึ้น" ในXมันไม่ได้เพิ่มขึ้น 50%X exp ( 0.05 ) ≈ 1.05 X exp ( 0.5 ) = 1.65 Y Xlog(x)≈1−xXexp(0.05)≈1.05Xexp(0.5)=1.65YX
y ~ log(x, base=2)
สมมติว่าเราเข้าสู่ระบบเปลี่ยนทำนาย: ที่นี่ฉันสนใจในการเปลี่ยนแปลงแบบทวีคูณในมากกว่าผลต่างดิบ ตอนนี้ผมกำลังสนใจในการเข้าร่วมการเปรียบเทียบที่แตกต่างกัน 2 เท่าในXตัวอย่างเช่นฉันสนใจที่จะวัดการติดเชื้อ (ใช่ / ไม่ใช่) หลังจากได้รับเชื้อที่มาจากเลือดที่ความเข้มข้นต่าง ๆ โดยใช้แบบจำลองความเสี่ยงเพิ่มเติม แบบจำลองทางชีวภาพอาจแนะนำว่าความเสี่ยงเพิ่มขึ้นทุกสัดส่วนของความเข้มข้นเป็นสองเท่า จากนั้นฉันจะไม่เปลี่ยนผลลัพธ์ของฉัน แต่ค่าสัมประสิทธิ์ประมาณถูกตีความว่าเป็นความแตกต่างของความเสี่ยงเมื่อเปรียบเทียบกลุ่มที่สัมผัสกับความแตกต่างความเข้มข้นสองเท่าของวัสดุติดเชื้อX β 1xXβ1
ประการสุดท้ายเป็นการlog(y) ~ log(x)
ใช้คำจำกัดความทั้งสองอย่างเพื่อให้ได้ความแตกต่างแบบหลายกลุ่มเปรียบเทียบกับกลุ่มที่แตกต่างกันหลายระดับในระดับแสง