ข้อผิดพลาดการบวกหรือข้อผิดพลาดการคูณ?


13

ฉันค่อนข้างใหม่กับสถิติและขอขอบคุณที่ช่วยให้เข้าใจสิ่งนี้ดีขึ้น

ในสาขาของฉันมีรูปแบบที่ใช้กันทั่วไปของแบบฟอร์มคือ:

Pt=Po(Vt)α

เมื่อคนทำโมเดลให้พอดีกับข้อมูลพวกเขามักทำตัวเป็นเส้นตรงและพอดีกับสิ่งต่อไปนี้

log(Pt)=log(Po)+αlog(Vt)+ϵ

ตกลงไหม ฉันอ่านบางที่เพราะสัญญาณรบกวนในรูปแบบที่แท้จริงควรจะเป็น

Pt=Po(Vt)α+ϵ

และสิ่งนี้ไม่สามารถทำให้เป็นเชิงเส้นได้ตามที่กล่าวมา มันเป็นเรื่องจริงเหรอ? ถ้ามีใครรู้การอ้างอิงที่ฉันสามารถอ่านและเรียนรู้เพิ่มเติมเกี่ยวกับมันและอาจอ้างอิงในรายงาน?


ฉันจัดรูปแบบสมการของคุณ โปรดตรวจสอบว่าเนื้อหานั้นเป็นสิ่งที่คุณตั้งใจไว้หรือไม่ (โดยเฉพาะเกี่ยวกับตัวห้อย)
แอนดี้

คุณตั้งค่าสถานะคำถามของคุณด้วย "ข้อผิดพลาดในการวัด" และ + e ในสมการที่ 3 น่าจะเกิดจากข้อผิดพลาดในการวัดที่เพิ่มขึ้นนอกเหนือไปจากรูปแบบการสุ่มสุ่ม / การสุ่มในการตอบสนองเช่น P * (V ^ alpha) * ประสบการณ์ (จ) ถูกต้องหรือไม่ แบบจำลองข้อผิดพลาดการวัด (หรือที่รู้จักกันว่า "ข้อผิดพลาดในตัวแปร" รุ่น) มักจะต้องใช้กระบวนการสองขั้นตอนซึ่งในกรณีของคุณอาจต้องใช้ข้อมูลการตรวจสอบแยกต่างหากเพื่อระบุลักษณะข้อผิดพลาดเพิ่มเติมเนื่องจาก "สัญญาณรบกวน" ในกรณีนี้อาจไม่มี ต้องการสมการเชิงเส้นตรง
N Brouwer

คำตอบ:


14

รูปแบบใดที่เหมาะสมขึ้นอยู่กับความแปรปรวนของค่าเฉลี่ยที่ได้มาจากการสังเกตการณ์ มันอาจมาในรูปแบบทวีคูณหรือบวก ... หรือในทางอื่น

อาจมีหลายแหล่งที่มาของการเปลี่ยนแปลงนี้บางอย่างที่อาจเข้าสู่การคูณและบางอย่างที่เข้ามาบวกและบางอย่างในลักษณะที่ไม่สามารถโดดเด่นเป็นจริงเช่นกัน

บางครั้งมีทฤษฎีที่ชัดเจนในการสร้างที่เหมาะสม บางครั้งการไตร่ตรองแหล่งที่มาหลักของการเปลี่ยนแปลงเกี่ยวกับค่าเฉลี่ยจะเปิดเผยทางเลือกที่เหมาะสม บ่อยครั้งที่ผู้คนไม่มีความคิดที่ชัดเจนว่าจะใช้หรือถ้าแหล่งที่มาของความแตกต่างหลากหลายประเภทอาจจำเป็นต้องอธิบายกระบวนการอย่างเพียงพอ

ด้วยโมเดลการบันทึกเชิงเส้นซึ่งใช้การถดถอยเชิงเส้น:

log(Pt)=log(Po)+αlog(Vt)+ϵ

แบบจำลองการถดถอยของ OLS ถือว่าความแปรปรวนระดับมาตราส่วนคงที่และหากเป็นเช่นนั้นข้อมูลต้นฉบับจะแสดงการแพร่กระจายที่เพิ่มขึ้นเกี่ยวกับค่าเฉลี่ยเมื่อค่าเฉลี่ยเพิ่มขึ้น

ในทางกลับกันโมเดลประเภทนี้:

Pt=Po(Vt)α+ϵ

โดยทั่วไปแล้วจะถูกติดตั้งโดยกำลังสองน้อยที่สุดและอีกครั้งหากความแปรปรวนคงที่ (ค่าเริ่มต้นสำหรับ NLS) ได้รับการติดตั้งแล้วการแพร่กระจายเกี่ยวกับค่าเฉลี่ยควรเป็นค่าคงที่

ป้อนคำอธิบายรูปภาพที่นี่

[คุณอาจรู้สึกว่าการแพร่กระจายลดลงเมื่อค่าเฉลี่ยเพิ่มขึ้นในภาพสุดท้าย นั่นเป็นภาพลวงตาที่เกิดจากความลาดชันที่เพิ่มขึ้น - เรามักจะตัดสินการแพร่กระจายมุมฉากเป็นเส้นโค้งแทนที่จะเป็นแนวตั้งเพื่อให้เราได้รับความรู้สึกที่บิดเบี้ยว]

หากคุณมีสเปรดเกือบคงที่ทั้งในระดับดั้งเดิมและระดับสเกลนั้นอาจแนะนำว่าแบบจำลองสองแบบใดที่เหมาะสมไม่ใช่เพราะมันพิสูจน์ได้ว่ามันเป็นสารเติมแต่งหรือแบบคูณ แต่เพราะมันนำไปสู่คำอธิบายที่เหมาะสมของสเปรด ค่าเฉลี่ย

แน่นอนหนึ่งอาจมีความผิดพลาดของสารเติมแต่งที่มีความแปรปรวนไม่คงที่

อย่างไรก็ตามยังมีโมเดลอื่น ๆ ที่ยังสามารถปรับความสัมพันธ์ในการใช้งานดังกล่าวซึ่งมีความสัมพันธ์ที่แตกต่างกันระหว่างค่าเฉลี่ยและความแปรปรวน (เช่น Poisson หรือ quasi-Poisson GLM ซึ่งแพร่กระจายไปตามสัดส่วนรากที่สองของค่าเฉลี่ย)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.