เมื่อใดจึงควรใช้ Deming regression


9

ฉันกำลังทำงานเกี่ยวกับวิธีการแปลงค่าการทดสอบฟอสฟอรัสที่แตกต่างกันสองค่าให้กัน

พื้นหลัง

มีหลายวิธีในการวัดฟอสฟอรัสที่มีอยู่ในดิน ประเทศที่แตกต่างกันใช้วิธีการที่แตกต่างกันดังนั้นเพื่อเปรียบเทียบความอุดมสมบูรณ์ของ P ทั่วประเทศมีความจำเป็นต้องคำนวณค่าการทดสอบ P x ตามค่า P-test y และในทางกลับกัน ดังนั้นการตอบสนองและความแปรปรวนร่วมสามารถเปลี่ยนได้

ปริมาณ P ในสารสกัด 1 = P_CAL ใน [mg / 100 กรัมดิน]

P จำนวนในสารสกัด 2 = P_DL ใน [mg / 100 กรัมดิน]

เพื่อสร้าง "สมการการเปลี่ยนแปลง" ดังกล่าวเนื้อหา P ของตัวอย่างดิน 136 ตัวอย่างถูกวิเคราะห์ด้วยสารสกัดจาก CAL และ DL วัดพารามิเตอร์เพิ่มเติมเช่น pH ดินคาร์บอนอินทรีย์รวมไนโตรเจนทั้งหมดดินและคาร์บอเนต วัตถุประสงค์คือเพื่อให้ได้แบบจำลองการถดถอยอย่างง่าย ในขั้นตอนที่สองยังมีหลายรุ่น

เพื่อให้ภาพรวมของข้อมูลที่ฉันแสดงให้คุณเห็นสอง scatterplots กับเส้นการถดถอยเชิงเส้น (OLS) ง่าย ๆ a) การถดถอย OLS แบบง่ายสำหรับ CAL-P ~ DL-P, b) การถดถอย OLS แบบง่ายสำหรับ DL-P ~ CAL-P

คำถาม:

เพื่อความเข้าใจของฉัน deming regression นั้นเหมาะสมถ้า respone (y) และ explanatory (x) ตัวแปรทั้งคู่มีข้อผิดพลาด (การวัด) และสามารถใช้แทนกันได้ การถดถอย Deming ถือว่าอัตราส่วนความแปรปรวนเป็นที่รู้จัก เนื่องจากฉันไม่มีรายละเอียดเกี่ยวกับความแม่นยำของการวัดการแยก P จึงมีวิธีอื่นในการกำหนดอัตราส่วนความแปรปรวนได้หรือไม่ ความแปรปรวนใดมีความหมายที่นี่ ฉันคิดว่ามันไม่ได้ถูกคำนวณvar(DL_P)/var(CAL_P)หรือ?

Q1: ฉันจะกำหนดอัตราส่วนความแปรปรวนสำหรับการถดถอยแบบ deming ได้อย่างไร

กรณีพิเศษของการถดถอย deming คือการถดถอยแบบฉาก มันถือว่าอัตราส่วนความแปรปรวน = 1

Q2: มีวิธีในการวินิจฉัยว่าข้อสันนิษฐานδ = 1 นั้นถูกต้องหรือไม่หรือถ้าสมมติฐาน (false) มีข้อผิดพลาดในการทำนายสูง

ถ้าฉันสมมติว่าδ = 1 การถดถอยแบบฉากจะให้ผลลัพธ์ (ปัดเศษ) ต่อไปนี้

library(MethComp) deming <- Deming(y=P_CAL, x=P_DL, vr=1)

สกัดกั้น: 0.75; ความชัน: 0.71; sigma P_DL: 3.17; sigma P_CAL: 3.17

การพล็อตบรรทัดการถดถอย deming ในแปลงด้านบนแสดงให้เห็นว่าการถดถอย deming นั้นอยู่ใกล้กับ a) CAL-P = f (DL-P) การถดถอย แต่แตกต่างจาก b) DL-P = f (CAL-P) มาก สมการ ป้อนคำอธิบายรูปภาพที่นี่

Q3: ถูกต้องหรือไม่ว่าในการถดถอยมุมฉาก CAL-P = f (DL-P) และ DL-P = f (CAL-P) แสดงด้วยสมการเดียวกันหรือไม่ ถ้าไม่ฉันจะหาสมการที่ถูกต้องสำหรับทั้งสองได้อย่างไร ฉันคิดถึงอะไรที่นี่

เนื่องจากคุณสมบัติของทั้งสองวิธีการสกัดค่า DL-P มีแนวโน้มที่จะสูงกว่าค่า CAL-P ประมาณ 25% ดังนั้น CAL-P = f (DL-P) จึงควรมีความชันสูงกว่า DL-P = f (CAL -P) อย่างไรก็ตามสิ่งนี้ไม่ได้แสดงในการถดถอยของเดมิงเมื่อมีเพียงความชันเดียว ซึ่งทำให้ฉันมีคำถามสุดท้ายของฉัน

Q4: deming regression เป็นแนวทางที่ถูกต้องสำหรับวัตถุประสงค์ของฉันหรือไม่


1
อัตราส่วนของความเบี่ยงเบนมาตรฐานสองค่าจะถูกนำมาใช้ในการถดถอยแบบ Deming เพื่อตัดสินใจว่าจะวางแนวตั้งฉากกับเส้นตรงได้อย่างไร หากอัตราส่วนคือ 1 ความแปรปรวนจะถือว่าเท่ากันและระยะทางวัดจากมุม 45 องศา คุณไม่สามารถกำหนดอัตราส่วนนี้จากข้อมูลได้
Michael R. Chernick

คำตอบ:


2

ในการจัดการกับข้อกังวลของคุณที่นี่: การถดถอย Deming ดูเหมือนจะเสนอแบบไม่ดีในแผงควบคุม B แต่เป็นเพราะพล็อตไม่ถูกต้อง วิธีที่รวดเร็วในการประเมินว่าสิ่งนี้ทำอย่างถูกต้องหรือไม่คือการดูค่า X & Y ตามเส้นการถดถอย Deming สำหรับค่า DL-P ใด ๆ ในพาเนล A ควรมีค่า calressponding CAL-P ที่เหมือนกันในพาเนลทั้งสอง (ไม่เป็นจริงสำหรับ OLS และความแตกต่างพื้นฐานระหว่างพวกเขา) แต่ในแปลงเหล่านี้โดยที่ DL-P = 20, CAL-P ในแผง A คือ ~ 15 และในแผง B ~ 27

ข้อผิดพลาดน่าจะเป็นที่ว่าเส้นการถดถอย Deming ถูกวาดขึ้นโดยเพียงแค่เปลี่ยนเงื่อนไขของ CAL-P และ DL-P ในสมการ สมการสำหรับพาเนล A คือ:

CAL-P = 0.75 + 0.71 * DL-P

การจัดเรียงใหม่นี่หมายความว่าสมการสำหรับพาเนล B ควรเป็น:

DL-P = (CAL-P - 0.75) / 0.71

และไม่:

DL-P = 0.75 + 0.71 * CAL-P (ซึ่งเป็นสิ่งที่ได้วางแผนไว้)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.