คำนวณความไม่แน่นอนของความชันการถดถอยเชิงเส้นตามความไม่แน่นอนของข้อมูล


12

วิธีการคำนวณความไม่แน่นอนของความชันการถดถอยเชิงเส้นตามความไม่แน่นอนของข้อมูล (อาจเป็นใน Excel / Mathematica)

ตัวอย่าง: พล็อตตัวอย่าง เรามีจุดข้อมูล (0,0), (1,2), (2,4), (3,6), (4,8), ... (8, 16) แต่ค่า y แต่ละค่ามี ความไม่แน่นอนของ 4. ฟังก์ชั่นส่วนใหญ่ที่ฉันพบจะคำนวณความไม่แน่นอนเป็น 0 เนื่องจากคะแนนตรงกับฟังก์ชัน y = 2x แต่ดังที่แสดงในภาพ y = x / 2 ตรงกับจุดเช่นกัน มันเป็นตัวอย่างที่พูดเกินจริง แต่ฉันหวังว่ามันจะแสดงสิ่งที่ฉันต้องการ

แก้ไข: ถ้าฉันพยายามอธิบายให้มากขึ้นในขณะที่ทุกจุดในตัวอย่างมีค่าที่แน่นอนของ y เราทำท่าว่าเราไม่รู้ว่ามันจริงหรือไม่ ตัวอย่างเช่นจุดแรก (0,0) อาจเป็นจริง (0,6) หรือ (0, -6) หรืออะไรก็ตามที่อยู่ระหว่างนั้น ฉันถามว่ามีอัลกอริทึมในปัญหายอดนิยมใด ๆ ที่พิจารณาในบัญชีนี้หรือไม่ ในตัวอย่างคะแนน (0,6), (1,6.5), (2,7), (3,7.5), (4,8), ... (8, 10) ยังคงตกอยู่ในช่วงความไม่แน่นอน ดังนั้นพวกเขาอาจเป็นจุดที่ถูกต้องและเส้นที่เชื่อมต่อจุดเหล่านั้นมีสมการ: y = x / 2 + 6 ในขณะที่สมการที่เราได้รับจากการไม่แยกตัวประกอบในความไม่แน่นอนมีสมการ: y = 2x + 0 ดังนั้นความไม่แน่นอนของ k คือ 1,5 และจาก n คือ 6

TL: DR: ในภาพมีเส้น y = 2x ที่คำนวณโดยใช้รูปสี่เหลี่ยมจัตุรัสน้อยที่สุดและมันพอดีกับข้อมูลอย่างสมบูรณ์ ฉันพยายามค้นหาว่า k และ n ใน y = kx + n สามารถเปลี่ยนแปลงได้มากแค่ไหน แต่ยังคงพอดีกับข้อมูลถ้าเรารู้ว่าค่า y ไม่แน่นอน ในตัวอย่างของฉันความไม่แน่นอนของ k คือ 1.5 และใน n คือ 6 ในภาพมีเส้นพอดีที่ดีที่สุดและเส้นที่เพิ่งพอดีกับจุด


1
หากคุณมีความไม่แน่นอนในของคุณโดยทั่วไปคุณไม่ควรใช้การถดถอยเชิงเส้นปกติเพราะมันมีอคติ (แม้ว่าความไม่แน่นอนเล็กน้อยจะส่งผลให้มีอคติเล็ก ๆ น้อย ๆ บางทีคุณอาจไม่สนใจมากนัก) ความไม่แน่นอนใน y ของคุณเป็นค่าคงที่เสมอหรือไม่หรือเปลี่ยนแปลง? คุณเหมาะสมกับสายของคุณอย่างไร x
Glen_b -Reinstate Monica

ฉันถามเกี่ยวกับความไม่แน่นอนของ y เป็นหลัก แต่ฉันยินดีถ้าวิธีแก้ปัญหาจะพิจารณาความไม่แน่นอนของ x เช่นกัน โดยทั่วไปพวกเขาจะไม่คงที่ แต่วิธีการแก้ปัญหาที่ต้องการให้พวกเขาคงที่จะดีเช่นกันฉันลองปรับให้เหมาะสมกับ linearfit พอดีพอดี findfit ในทางคณิตศาสตร์และ linest (และฟังก์ชั่นที่กำหนดเองที่ฉันพบว่าค่าน้ำหนักตามความไม่แน่นอน) สันทัด
bedanec

คุณสามารถอธิบายได้อย่างชัดเจนที่สุดว่าค่า "ความไม่แน่นอน" จะเกี่ยวข้องกับสิ่งที่จะเกิดขึ้นภายใต้การพูดซ้ำของการทดสอบได้อย่างไร ความไม่แน่นอนเหล่านี้เป็นตัวแทนของอะไร
Glen_b -Reinstate Monica

ผิดพลาดเช่นถ้า y มีน้ำหนัก แต่เครื่องชั่งดิจิตอลมีความแม่นยำถึง + -6 เท่านั้น (ไม่ใช่ตัวอย่างที่ดีที่สุดที่มีค่าเหล่านี้ แต่ตัวอย่างเช่นเมื่อมาตราส่วนแสดง 255g อาจเป็น 255.0 หรือ 255.9)
bedanec

คุณช่วยอธิบายได้ไหมว่ามันจะเกี่ยวข้องกับประโยคแรกของคำถามของฉันได้ไหม
Glen_b -Reinstate Monica

คำตอบ:


8

knY=kx+nY

Y100(1-α)(k,n)Σ(kxผม+n-Yผม)2/σผม2<χd,α2σผมYผมd(x,Y)χd,α2αd

YผมYผม(k,n)204(k-2)2+72n(k-2)+9n2=152.271

ป้อนคำอธิบายรูปภาพที่นี่


4

ฉันทำการสุ่มตัวอย่างแบบไร้เดียงสาโดยตรงด้วยรหัสง่ายๆนี้ใน Python:

import random
import numpy as np
import pylab
def uncreg(x, y, xu, yu, N=100000):
    out = np.zeros((N, 2))
    for n in xrange(N):
        tx = [s+random.uniform(-xu, xu) for s in x]
        ty = [s+random.uniform(-yu, yu) for s in y]
        a, b = np.linalg.lstsq(np.vstack([tx, np.ones(len(x))]).T, ty)[0]
        out[n, 0:2] = [a, b]
    return out
if __name__ == "__main__":
    P = uncreg(np.arange(0, 8.01), np.arange(0, 16.01, 2), 0.1, 6.)
    H, xedges, yedges = np.histogram2d(P[:, 0], P[:, 1], bins=(50, 50))
    pylab.imshow(H, interpolation='nearest', origin='low', aspect='auto',
                 extent=[xedges[0], xedges[-1], yedges[0], yedges[-1]])

และได้รับสิ่งนี้: ฮิสโตแกรมของผลการสุ่มตัวอย่างโดยตรง

แน่นอนคุณสามารถขุดPหาข้อมูลที่คุณต้องการหรือเปลี่ยนการกระจายความไม่แน่นอน


0

ฉันเคยตามล่ามาก่อนและฉันคิดว่านี่อาจเป็นจุดเริ่มต้นที่มีประโยชน์ ฟังก์ชั่นแมโครของ excel ให้คำแบบเชิงเส้นตรงและความไม่แน่นอนตามจุดตารางและความไม่แน่นอนสำหรับแต่ละจุดในพิกัดทั้งสอง อาจมองกระดาษมันขึ้นอยู่กับการตัดสินใจว่าคุณต้องการที่จะใช้มันในสภาพแวดล้อมที่แตกต่างกันแก้ไข ฯลฯ (มีบางสิ่งที่ทำมาจากคณิตศาสตร์สำหรับ Mathematica) ดูเหมือนว่าจะมีเอกสารการเดินผ่านที่ดีบนพื้นผิว ไม่ได้เปิดมาโครเพื่อดูว่ามันมีคำอธิบายประกอบดีเพียงใด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.