การทดสอบทางสถิติที่รวมความไม่แน่นอนของการวัด


11

สมมติว่าฉันได้รับการวัดมวลสองกลุ่ม (เป็น mg) ซึ่งเรียกว่า y1 และ y2 ฉันต้องการทดสอบเพื่อดูว่าตัวอย่างทั้งสองนั้นมาจากประชากรที่มีวิธีการต่างกันหรือไม่ ตัวอย่างเช่นนี้ (ใน R):

y1 <- c(10.5,2.9,2.0,4.4,2.8,5.9,4.2,2.7,4.7,6.6)
y2 <- c(3.8,4.3,2.8,5.0,9.3,6.0,7.6,3.8,6.8,7.9)
t.test(y1,y2)

ฉันได้ค่า p - 0.3234 และอย่างมีนัยสำคัญที่ระดับ 0.05 ไม่ปฏิเสธสมมติฐานว่างว่าทั้งสองกลุ่มนั้นมาจากประชากรที่มีค่าเฉลี่ยเท่ากัน ตอนนี้ฉันได้รับความไม่แน่นอนสำหรับการวัดแต่ละครั้ง:

u1 <- c(2.3,1.7,1.7,1.7,2.0,2.2,2.1,1.7,2.3,2.2)
u2 <- c(2.4,1.8,1.6,2.3,2.5,1.8,1.9,1.5,2.3,2.3)

โดยที่ u1 [1] คือความไม่แน่นอนมาตรฐานรวมในการวัด y1 [1] (และอื่น ๆ ) ฉันจะรวมความไม่แน่นอนเหล่านี้เข้ากับการทดสอบทางสถิติได้อย่างไร


วัดเหล่านี้จับคู่หรือไม่? (ฉันคิดว่าไม่ได้) ความไม่แน่นอนสามารถใช้น้ำหนักที่สืบทอดมาซึ่งสามารถปรับปรุงการอนุมานของคุณ แต่ความแปรปรวนของความไม่แน่นอนนั้นค่อนข้างเล็กดังนั้นจึงไม่ได้รับประโยชน์มากนักแม้แต่ในความไม่แน่นอนนั้นก็แม่นยำ
Glen_b -Reinstate Monica

นี่เป็นส่วนย่อยของข้อมูลที่ไม่มีการจับคู่จริง ตัวอย่างมีวัตถุประสงค์หลักเพื่อชี้แจงคำถาม สิ่งที่ฉันกำลังมองหาคือคำแนะนำทั่วไปเกี่ยวกับวิธีการที่ดีที่สุดรวมความไม่แน่นอนของการวัดเข้ากับการทดสอบสมมติฐาน (เช่นที่การทดสอบ) สำหรับฉันดูเหมือนว่าเรากำลังสูญเสียข้อมูลที่มีค่ามากมายหากเราไม่ใช้ความไม่แน่นอนของการวัด แต่ฉันไม่สามารถหาแนวทางที่ชัดเจนเกี่ยวกับเรื่องนี้ในวรรณคดี
Tom

เพื่อให้สามารถใช้ประโยชน์ได้อย่างเต็มที่คุณจำเป็นต้องรวมมันไว้ในแบบจำลองความน่าจะเป็นสำหรับการสังเกต ความไม่แน่นอนของการวัดแสดงถึงอะไรจริง ๆ (คุณไม่สามารถส่งคลื่นได้โปรดระวังให้ดี)
Glen_b

คำตอบ:


1

ดูเหมือนว่าคุณต้องการทำการวิเคราะห์แบบถ่วงน้ำหนัก ดูตัวอย่าง "สถิติถ่วงน้ำหนัก"ในส่วน "แนวคิด" ของเอกสารประกอบ SAS


ดังนั้นเราแค่ทำการทดสอบ t ด้วยค่าเฉลี่ยถ่วงน้ำหนักและส่วนเบี่ยงเบนมาตรฐานถ่วงน้ำหนักโดยที่ u1 และ u1 เป็นน้ำหนัก?
Tom

ใช่. คุณจะสมมติว่าความแปรปรวนของการสังเกต i_th คือ Var / w_i โดยที่ w_i เป็นน้ำหนักสำหรับการสังเกต i_th และ Var> 0
Rick

1

ทำไมไม่ลองจำลองดูล่ะ? นั่นคือเพิ่มความไม่แน่นอนของคุณในการรับรู้เสียงในการสังเกตแต่ละครั้ง จากนั้นทำซ้ำการทดสอบสมมติฐาน ทำเช่นนี้ประมาณ 1,000 ครั้งและดูว่ามีการปฏิเสธ null กี่ครั้ง คุณจะต้องเลือกการกระจายสัญญาณรบกวน ปกติดูเหมือนเป็นตัวเลือกเดียว แต่มันสามารถสร้างข้อสังเกตเชิงลบซึ่งไม่เหมือนจริง


1

คุณสามารถทำให้เป็นปัญหาการถดถอยและใช้ความไม่แน่นอนเป็นน้ำหนัก นั่นคือคาดการณ์กลุ่ม (1 หรือ 2?) จากการวัดในการถดถอย

แต่

ความไม่แน่นอนอยู่ที่ประมาณคงที่ดังนั้นจึงดูเหมือนว่าจะไม่มีอะไรเปลี่ยนแปลงมากนักเมื่อใช้มัน

คุณมีค่าผิดปกติเล็กน้อยที่ 10.5 ซึ่งทำให้เกิดความซับซ้อนโดยลดความแตกต่างระหว่างค่าเฉลี่ย แต่ถ้าคุณเชื่อในความไม่แน่นอนคุณค่านั้นก็ไม่น่าสงสัยไปกว่าค่าอื่น ๆ

t-test ไม่ทราบว่าสมมติฐานทางเลือกของคุณคือตัวอย่างสองตัวอย่างมาจากประชากรที่แตกต่างกัน สิ่งที่รู้ก็คือการเปรียบเทียบวิธีการภายใต้สมมติฐานที่แน่นอน การทดสอบตามอันดับเป็นทางเลือก แต่ถ้าคุณสนใจข้อมูลเหล่านี้เป็นการวัดพวกเขาจะไม่เหมาะกับเป้าหมายของคุณ


จุดที่ถ่าย ฉันเปลี่ยนคำถามเพื่อแสดงในแง่ของวิธีการ
Tom

0

โดยปกติแล้วกำลังสองน้อยสุด (เช่น lm (y ~ x)) คุณอนุญาตให้มีความแปรปรวน (ความไม่แน่นอน) รอบค่า y ได้รับค่า x หากคุณพลิกการถดถอยรอบ (lm (x ~)) คุณลดข้อผิดพลาดรอบ ๆ x ในทั้งสองกรณีข้อผิดพลาดจะถือว่าเป็นเนื้อเดียวกัน

หากคุณทราบจำนวนความแปรปรวนรอบ ๆ การสังเกตแต่ละตัวแปรตอบสนองของคุณและความแปรปรวนนั้นไม่คงที่เมื่อสั่งโดย x คุณจะต้องใช้กำลังสองน้อยที่สุด คุณสามารถกำหนดน้ำหนักค่า y ตามปัจจัย 1 / (ความแปรปรวน)

ในกรณีที่คุณกังวลว่าทั้ง x และ y มีความไม่แน่นอนและความไม่แน่นอนนั้นไม่เหมือนกันระหว่างทั้งสองดังนั้นคุณไม่ต้องการลดเหลือเพียงเล็กน้อย (ความไม่แน่นอนของที่อยู่) ในแนวตั้งฉากให้กับแกนหนึ่งของคุณ เป็นการดีที่คุณจะลดความไม่แน่นอนที่ตั้งฉากกับเส้นแนวโน้มติดตั้ง การทำเช่นนี้คุณสามารถใช้ PCA ถดถอย (หรือเรียกว่าการถดถอยมุมฉากหรือน้อยสแควร์รวม. มีแพคเกจ R สำหรับ PCA ถดถอยและมีรับก่อนหน้านี้โพสต์ในหัวข้อนี้ในเว็บไซต์นี้ , ซึ่งได้แล้วนอกจากนี้ยังกล่าวถึงที่อื่น ๆนอกจากนี้ฉันคิดว่า (เช่นฉันอาจผิด ... ) คุณยังสามารถทำเวอร์ชันถ่วงน้ำหนักของการถดถอยนี้ได้โดยใช้ความรู้ของคุณเกี่ยวกับความแปรปรวน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.