เลือก Priors ตามข้อผิดพลาดการวัด


9

คุณคำนวณค่าที่เหมาะสมก่อนว่าคุณมีข้อผิดพลาดในการวัดของเครื่องมืออย่างไร ย่อหน้านี้มาจากหนังสือของ Cressie "สถิติสำหรับข้อมูล Spatio-Temporal":

มักจะเป็นกรณีที่ข้อมูลก่อนหน้านี้บางส่วนมีอยู่เกี่ยวกับความแปรปรวนของการวัด - ข้อผิดพลาดทำให้สามารถระบุรูปแบบพารามิเตอร์ที่มีข้อมูลที่ค่อนข้างยุติธรรม ตัวอย่างเช่นถ้าเราสมมติว่าข้อผิดพลาดการวัดที่เป็นอิสระตามเงื่อนไขคือ iid Gau(0,σϵ2)จากนั้นเราควรระบุข้อมูลก่อน σϵ2. สมมติว่าเราสนใจอุณหภูมิของอากาศแวดล้อมและเราเห็นว่าข้อกำหนดของผู้ผลิตเครื่องมือระบุว่า "ผิดพลาด"±0.1°C. สมมติว่า "ข้อผิดพลาด" นี้สอดคล้องกับ 2 ส่วนเบี่ยงเบนมาตรฐาน (สมมติฐานที่ควรตรวจสอบ!) เราอาจระบุให้มีค่าเฉลี่ยก่อนหน้า . เนื่องจากข้อกำหนดของผู้ผลิตเครื่องมือเราจะถือว่าการกระจายที่มีจุดสูงสุดที่ชัดเจนและค่อนข้างแคบที่ 0.0025 (เช่นแกมมาผกผัน) อันที่จริงเราสามารถแก้ไขได้ที่ 0.0025; อย่างไรก็ตามข้อผิดพลาดของตัวแบบข้อมูลอาจมีองค์ประกอบอื่นที่มีความไม่แน่นอนเช่นกัน (มาตรา 7.1) เพื่อหลีกเลี่ยงปัญหาในการระบุตัวตนที่เป็นไปได้กับข้อผิดพลาดของกระบวนการแบบจำลองมันเป็นสิ่งสำคัญมากที่ผู้สร้างแบบจำลองจะลดความไม่แน่นอนให้มากที่สุดเท่าที่วิทยาศาสตร์อนุญาตรวมถึงการศึกษาด้านการออกแบบข้อมูลσϵ2(0.1/2)2=0.0025

ไม่มีใครรู้ว่าขั้นตอนทั่วไปที่จะได้รับค่าของก่อนหน้าตามที่อธิบายไว้ข้างต้น (แม้ว่าย่อหน้าเท่านั้นหมายถึงการได้รับค่าเฉลี่ยก่อนหน้า)?

คำตอบ:


6

สองวิธีมาตรฐานคือ

  1. ศึกษา "ข้อมูลจำเพาะของผู้ผลิตเครื่องดนตรี"ตามที่ระบุในใบเสนอราคา โดยทั่วไปแล้วจะเป็นการถอยกลับที่หยาบคายที่จะใช้เมื่อไม่มีข้อมูลอื่นใดเนื่องจาก (a) ผู้ผลิตอุปกรณ์หมายถึง "ความถูกต้อง" และ "ความแม่นยำ" อย่างแท้จริงและมักจะไม่ได้กำหนดและ (b) เครื่องมือที่ตอบสนองเมื่อใหม่ใน ห้องปฏิบัติการทดสอบน่าจะดีกว่าที่ใช้ในสนาม

  2. รวบรวมตัวอย่างที่ซ้ำกัน ในการสุ่มตัวอย่างด้านสิ่งแวดล้อมมีประมาณครึ่งโหลระดับที่ตัวอย่างถูกทำซ้ำเป็นประจำ (และอีกมากมายที่พวกเขาสามารถทำซ้ำ) โดยแต่ละระดับใช้ในการควบคุมแหล่งที่มาของการเปลี่ยนแปลงที่กำหนด แหล่งข้อมูลดังกล่าวอาจรวมถึง:

    • ข้อมูลประจำตัวของบุคคลที่รับตัวอย่าง
    • ขั้นตอนเบื้องต้นเช่นการประกันตัวหลุมก่อนที่จะได้รับตัวอย่าง
    • ความแปรปรวนในกระบวนการสุ่มตัวอย่างทางกายภาพ
    • ความแตกต่างภายในปริมาตรตัวอย่างเอง
    • การเปลี่ยนแปลงที่อาจเกิดขึ้นเมื่อเก็บรักษาและส่งตัวอย่างไปยังห้องปฏิบัติการ
    • ความแปรปรวนในกระบวนการทางห้องปฏิบัติการเบื้องต้นเช่นการผสมตัวอย่างทางกายภาพหรือการย่อยเพื่อการวิเคราะห์
    • การระบุของนักวิเคราะห์ห้องปฏิบัติการ
    • ความแตกต่างระหว่างห้องปฏิบัติการ
    • ความแตกต่างระหว่างเครื่องมือต่าง ๆ ทางร่างกายเช่นแก๊สโครมาโตกราฟ
    • ดริฟท์ในการสอบเทียบเครื่องมือเมื่อเวลาผ่านไป
    • รูปแบบรายวัน (ซึ่งอาจเป็นไปตามธรรมชาติและเป็นระบบ แต่สามารถสุ่มได้เมื่อเวลาสุ่มตัวอย่างเป็นแบบสุ่ม)

การประเมินเชิงปริมาณอย่างเต็มรูปแบบขององค์ประกอบของความแปรปรวนสามารถทำได้โดยการเปลี่ยนแปลงแต่ละปัจจัยเหล่านี้อย่างเป็นระบบตามการออกแบบการทดลองที่เหมาะสม

โดยปกติจะมีการศึกษาเฉพาะแหล่งข้อมูลที่เชื่อว่ามีส่วนทำให้เกิดความแปรปรวนมากที่สุด ตัวอย่างเช่นการศึกษาจำนวนมากจะแบ่งตัวอย่างบางส่วนอย่างเป็นระบบเมื่อได้รับแล้วส่งไปยังห้องปฏิบัติการที่แตกต่างกันสองแห่ง การศึกษาความแตกต่างระหว่างผลลัพธ์ของการแยกเหล่านั้นสามารถวัดผลการมีส่วนร่วมของพวกเขาในการวัดความแปรปรวน หากได้รับการแบ่งอย่างเพียงพอการกระจายความแปรปรวนของการวัดแบบสมบูรณ์สามารถประเมินได้ก่อนหน้านี้ในโมเดลแบบจำลองเชิงพื้นที่แบบเบเนเซียนแบบชั่วคราว เพราะมีหลายรูปแบบที่สมมติว่าการแจกแจงแบบเกาส์ (สำหรับการคำนวณแต่ละครั้ง) การได้รับแบบเกาส์ในที่สุดก็มาถึงการประมาณค่าเฉลี่ยและความแปรปรวนของความแตกต่างระหว่างการแยก ในการศึกษาที่ซับซ้อนมากขึ้นซึ่งมุ่งที่จะระบุองค์ประกอบความแปรปรวนมากกว่าหนึ่งรายการ

ข้อดีอย่างหนึ่งของการคิดเกี่ยวกับปัญหาเหล่านี้คือช่วยให้คุณระบุวิธีการลดหรือกำจัดองค์ประกอบของข้อผิดพลาดบางอย่าง (โดยไม่ต้องคำนวณหาจำนวน) ดังนั้นการเข้าใกล้อุดมคติของ Cressie & Wikle ของ "การลดความไม่แน่นอน เท่าที่วิทยาศาสตร์อนุญาต "

สำหรับตัวอย่างการทำงานเพิ่มเติม (ในการสุ่มตัวอย่างดิน) โปรดดู

Van Ee, Blume และ Starks เหตุผลสำหรับการประเมินข้อผิดพลาดในการเก็บตัวอย่างดิน US EPA, พฤษภาคม 1990: EPA / 600 / 4-90 / 013


2
ปัญหาที่นี่ Robert คือบางคนจะรายงานค่าเบี่ยงเบนมาตรฐานสำหรับการประเมิน อีกครั้งที่พวกเขาจะรายงานสองครั้ง (จากหารด้วยสอง) หรือช่วงความมั่นใจสองด้าน; และบางครั้งก็มีอย่างอื่น; ดังนั้นจึงไม่มีกฎที่แน่นอนสำหรับการแปลงข้อความเกี่ยวกับความถูกต้องและแม่นยำให้เป็นนักบวช: คุณต้องศึกษาเชิงอรรถและรายละเอียดทางเทคนิคอื่น ๆ เพื่อหาว่าตัวเลขนั้นเป็นอย่างไร ข้อผิดพลาดมาตรฐานของการประมาณซึ่งเป็นฟังก์ชันของขนาดของตัวอย่างที่ใช้นั้นไม่เกี่ยวข้องกับจุดประสงค์นี้ BTW
whuber

1
เข้าใจแล้ว ผมขอเปลี่ยนโฟกัสเป็นกรณีที่สองของคุณ หากฉันทำการทดสอบซ้ำสองครั้งและรับการวัดและ ฉันจะใช้ข้อมูลนี้เพื่อแจ้งค่าเฉลี่ยและความแปรปรวนสำหรับการแจกแจงก่อนหน้าได้อย่างไร คุณแนะนำอะไรเช่นสำหรับการแยกหลายครั้งใช่ไหม ดังนั้นผมจึงต้องการมีค่าเฉลี่ยของความผิดพลาดการวัดและตัวอย่างส่วนเบี่ยงเบนมาตรฐานepsilon} นั่นเพียงพอที่จะรวมไว้ในก่อนหน้าหรือไม่ m1m2m1m2mϵσϵN(mϵ,σϵ2)
Robert Smith

1
คุณไม่สามารถประเมินความแม่นยำด้วยการแบ่ง: สำหรับสิ่งนั้นคุณต้องวัดตัวอย่างของค่าที่ทราบ (การใช้เดือยสำหรับทดลองและการทำซ้ำที่ถูกแทงถูกใช้สำหรับสิ่งนี้) ซึ่งจะเป็นตัวกำหนดค่าเฉลี่ย โดยทั่วไปสิ่งนี้จะถูกจัดการเมื่อทำการปรับเทียบกระบวนการวัดดังนั้นค่าเฉลี่ยจะถูกนำมาเป็นศูนย์ การประมาณค่าความแปรปรวนกับสูตร ANOVA ปกติ คุณสามารถใช้มันเพื่อระบุก่อนหน้านี้ในองค์ประกอบที่เกี่ยวข้องของระบบการวัด
whuber

2
ไม่เช่นนั้น: ข้อมูลอ้างอิงที่ฉันให้ไว้คือแนวทางของ US EPA ซึ่งมีมานานประมาณหนึ่งในสี่ในสี่ไตรมาสและแนวทางใหม่ ๆ ฉันเคยใช้วิธีการนี้ในคดีของศาลรัฐบาลกลางเพื่อประเมินผลของข้อผิดพลาดในการวัดที่มีต่อเส้นชั้นความยาว (ขึ้นอยู่กับตัวทำนายเชิงภูมิศาสตร์) เพื่อจำแนกขนนกที่ปนเปื้อน: ข้อผิดพลาดในการวัดใหญ่กว่าความเข้มข้นที่ใช้ (ในคำอื่น ๆ ความไม่แน่นอนในการวิเคราะห์ขนนกนั้นไม่มีที่สิ้นสุด)
whuber

1
ดีจริงๆ. โดยวิธีการที่ฉันตั้งใจจะบอกว่านักบวชมักจะตั้งค่าโดยไม่ต้องดูแลมาก ฉันได้เห็นสิ่งนี้เด่นชัดมากขึ้นในการสร้างแบบจำลองแบบเบย์และการเรียนรู้ด้วยเครื่องจักรอาจเป็นเพราะการเดามักจะเพียงพอที่จะให้ผลลัพธ์ที่ดี
Robert Smith
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.