การประมาณค่าความแปรปรวนของตัวอย่างปกติที่ตรวจสอบโดยกึ่งกลาง


11

ฉันมีกระบวนการจากที่ผมได้รับตัวอย่างขนาดเล็ก (ปกติกระจายnโดยปกติ 10-30) ที่ฉันต้องการที่จะใช้ในการประมาณค่าความแปรปรวน แต่บ่อยครั้งที่กลุ่มตัวอย่างอยู่ใกล้กันมากจนเราไม่สามารถวัดจุดแต่ละจุดที่อยู่ใกล้ศูนย์กลาง

ฉันมีความเข้าใจที่คลุมเครือว่าเราควรสร้างตัวประมาณที่มีประสิทธิภาพโดยใช้ตัวอย่างที่สั่ง: ตัวอย่างเช่นถ้าฉันรู้ว่าตัวอย่างมี 20 คะแนนและ 10 กลุ่มนั้นอยู่ใกล้ศูนย์กลางเกินไปที่จะวัดเป็นรายบุคคล แต่ฉันมีการวัดแบบแยก 5 บนหางทั้งสองข้าง, มีวิธีการมาตรฐาน / สูตรสำหรับการประเมินความแปรปรวนของกระบวนการที่ใช้ตัวอย่างที่ดีที่สุดหรือไม่?

(โปรดทราบว่าฉันไม่คิดว่าฉันสามารถถ่วงน้ำหนักค่าเฉลี่ยของศูนย์ได้ตัวอย่างเช่นเป็นไปได้สำหรับ 7 ตัวอย่างที่จะจัดกลุ่มให้แน่นในขณะที่อีกสามตัวเอียงไปด้านข้างแบบไม่สมมาตร แต่ใกล้พอที่เราจะบอกไม่ได้ .)

หากคำตอบนั้นซับซ้อนเคล็ดลับใด ๆ เกี่ยวกับสิ่งที่ฉันควรทำการวิจัยจะได้รับการชื่นชม เช่นนี้เป็นปัญหาเกี่ยวกับสถิติการสั่งซื้อหรือไม่ มีแนวโน้มที่จะเป็นคำตอบสูตรหรือเป็นปัญหาการคำนวณหรือไม่

อัพเดทรายละเอียด:แอพพลิเคชั่นวิเคราะห์เป้าหมายการยิง ตัวอย่างพื้นฐานเดียวคือจุดกระทบ ( x, y ) ของการยิงครั้งเดียวบนเป้าหมาย กระบวนการพื้นฐานมีการแจกแจงปกติแบบสมมาตร bivariate แต่ไม่มีความสัมพันธ์กันระหว่างแกนดังนั้นเราจึงสามารถรักษาตัวอย่าง { x } และ { y } เป็นอิสระจากการแจกแจงแบบเดียวกัน (นอกจากนี้เรายังสามารถพูดกระบวนการพื้นฐานคือเรย์ลีกระจาย แต่เราไม่สามารถวัดตัวอย่าง Rayleigh variates เพราะเราไม่สามารถจะมั่นใจได้ของพิกัดของศูนย์ "จริง" ของกระบวนการซึ่งสำหรับขนาดเล็กnสามารถอย่างมีนัยสำคัญ ห่างจากศูนย์ตัวอย่าง ( , ))ˉ yx¯y¯

เราได้รับเป้าหมายและจำนวนนัดที่ยิงเข้าไป ปัญหาคือว่าสำหรับปืนn >> 3 ที่แม่นยำมักจะยิง "หลุมขรุขระ" ที่ล้อมรอบด้วยภาพที่แตกต่างกัน เราสามารถสังเกตx - และy ที่กว้างของหลุม แต่เราไม่ทราบที่อยู่ในหลุมภาพที่ไม่แตกต่างได้รับผลกระทบ

นี่คือตัวอย่างของเป้าหมายที่เป็นปัญหามากขึ้น:

[เป้าหมายตัวอย่างด้วย n = 10]

ตัวอย่างเป้าหมายด้วย n = 100

(ได้รับในโลกอุดมคติเราจะเปลี่ยน / สลับเป้าหมายหลังจากแต่ละช็อตแล้วรวมตัวอย่างเพื่อการวิเคราะห์มีหลายเหตุผลที่มักจะไม่สามารถทำได้แม้ว่าจะทำได้เมื่อทำได้ )

xi

เพื่อความสะดวกในการแก้ปัญหาฉันเชื่อว่ามันจะง่ายที่สุดในการลดสิ่งนี้ลงในกลุ่มตัวอย่างหนึ่งมิติจากปกติโดยมีช่วงกลางของความกว้างw > dโดยที่dคือเส้นผ่านศูนย์กลางกระสุนปืนที่บรรจุตัวอย่างc < n "เซ็นเซอร์"


(1) การแจกแจงแบบปกติเป็นสมมติฐานหรือคุณมีหลักฐานที่ดีในการสนับสนุนหรือไม่ (2) เป็นปัญหาที่คุณไม่สามารถนับข้อมูลได้อย่างถูกต้องใกล้ศูนย์หรือไม่ (ที่จะแตกต่างจากความหมายปกติของ "เซ็นเซอร์" ซึ่งคือการที่คุณสามารถนับข้อมูลเหล่านั้น แต่คุณรู้เพียงว่าค่าของพวกเขาอยู่ภายในช่วงเวลาบางอย่าง.)
whuber

@whuber: ใช่เรามีทั้งหลักฐานพื้นฐานและเชิงประจักษ์กระบวนการกระจายตามปกติ และใช่เรารู้การนับจำนวนจุดที่แน่นอนในกลุ่มทั้งหมดและเราสามารถสังเกตช่วงเวลาที่มีตัวอย่างจำนวนมากเกินไปที่จะกำหนดค่าแต่ละค่า
feetwet

ขอบคุณนั่นเป็นประโยชน์ ธรรมชาติของความไม่แน่นอนยังคงไม่ชัดเจนแม้ว่าและแบบจำลองที่ดีสำหรับมันสามารถกระตุ้นทางออกที่ดีได้ บางทีคุณอาจให้ภาพประกอบหรือตัวอย่างหรืออย่างน้อยก็อธิบายกระบวนการวัดในรายละเอียดเพิ่มเติมอีกเล็กน้อย
whuber

@whuber: อัปเดต ถ้ามันจะช่วยฉันก็จะทำการโพสต์ลิงค์ไปยังตัวอย่างจริงบางอย่าง
feetwet

xi,(μ,σ2)σiB(xi,r)rB(x,r)rx

คำตอบ:


2

นั่นเป็นปัญหาที่น่าสนใจ ครั้งแรกฉันจะไม่ทำให้การกระจายตัวตามปกติ ดูเหมือนว่าสิ่งที่คุณกำลังมองหาจริงๆคือการประมาณการกระจายตัวที่คุณใช้กับนักกีฬาหรือปืนหรือกระสุนหรืออะไรก็ตาม

ฉันจะลองทำสิ่งนี้ดู คุณไม่ทราบแน่ชัดว่ากระสุนทั้งหมดไปที่ไหนเว้นแต่คุณจะเห็น 10 หลุมแยกกัน (สมมติว่า 10 นัด) แต่คุณรู้ว่าพวกเขาไม่ไปไหน สิ่งนี้สามารถใช้เพื่อ จำกัด การกระจายโดยสมมติว่าสถิติแบบเบย์หากคุณต้องการเริ่มต้นด้วยการแจกแจง

ความคิดที่ดีที่สุดที่นี่คือการหยุดพยายามทำคณิตศาสตร์และทำสิ่งที่สมเหตุสมผลเช่นนี้ ใช้เป้าหมายและเรียกใช้รูทีนการประมวลผลภาพเพื่อทำเครื่องหมายภาพที่ผ่านซึ่งอาจไม่เชื่อมต่อ วัดค่าเฉลี่ยและโมเมนต์ที่สองของสิ่งนี้และใช้สิ่งเหล่านี้เป็นตัวประมาณ ถ้าคุณต้องการที่จะเพิ่มขึ้นอีกเล็กน้อยและลองแบบเกาส์เซี่ยมคุณสามารถเรียกใช้การทดลอง monte carlo ง่ายๆเพื่อรับปัจจัยการสอบเทียบ


ขออธิบายอีกหน่อย สมมติว่าคุณมี 10 นัดและมี 6 หลุมชัดเจนที่คุณรู้ว่ากระสุนไปที่ไหน ก่อนอื่นนำคะแนนเหล่านี้ไปใช้เพื่อจำกัดความกว้างของเกาส์เซียน ต่อไปนี้เป็นประจำปกติ constrains นี้ซิกซิกของเกาส์ (จะเป็นบางส่วนกระจายที่รู้จักกัน. cs.ubc.ca/~murphyk/Papers/bayesGauss.pdf
Dave31415

ตอนนี้เมื่อคุณทำเช่นนั้นคุณต้องการพิจารณา 4 กระสุนที่ไม่ได้สร้างหลุมใหม่ เนื่องจากกระสุนมีความเป็นอิสระโอกาสใหม่นี้ (บนซิกเกาส์) จึงสามารถเพิ่มทวีคูณได้ ดังนั้นโดยพื้นฐานแล้วสำหรับ 4 กระสุนคุณต้องการคูณด้วยความน่าจะเป็นที่พวกเขาไม่ได้สร้างหลุมใหม่
Dave31415

วิธีง่ายๆในการทำสิ่งนี้กับ monte carlo คือการวาดชุดซิกมาจากการแจกแจงแบบ จำกัด ของคุณและใช้ซิกม่านี้คำนวณโอกาสที่จะไม่สร้างหลุมใหม่ ดังนั้นการจับภาพการจำลองจำนวนมากจากนี้และนับเป็นเศษส่วนที่ไม่สร้างหลุมใหม่ จากนั้นสามารถใช้เพื่ออัปเดตโอกาสได้ จากนั้นไปยังหน้าถัดไปและทำเช่นเดียวกัน ตอนนี้คุณมีโอกาสสุดท้ายของคุณ
Dave31415

ความคิดเห็นล่าสุด จากมุมมองของภาคปฏิบัติการประมาณค่าซิกมาไม่ควรได้รับผลกระทบมากนักโดยที่กระสุนกระสุนที่มองไม่เห็นหายไปตราบใดที่คุณถือว่าพวกมันผ่านหลุมก่อนหน้า ส่วนใหญ่จะถูก จำกัด โดยคนที่คุณสามารถดูที่กำหนดขอบ นั่นเป็นเพราะโอกาสที่กระสุนจะผ่านรูสองครั้งที่อยู่ไกลจากจุดศูนย์กลางนั้นต่ำมาก ดังนั้นแม้มอนติคาร์โลน้ำมันดิบจะทำให้คุณใกล้เคียงกับตัวประมาณที่เหมาะสมที่สุด
Dave31415

หากเราไม่ยืนยันการกระจายตัวปกติ (หรืออื่น ๆ ) ดูเหมือนว่าไม่น่าเป็นไปได้ที่เราจะพูดอะไรได้มากกว่าการใส่ขอบเขตบนหรือล่างบนสิ่งที่เกิดขึ้นในภูมิภาคที่ถูกเซ็นเซอร์ ในกรณี 1 มิติที่เรามีn shot ตรวจสอบความแปรปรวนขอบเขตล่างที่ต่ำกว่าคือสมมติว่าพวกเขาทั้งหมดชนจุดภายในเดียวกันใกล้เคียงกับค่าเฉลี่ยและ (สมมติว่าค่าเฉลี่ยอยู่กึ่งกลางภายใน) ขอบเขตบนคือ สมมติว่าจุดเซ็นเซอร์ถูกกระจายอย่างเท่าเทียมกันบนขอบของการตกแต่งภายใน แต่ถ้าเราสมมติว่ากระบวนการพื้นฐานเป็นเรื่องปกติดูเหมือนว่าเราควรจะสามารถทำสิ่งที่ดีกว่าได้
feetwet

0

จากจุดชมวิวอื่น ๆ ใคร ๆ ก็สามารถดูสิ่งนี้ได้ในแง่มุมของสถิติเชิงพื้นที่ซึ่งได้สร้างการจัดประเภทของเมตริกซึ่งส่วนใหญ่ถูกวางไว้ในกล่องเครื่องมือ (ดูตัวอย่างเช่นhttps://www.google.com /url?sa=t&source=web&rct=j&ei=SG31U5j4BormsASc5IHgCW&FaFaFaFaNFA&F=FaFaFaFa&F=FaFaF3&F=NaF1F3F3A สำหรับคู่ที่ 1} >

Wikipedia (ลิงค์: http://en.m.wikipedia.org/wiki/Spatial_descriptive_statistics ) มีหน้าเกริ่นนำที่ดีพูดคุยเกี่ยวกับแนวความคิดเช่นการวัดแนวโน้มกลางเชิงพื้นที่และการกระจายตัวเชิงพื้นที่ หากต้องการอ้างอิง Wikipedia ในระยะหลัง:

"สำหรับการใช้งานส่วนใหญ่การกระจายตัวของอวกาศควรจะวัดปริมาณในลักษณะที่ไม่แปรเปลี่ยนไปตามการหมุนและการสะท้อนการวัดแบบง่าย ๆ ของการกระจายเชิงพื้นที่สำหรับชุดจุดสามารถกำหนดได้โดยใช้เมทริกซ์ความแปรปรวนร่วมของพิกัดของจุด และค่าลักษณะเฉพาะที่ใหญ่ที่สุดของเมทริกซ์ความแปรปรวนร่วมสามารถใช้เป็นมาตรการของการกระจายตัวเชิงพื้นที่การวัดการกระจายตัวเชิงพื้นที่ที่ไม่ได้ขึ้นอยู่กับเมทริกซ์ความแปรปรวนร่วมคือระยะทางเฉลี่ยระหว่างเพื่อนบ้านที่ใกล้ที่สุด [1] "

แนวคิดที่เกี่ยวข้องรวมถึงมาตรการของความสม่ำเสมอของพื้นที่เชิงซ้อนฟังก์ชัน K และ L ของริบลีย์และอาจเกี่ยวข้องกับการวิเคราะห์กลุ่มกระสุนมากที่สุดการทดสอบ Cuzick - Edwards สำหรับการจัดกลุ่มของกลุ่มย่อยภายในประชากรกลุ่ม การทดสอบหลังนี้ใช้การเปรียบเทียบ (โดยใช้การวิเคราะห์ "เพื่อนบ้านที่ใกล้ที่สุด" เพื่อจัดทำสถิติ) กับประชากรควบคุมซึ่งในบริบทปัจจุบันอาจขึ้นอยู่กับเป้าหมายที่สังเกตได้จริงซึ่งจำแนกว่าไม่แสดงการจัดกลุ่มหรือตามการจำลองเชิงทฤษฎีจาก พูดการกระจาย Rayleigh

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.