การจำลองการบรรจบกันของความน่าจะเป็นให้คงที่


9

ผลลัพธ์แบบอะซิมโทติคไม่สามารถพิสูจน์ได้ด้วยการจำลองด้วยคอมพิวเตอร์เนื่องจากเป็นข้อความที่เกี่ยวข้องกับแนวคิดของอนันต์ แต่เราควรจะได้รับความรู้สึกว่าสิ่งต่าง ๆ เป็นจริงตามที่ทฤษฎีบอกเรา

พิจารณาผลลัพธ์ทางทฤษฎี

limnP(|Xn|>ϵ)=0,ϵ>0

โดยที่Xnเป็นฟังก์ชั่นของตัวแปรสุ่มnพูดกันอย่างอิสระและกระจายตัว นี่บอกว่าXnแปรเปลี่ยนความน่าจะเป็นเป็นศูนย์ ตัวอย่างต้นแบบที่นี่ฉันเดาว่าเป็นกรณีที่Xnเป็นค่าเฉลี่ยตัวอย่างลบด้วยค่าที่คาดหวังร่วมกันของตัวอย่าง iidrv

Xn=1ni=1nYiE[Y1]

คำถาม: เราจะแสดงให้คนเห็นได้อย่างไรว่าความสัมพันธ์ข้างต้น "ปรากฏขึ้นในโลกแห่งความเป็นจริง" โดยใช้ผลการจำลองด้วยคอมพิวเตอร์จากตัวอย่างที่มีความจำเป็น

โปรดทราบว่าฉันเลือกลู่เข้าเป็นค่าคงที่โดยเฉพาะ

ฉันให้วิธีการด้านล่างของฉันเป็นคำตอบและฉันหวังว่าสำหรับคนที่ดีกว่า

UPDATE:มีบางอย่างที่ด้านหลังศีรษะของฉันรบกวนฉัน - และฉันก็รู้ว่าอะไร ฉันขุดขึ้นมาเป็นคำถามเก่าที่สนทนาที่น่าสนใจมากที่สุดไปในในความคิดเห็นเพื่อหนึ่งในคำตอบ ในนั้น @ Cardinal ให้ตัวอย่างของตัวประมาณว่ามันสอดคล้องกัน แต่ความแปรปรวนของมันยังคงไม่เป็นศูนย์และแน่นอนที่ไม่มีอาการ ดังนั้นคำถามที่แตกต่างของคำถามของฉันจะรุนแรงขึ้น: เราจะแสดงโดยการจำลองว่าสถิติมาบรรจบกันในความน่าจะเป็นเป็นค่าคงที่ได้อย่างไรเมื่อสถิตินี้รักษาความแปรปรวนที่ไม่เป็นศูนย์และไม่มีขอบเขตแบบ asymptotically


@Glen_b มาจากคุณสิ่งนี้เทียบเท่ากับตรา ขอบคุณ
Alecos Papadopoulos

เคยคิดเกี่ยวกับเรื่องนี้มานานแล้วและสิ่งที่ฉันคิดขึ้นมาก็คือ ฉันหวังว่าคนฉลาดบางคนที่นี่มีเวลาเขียนสิ่งที่น่าสนใจ! (+1 แน่นอน!)
ekvall

คำตอบ:


2

ฉันคิดว่าเป็นฟังก์ชันการแจกแจง (เป็นส่วนเสริมในกรณีเฉพาะ) เนื่องจากฉันต้องการใช้การจำลองด้วยคอมพิวเตอร์เพื่อแสดงว่าสิ่งต่าง ๆ มีแนวโน้มที่ผลลัพธ์ทางทฤษฎีบอกเราฉันจึงต้องสร้างฟังก์ชันการแจกแจงเชิงประจักษ์ของหรือการแจกแจงความถี่สัมพัทธ์เชิงประจักษ์แล้วแสดงให้เห็นว่าเมื่อเพิ่มขึ้นค่าของ ตั้งสมาธิ "มากขึ้น" เป็นศูนย์ P()|Xn|n|Xn|

ในการรับฟังก์ชั่นความถี่สัมพัทธ์เชิงประจักษ์ฉันต้องการ (มาก) มากกว่าหนึ่งตัวอย่างที่เพิ่มขนาดเนื่องจากเมื่อขนาดตัวอย่างเพิ่มขึ้นการกระจายของการเปลี่ยนแปลงที่แตกต่างกันสำหรับแต่ละn |Xn|n

ดังนั้นฉันต้องสร้างจากการกระจายตัวของตัวอย่าง , "ขนาน", พูดแปรผันในหลักพัน, แต่ละขนาดเริ่มต้น , พูดอยู่ในหลักหมื่น ฉันต้องการคำนวณค่าของจากแต่ละตัวอย่าง (และสำหรับเดียวกัน ) คือได้รับการตั้งค่าของค่า\}Yimmnn|Xn|n{|x1n|,|x2n|,...,|xmn|}

ค่าเหล่านี้สามารถใช้เพื่อสร้างการแจกแจงความถี่สัมพัทธ์เชิงประจักษ์ มีความเชื่อมั่นในผลลัพธ์ทางทฤษฎีฉันคาดหวังว่า "มาก" ของค่าของจะเป็น "ใกล้มาก" ถึงศูนย์ - แน่นอนไม่ใช่ทั้งหมด |Xn|

ดังนั้นเพื่อแสดงให้เห็นว่าค่าของแน่นอนเดินขบวนไปที่ศูนย์ในจำนวนมากขึ้นและมากขึ้นฉันจะต้องทำซ้ำกระบวนการเพิ่มขนาดตัวอย่างที่จะบอกว่าและแสดงให้เห็นว่าตอนนี้ความเข้มข้นเป็นศูนย์ "ได้เพิ่มขึ้น" เห็นได้ชัดว่าจะแสดงให้เห็นว่ามันได้เพิ่มขึ้นหนึ่งควรระบุค่าเชิงประจักษ์สำหรับ\|Xn|2nϵ

นั่นจะเพียงพอหรือไม่ เราจะทำแบบนี้ "เพิ่มความเข้มข้น" ได้ไหม? สามารถทำตามขั้นตอนนี้หากดำเนินการในขั้นตอน "การเพิ่มขนาดตัวอย่าง" มากขึ้นและขั้นตอนที่ใกล้เคียงกับอีกขั้นทำให้เราประมาณค่าประมาณอัตราการลู่เข้าที่เกิดขึ้นจริงเช่นบางสิ่งเช่น "มวลความน่าจะเป็นเชิงประจักษ์ แต่ละขั้นตอนของพูดหนึ่งพัน? n

หรือตรวจสอบค่าของขีด จำกัด ที่บอกว่า % ของความน่าจะเป็นอยู่ด้านล่างและดูว่าค่าของลดลงอย่างมากได้อย่างไร90ϵ

ตัวอย่าง

พิจารณาว่าเป็นและอื่น ๆYiU(0,1)

|Xn|=|1ni=1nYi12|

ก่อนอื่นเราสร้างตัวอย่างขนาด การแจกแจงความถี่สัมพัทธ์เชิงประจักษ์ของดูเหมือนกับ m=1,000n=10,000|X10,000|ป้อนคำอธิบายรูปภาพที่นี่

และเราทราบว่า % ของค่าของมีขนาดเล็กแล้ว0.0046155 90.10|X10,000|0.0046155

ต่อไปฉันเพิ่มขนาดตัวอย่างเพื่อnตอนนี้การกระจายความถี่สัมพัทธ์เชิงประจักษ์ของดูเหมือนว่า และเราทราบว่า % ของค่าของอยู่ด้านล่าง0.0037101อีกทางเลือกหนึ่งในขณะนี้ % ของค่าลดลงต่ำกว่า 0.0045217n=20,000|X20,000|ป้อนคำอธิบายรูปภาพที่นี่91.80|X20,000|0.003710198.000.0045217

คุณจะได้รับการชักชวนจากการสาธิตเช่นนี้หรือไม่?


3
ไม่ฉันจะไม่ถูกชักจูงจากการสาธิตใด ๆ หากนั่นคือทั้งหมดที่มีให้ ไม่สามารถแยกความแตกต่างระหว่างผลลัพธ์ที่อ้างสิทธิ์และผลลัพธ์ที่มีการปนเปื้อนจำนวนน้อยมากจากการกระจายที่ไม่ใช่ศูนย์ การจำลองด้วยคอมพิวเตอร์ใด ๆ เพื่อโน้มน้าวใจอย่างแท้จริงจะต้องมาพร้อมกับเหตุผลที่จะแยกแยะปรากฏการณ์ดังกล่าว (เมื่อเร็ว ๆ นี้ฉันได้ทำการจำลองสถานการณ์หลายครั้งที่มีขนาดตัวอย่างนั่นไม่ใช่การพิมพ์ผิด - แต่ก็ยังไม่ได้รับผลจากการชักชวนแม้ว่าพวกเขาจะเป็นคนชี้นำ!)101000
whuber

1
@whuber สิ่งที่คุณเขียนฟังดูน่าสนใจมาก การจำลองเหล่านี้คุณพูดถึงโดยอ้างอิงจากข้อมูลจริงบางส่วนจากการกระจายที่มีการประมาณและจากนั้นสร้างข้อมูลเทียมเพิ่มเติมหรือไม่ หรือมันเป็นสิ่งประดิษฐ์มาตั้งแต่ต้น หากการรักษาความลับไม่ใช่ปัญหาและการอนุญาตเวลาฉันเองก็อยากจะเห็นคำตอบของคุณมากพอที่จะมองว่าการจำลองเหล่านี้มีวิวัฒนาการอย่างไรและทำไมยังมีข้อสงสัยอยู่
Alecos Papadopoulos

1
มันเป็นข้อมูลประดิษฐ์ ผมดำเนินการจำลองเหล่านี้เพื่อสนับสนุนการแสดงความคิดเห็นที่stats.stackexchange.com/questions/104875/... คุณจะเห็นได้ทันทีวิธีการดังกล่าวจำลองขนาดใหญ่สามารถดำเนินการ: การสร้างตัวอย่างของจาก Bernoulliการกระจายคุณเพียงแค่วาดเดียวค่าจากทวินามการจัดจำหน่าย เมื่อมีขนาดใหญ่พอคุณอาจวาดค่าจากการแจกแจงแบบปกติเคล็ดลับหลักคือการทำเช่นนี้ด้วยความแม่นยำหลัก :-) N(1/2)(N,1/2)N(N/2,N/2)1000
whuber

@Wuber ขอบคุณฉันจะทำงานกับมัน โดยวิธีการคำถามที่คุณพูดถึงคำตอบนั้นและความคิดเห็นของคุณได้ตั้งฉันให้ตรวจสอบอย่างลึกซึ้งยิ่งขึ้นทั้งการกระจาย asymptotic ของความแปรปรวนตัวอย่างจากตัวอย่างที่ไม่ปกติเช่นเดียวกับการบังคับใช้ของทฤษฎีบท Slutsky ในทางที่เป็น ใช้ในคำตอบ ฉันหวังว่าในที่สุดฉันจะได้ผลลัพธ์ที่จะแบ่งปัน
Alecos Papadopoulos
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.