คำถามติดแท็ก finite-population

1
คำอธิบายของปัจจัยการแก้ไข จำกัด
ฉันเข้าใจว่าเมื่อการสุ่มตัวอย่างจากประชากร จำกัด และขนาดตัวอย่างของเรามากกว่า 5% ของประชากรเราจำเป็นต้องแก้ไขค่าเฉลี่ยและข้อผิดพลาดมาตรฐานของตัวอย่างโดยใช้สูตรนี้: FPC= N- nยังไม่มีข้อความ- 1----√FPC=ยังไม่มีข้อความ-nยังไม่มีข้อความ-1\hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}} โดยที่คือขนาดประชากรและคือขนาดตัวอย่างยังไม่มีข้อความยังไม่มีข้อความNnnn ฉันมีคำถาม 3 ข้อเกี่ยวกับสูตรนี้: ทำไมเกณฑ์ถูกตั้งไว้ที่ 5% สูตรได้มาอย่างไร มีแหล่งข้อมูลออนไลน์อื่น ๆ ที่อธิบายสูตรนี้นอกเหนือจากเอกสารนี้หรือไม่

3
Bootstrap: ปัญหาการ overfitting
สมมติว่าหนึ่งดำเนินการ bootstrap ที่ไม่ใช่พารามิเตอร์โดยการวาดตัวอย่างของขนาดnแต่ละจากต้นฉบับnBBBnnnnnnสังเกตพร้อมการแทนที่ ฉันเชื่อว่ากระบวนการนี้เทียบเท่ากับการประมาณฟังก์ชันการแจกแจงสะสมโดย cdf เชิงประจักษ์: http://en.wikipedia.org/wiki/Empirical_distribution_function จากนั้นรับตัวอย่าง bootstrap โดยจำลองการสังเกตจาก cdf BโดยประมาณnnnBBBในแถว ถ้าฉันพูดถูกสิ่งนี้จะต้องจัดการกับปัญหาเรื่องการล้นเพราะเอกสารเชิงประจักษ์มีพารามิเตอร์เกี่ยวกับ N แน่นอนว่ามันไม่แปรเปลี่ยนไปเป็นประชากร cdf แต่แล้วกลุ่มตัวอย่าง จำกัด ? เช่นถ้าฉันบอกคุณว่าฉันมีการสังเกต 100 ครั้งและฉันจะประมาณ cdf เป็นด้วยสองพารามิเตอร์คุณจะไม่ตื่นตระหนก อย่างไรก็ตามหากจำนวนพารามิเตอร์สูงถึง 100 ดูเหมือนจะไม่สมเหตุสมผลเลยN(μ,σ2)N(μ,σ2)N(\mu, \sigma^2) ในทำนองเดียวกันเมื่อมีพนักงานหลายมาตรฐานการถดถอยเชิงเส้นการกระจายของระยะข้อผิดพลาดเป็นที่คาดกันว่าเป็น ) หากมีใครตัดสินใจที่จะเปลี่ยนเป็นการบูตสต็อกส่วนที่เหลือเขาต้องรู้ว่าตอนนี้มีประมาณnN(0,σ2)N(0,σ2)N(0, \sigma^2)nnnพารามิเตอร์ใช้เพื่อจัดการกับการแจกแจงข้อผิดพลาด คุณช่วยบอกทางฉันถึงแหล่งข้อมูลบางแห่งที่จัดการปัญหานี้อย่างชัดเจนหรือบอกสาเหตุที่ไม่ใช่ปัญหาถ้าคุณคิดว่าฉันทำผิด

4
ทำไมถึงต้องพิจารณาการสุ่มตัวอย่างโดยไม่ต้องแทนที่ในแอปพลิเคชันเชิงปฏิบัติ
การสุ่มตัวอย่างด้วยการเปลี่ยนมีสองข้อได้เปรียบกว่าการสุ่มตัวอย่างโดยไม่ต้องเปลี่ยนอย่างที่ฉันเห็น: 1) คุณไม่จำเป็นต้องกังวลเกี่ยวกับการแก้ไขประชากร จำกัด 2) มีโอกาสที่องค์ประกอบจากประชากรจะถูกดึงหลายครั้ง - จากนั้นคุณสามารถรีไซเคิลการวัดและประหยัดเวลา แน่นอนจากมุมมองทางวิชาการคนหนึ่งต้องตรวจสอบทั้งสองวิธี แต่จาก POV เชิงปฏิบัติฉันไม่เห็นว่าทำไมใครจะพิจารณาการสุ่มตัวอย่างโดยไม่มีการเปลี่ยนเนื่องจากข้อดีของการแทนที่ แต่ฉันเป็นผู้เริ่มต้นในสถิติดังนั้นอาจมีเหตุผลมากมายที่ทำไมการไม่มีการทดแทนอาจเป็นตัวเลือกที่ดีกว่า - อย่างน้อยสำหรับกรณีการใช้งานเฉพาะ ได้โปรดเถียงฉันด้วย!
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.