คำถามนี้ได้มาจากคำถามนี้เกี่ยวกับ".632 Rule" ฉันกำลังเขียนโดยมีการอ้างอิงโดยเฉพาะกับคำตอบ / สัญกรณ์ของ user603 เท่าที่มันง่ายขึ้นเรื่อง
คำตอบที่ขึ้นต้นด้วยตัวอย่างที่มีขนาดด้วยการเปลี่ยนจากรายการที่แตกต่างกันในคอลเลกชัน (โทร) มัน N. ความน่าจะเป็นว่าตัวอย่างจะแตกต่างจากองค์ประกอบเฉพาะของ N คือแล้ว
ในคำตอบนั้นองค์ประกอบทั้งหมดของ N มีโอกาสเท่าเทียมกันในการถูกสุ่มจับ
คำถามของฉันคือ: สมมติว่าในคำถามข้างต้นรายการที่จะวาดนั้นเป็นสิ่งที่พวกเขามีการกระจายตามปกติ นั่นคือเราแบ่งเส้นโค้งปกติมาตรฐานจากถึงเป็น (พูด) 100 ช่วงเวลาที่มีความยาวเท่ากัน แต่ละรายการ 100 ใน N มีความน่าจะเป็นที่จะถูกดึงที่เท่ากับพื้นที่ subtended โดยเส้นโค้งในช่วงเวลาที่เกี่ยวข้อง
ความคิดของฉันเป็นดังนี้:
การให้เหตุผลมีความคล้ายคลึงกับคำตอบที่ฉันคิดไว้ ความน่าจะเป็นที่โดยที่เป็นองค์ประกอบของ N คือซึ่งคือความน่าจะเป็นของการวาด
ความน่าจะเป็นที่องค์ประกอบเฉพาะ m อยู่ในตัวอย่าง S ของขนาด n คือ
= 1 - n Π 1 ( 1 - F ฉัน )
ดูเหมือนว่าการคำนวณจะแสดงให้เห็นว่าเมื่อความยาวของช่วงย่อยมีขนาดเล็กคำตอบก็จะรวมเป็นจำนวนเดียวกันกับในกรณีแรก (ความน่าจะเป็นที่เท่ากันทั้งหมด)
สิ่งนี้ดูเหมือนจะเป็นเรื่องง่าย (สำหรับฉัน) เพราะการก่อสร้างดูเหมือนจะโยนองค์ประกอบของ N ซึ่งหายากดังนั้นฉันคาดว่าจะมีจำนวนน้อยกว่า. 632
นอกจากนี้ถ้านี่ถูกต้องฉันคิดว่าเราคงมี
ซึ่งฉันยังไม่รู้ว่าเป็นจริงหรือเท็จ
แก้ไข: ถ้าเป็นจริงมันอาจจะพูดทั่วไป
ขอบคุณสำหรับข้อมูลเชิงลึกใด ๆ