คำพ้องความหมาย“ ตัวอย่างสุ่ม” และ“ ตัวแปรสุ่ม iid” หรือไม่


18

ฉันได้รับความยากลำบากในการทำความเข้าใจความหมายของ "ตัวอย่างแบบสุ่ม" เช่นเดียวกับ "ตัวแปรแบบสุ่มของ iid" ฉันพยายามหาความหมายจากหลาย ๆ แหล่ง แต่สับสนมากขึ้นเรื่อย ๆ ฉันโพสต์ที่นี่สิ่งที่ฉันพยายามและได้รู้:

ความน่าจะเป็นและสถิติของ Degroot บอกว่า:

ตัวอย่างสุ่ม / IID / ตัวอย่างขนาด: พิจารณากระจายความน่าจะได้รับในบรรทัดจริงที่สามารถแสดงโดยทั้ง PF หรือไฟล์ PDF ฉได้มีการกล่าวกันว่าตัวแปรสุ่มรูปแบบตัวอย่างที่สุ่มจากการกระจายนี้ถ้าตัวแปรสุ่มเหล่านี้มีความเป็นอิสระและ PF ร่อแร่หรือ PDF ของแต่ละของพวกเขาคือฉตัวแปรสุ่มดังกล่าวถูกกล่าวถึงว่ามีความเป็นอิสระและมีการกระจายเหมือนกันโดยย่อ iid เราอ้างถึงหมายเลข n ของตัวแปรสุ่มเป็นขนาดตัวอย่างn X 1 , . . , X n ffnX1,...,Xn

แต่หนึ่งในหนังสือสถิติอื่น ๆ ที่ฉันได้พูดไป:

ในการสุ่มตัวอย่างเรารับประกันว่าทุกหน่วยในประชากรจะได้รับโอกาส (ความน่าจะเป็น) ในการถูกเลือกเท่ากัน

ดังนั้นฉันรู้สึกว่า iids เป็นองค์ประกอบที่สร้างกลุ่มตัวอย่างแบบสุ่มและขั้นตอนการมีกลุ่มตัวอย่างแบบสุ่มคือการสุ่มตัวอย่าง ฉันถูกไหม?

PS: ฉันสับสนมากเกี่ยวกับหัวข้อนี้ดังนั้นฉันจะขอบคุณคำตอบที่ซับซ้อน ขอบคุณ


6
อิสระเป็นส่วนหนึ่งที่สำคัญมากเพราะเราจะได้มีตัวอย่างที่ตัวแปรทั้งหมดจะกระจายเหมือนกัน (มีการกระจายร่อแร่เดียวกัน) แต่ไม่ได้เป็นอิสระ ตัวอย่างดังกล่าวยังสามารถพิจารณาเป็นตัวอย่างแบบสุ่มแต่ไม่ใช่จากการทดสอบที่คุณคิดว่าเป็นตัวอย่างแบบสุ่มของ ดูคำถามนี้
Dilip Sarwate

คำถามดูเหมือนจะไม่สมเหตุสมผล ตัวอย่าง iid และสุ่มเป็นแนวคิดที่แตกต่างอย่างชัดเจนซึ่งกำหนดขึ้นโดยผู้มีความรู้
Subhash C. Davar

2
@ subhashc.davar พวกเขาเหรอ? ตามคำจำกัดความหนึ่ง: "ตัวอย่างสุ่มคือลำดับของตัวแปรสุ่มแบบอิสระ (IID) แบบกระจายที่เหมือนกัน" ดังนั้นดูเหมือนว่า iid และกลุ่มตัวอย่างแบบสุ่มจะเหมือนกันหรือ ย่อหน้าที่อ้างถึงในความน่าจะเป็นและสถิติของ Degroot นั้นโดยทั่วไปแล้วจะบอกว่าเหมือนกัน ฉันคิดว่ามันสับสนเพราะ "ตัวอย่าง" บางครั้งเป็นรายบุคคลหรือกลุ่มบุคคลและบางครั้งก็เป็นลำดับตัวแปรสุ่ม
Gary Chang

@Gary Chang คำจำกัดความที่คุณอ้างถึงเกี่ยวข้องกับ pdf ตัวอย่างของตัวแปรสุ่มได้รับความนิยมในสาขาวิชาจิตวิทยา โดยทั่วไปจะใช้กับการอ้างอิงถึงความน่าเชื่อถือหรือการประเมินความถูกต้องและการวิเคราะห์ปัจจัย Psychometry มีความสนใจในการสร้างความเท่าเทียมกันของการทดสอบสำหรับโดเมน แนวคิดของ iid นั้นเกิดจากพีชคณิตเชิงเส้น ตัวอย่างอาจมาจากประชากรที่กำหนดของบุคคลและ / หรือจากประชากรของตัวแปร (สุ่ม) ขึ้นอยู่กับวัตถุประสงค์ของการศึกษา สถิติในปัจจุบันดูเหมือนว่ายืมมาจากทฤษฎีการวัด
Subhash C. Davar

คำตอบ:


9

คุณไม่พูดในสิ่งที่หนังสือเล่มสถิติอื่น ๆ แต่ฉันเดาว่ามันเป็นหนังสือ (หรือส่วน) เกี่ยวกับประชากรสุ่มตัวอย่าง จำกัด

เมื่อคุณสุ่มตัวแปรสุ่มนั่นคือเมื่อคุณพิจารณาชุด ของตัวแปรสุ่มnคุณจะรู้ว่าถ้ามันเป็นอิสระf ( x 1 , , x n ) = f ( x 1 ) X1,...,Xnnและการกระจายตัวเหมือนกัน(x1,...,xn)=(x1)(xn)โดยเฉพาะและ Var ( X i )E(Xi)=μสำหรับฉันทั้งหมดจากนั้น: ¯ X = ฉันX iVar(Xi)=σ2i โดยที่σ2คือช่วงเวลากลางที่สอง

X¯=ผมXผมn,E(X¯)=μ,var(X¯)=σ2n
σ2

การสุ่มตัวอย่างประชากร จำกัด ค่อนข้างแตกต่างกัน หากประชากรมีขนาดในการสุ่มตัวอย่างโดยไม่มีการแทนที่จะมี( Nยังไม่มีข้อความตัวอย่างที่เป็นไปได้siของขนาดnและพวกมันสามารถจัดเรียงได้: p(si)=1(ยังไม่มีข้อความn)sผมn ตัวอย่างเช่นถ้าN=5และn=3พื้นที่ตัวอย่างคือ{s1,,s10} และตัวอย่างที่เป็นไปได้คือ: s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4

พี(sผม)=1(ยังไม่มีข้อความn)ผม=1,...,(ยังไม่มีข้อความn)
ยังไม่มีข้อความ=5n=3{s1,...,s10} หากคุณนับจำนวนการปรากฏของแต่ละคนคุณจะเห็นว่ามันคือหกนั่นคือแต่ละคนมีจำนวนเท่ากัน (6/10) ดังนั้นแต่ละsiเป็นตัวอย่างแบบสุ่มตามคำจำกัดความที่สอง ประมาณนั้นไม่ใช่ตัวอย่างสุ่มของ iid เพราะแต่ละคนไม่ใช่ตัวแปรสุ่ม: คุณสามารถประมาณE[X]โดยค่าเฉลี่ยตัวอย่าง แต่จะไม่ทราบค่าที่แน่นอน แต่คุณสามารถทราบค่าเฉลี่ยประชากรที่แน่นอนถ้าn=N(ให้ ฉันพูดซ้ำ: ประมาณ)
s1={1,2,3},s2={1,2,4},s3={1,2,5},s4={1,3,4},s5={1,3,5},s6={1,4,5},s7={2,3,4},s8={2,3,5},s9={2,4,5},s10={3,4,5}
siE[X]n=N1

μn<Nμ

Y¯s=Σผม=1nYผม,E(Y¯s)=μ
var(Y¯s)=σ~2n(1-nยังไม่มีข้อความ)
σ~2Σผม=1ยังไม่มีข้อความ(Yผม-Y¯)2ยังไม่มีข้อความ-1(1-n/ยังไม่มีข้อความ)เรียกอีกอย่างว่า " ปัจจัยการแก้ไขประชากรอัน จำกัด "

นี่คือตัวอย่างด่วนของวิธีสุ่ม (สุ่มตัวแปร) iid สุ่มตัวอย่างและสุ่มประชากร (จำกัด แน่นอน) อาจแตกต่างกัน การอนุมานทางสถิติส่วนใหญ่เกี่ยวกับการสุ่มตัวอย่างตัวแปรสุ่มทฤษฎีการสุ่มตัวอย่างเป็นเรื่องเกี่ยวกับการสุ่มตัวอย่างประชากร จำกัด


1สมมติว่าคุณกำลังผลิตหลอดไฟและต้องการทราบอายุขัยเฉลี่ยของพวกเขา "ประชากร" ของคุณเป็นเพียงทฤษฎีหรือเสมือนอย่างน้อยถ้าคุณยังคงผลิตหลอดไฟ ดังนั้นคุณต้องสร้างแบบจำลองกระบวนการสร้างข้อมูลและสอดแทรกชุดหลอดไฟเป็นตัวอย่าง (ตัวแปรสุ่ม) สมมติว่าคุณพบกล่องไฟ 1,000 หลอดแล้วและต้องการทราบอายุขัยเฉลี่ยของพวกเขา คุณสามารถเลือกชุดหลอดไฟขนาดเล็ก (ตัวอย่างประชากรที่มีขอบเขต จำกัด ) แต่คุณสามารถเลือกได้ทั้งหมด หากคุณเลือกตัวอย่างขนาดเล็กสิ่งนี้จะไม่เปลี่ยนหลอดไฟเป็นตัวแปรสุ่ม: คุณจะสร้างตัวแปรแบบสุ่มเนื่องจากตัวเลือกระหว่าง "ทั้งหมด" และ "ชุดเล็ก" ขึ้นอยู่กับคุณ อย่างไรก็ตามเมื่อประชากรที่ จำกัด มีขนาดใหญ่มาก (กล่าวว่าประชากรในประเทศของคุณ) เมื่อเลือก "ทั้งหมด" จะไม่สามารถใช้งานได้สถานการณ์ที่สองจะได้รับการจัดการที่ดีกว่าเป็นครั้งแรก


1
คุณหมายถึง "บุคคลไม่ใช่ตัวแปรสุ่ม" Whuber มีคำตอบที่ดีจริงๆที่นี่และที่นี่ซึ่งใช้การสุ่มตัวอย่างประชากรจำนวน จำกัด เพื่ออธิบายแนวคิดของตัวแปรสุ่ม
jsk

ฉันหมายถึงสิ่งที่ฉันพูด: ถ้า n=ยังไม่มีข้อความ ไม่มีความไม่แน่นอน
Sergio

นั่นไม่ได้เป็นประโยชน์ในการชี้แจงคำแถลงของคุณที่ดูเหมือนจะขัดแย้งโดยตรงกับที่ทำในลิงค์ โปรดไม่จำเป็นต้องมีการป้องกัน ประเด็นเกี่ยวกับn=ยังไม่มีข้อความไม่มีอะไรเกี่ยวข้องกับคำพูดที่ฉันอยากรู้ นอกจากนี้ตัวแปรสุ่มที่เสื่อมลงไม่ใช่ตัวแปรสุ่มหรือไม่
jsk

ป้องกัน? คุณไม่เข้าใจลิงก์เหล่านั้น ตามที่ whubner กล่าวว่า a) รูปแบบตั๋วในกล่องเป็นเพียงตัวอย่างของเล่นเพื่อหลีกเลี่ยง "นี่คือสิ่งที่ระดับบัณฑิตศึกษา" บ่น; b) เขาหลีกเลี่ยงการเรียก "ประชากร" ตั๋วในกล่องและอธิบายว่าทำไม ดังนั้นจึงไม่มีความขัดแย้ง หากใครสามารถเข้าใจสิ่งที่ผู้พูดได้พูด BTW ฉันไม่ใช่ตัวแปรสุ่มหรอก
Sergio

IMHO แน่นอน
Sergio

2

ฉันจะไม่ทำให้คุณเบื่อกับคำจำกัดความความน่าจะเป็นและสูตรที่คุณสามารถหยิบได้ง่ายในตำราเรียนใด ๆ (หรือที่นี่เป็นจุดเริ่มต้นที่ดี)

แค่คิดอย่างสังหรณ์ใจตัวอย่างแบบสุ่มคือชุดของค่าสุ่ม โดยทั่วไปค่าแต่ละค่าอาจมีการกระจายตัวเหมือนกันหรือแตกต่างกันผม.ผม.d.sample เป็นกรณีพิเศษของกลุ่มตัวอย่างแบบสุ่มซึ่งค่าทุกค่ามาจากการแจกแจงแบบเดียวกับค่าอื่น ๆ และค่าของมันไม่มีผลต่อค่าอื่น ๆ ข้อตกลงอิสรภาพกับชั่วโมงโอW ค่าที่ถูกสร้างขึ้น

ผม.ผม.dตัวอย่าง: จั่วไพ่แบบสุ่มจากสำรับแล้วคืนกลับ (ทำ 5 ครั้ง) คุณจะได้รับ 5 ค่าตระหนัก (การ์ด) แต่ละค่าเหล่านี้มาจากการแจกแจงแบบเดียวกัน (มีความน่าจะเป็นเท่ากันที่จะได้ผลลัพธ์แต่ละอย่าง) และการจับสลากแต่ละครั้งนั้นไม่ขึ้นอยู่กับคนอื่น ๆ (เช่นความจริงที่ว่าคุณได้รับเอซโพดำในการจับครั้งแรก ไม่ว่าด้วยวิธีใดผลลัพธ์ที่คุณอาจได้รับจากการจับฉลากอื่น ๆ )

ไม่ใช่ ผม.ผม.d.ตัวอย่าง: ทำสิ่งเดียวกัน แต่ไม่ส่งการ์ดกลับไปที่เด็ค (ฉันหวังว่าคุณจะเติมความแตกต่างในตอนนี้) อีกครั้งคุณจะมี 5 ค่า (การ์ด) ที่รับรู้หลังจากคุณทำเช่นนี้ แต่เห็นได้ชัดว่ามันขึ้นอยู่กับ (ความจริงที่ว่าคุณวาดเอซโพดำในการจับครั้งแรกหมายความว่าคุณจะไม่มีโอกาสได้เข้าร่วมในการจับครั้งที่ 2)


1

ตัวแปรสุ่มมักจะเขียน X เป็นตัวแปรที่มีค่าที่เป็นไปได้คือผลลัพธ์เชิงตัวเลขของปรากฏการณ์สุ่ม ปรากฏการณ์สุ่มอาจสร้างผลลัพธ์ที่มีค่าตัวเลขที่จับโดยตัวแปรสุ่ม - จำนวนหัวในการโยน 10 เหรียญหรือรายได้ / ความสูง ฯลฯ ในตัวอย่าง - แต่นั่นไม่จำเป็น
โดยทั่วไปตัวแปรสุ่มเป็นฟังก์ชันที่แมปผลลัพธ์แบบสุ่มกับค่าตัวเลข เช่นในแต่ละวันอาจมีแดดมีเมฆมากหรือมีฝนตก เราสามารถกำหนดตัวแปรแบบสุ่มที่ใช้ค่า 1 ถ้ามันเป็นฝน 2 ถ้ามันมีเมฆและ 3 ถ้ามันมีแดด โดเมนของตัวแปรสุ่มคือชุดของผลลัพธ์ที่เป็นไปได้
ในการสร้างตัวแปรสุ่มต้องมีกระบวนการหรือการทดสอบที่เกี่ยวข้องกับผลลัพธ์ที่เป็นไปได้ที่ไม่สามารถคาดการณ์ได้ด้วยความแน่นอน

มาถึงตอนนี้เพื่อความเป็นอิสระ ตัวแปรสุ่มสองตัวมีความเป็นอิสระหากค่าของหนึ่งในนั้นไม่มีผลกับ PDF ของอีกชุด เราไม่แก้ไขการทำนายของเราเกี่ยวกับความน่าจะเป็นของค่าที่แตกต่างกันของตัวแปรหนึ่งเมื่อเรารู้อะไรเกี่ยวกับตัวแปรอื่น ดังนั้นในกรณีที่เป็นอิสระไฟล์ PDF หลังนั้นเหมือนกับไฟล์ PDF ก่อนหน้า เช่นเมื่อเราโยนเหรียญที่ไม่เอนเอียงซ้ำ ๆ ข้อมูลที่เรามีเกี่ยวกับผลลัพธ์ของการทอยก่อนหน้า 5 ครั้งนั้นไม่ส่งผลกระทบต่อการทำนายของเราเกี่ยวกับการทอยปัจจุบันมันจะเป็น 0.5 เสมอ อย่างไรก็ตามหากไม่ทราบความเอนเอียงของเหรียญและถูกจำลองเป็นตัวแปรสุ่มผลลัพธ์ของการทอย 5 ครั้งก่อนหน้านี้จะส่งผลต่อการคาดการณ์ของเราเกี่ยวกับการโยนปัจจุบัน

มาถึงประเด็นเรื่องการสุ่มตัวอย่าง จุดประสงค์ของการสุ่มตัวอย่างคือเพื่อแจ้งให้เราทราบเกี่ยวกับคุณสมบัติของการแจกแจงต้นแบบที่ไม่ทราบและจะต้องอนุมาน โปรดจำไว้ว่าการกระจายหมายถึงความเป็นไปได้ที่สัมพันธ์กันของผลลัพธ์ที่เป็นไปได้ในพื้นที่ตัวอย่าง (ซึ่งอาจเป็นเอกภพตามเงื่อนไข) ดังนั้นเมื่อเราสุ่มตัวอย่างเราเลือกผลลัพธ์จำนวน จำกัด จากพื้นที่ตัวอย่างและเราทำซ้ำพื้นที่ตัวอย่างในระดับที่จัดการได้น้อยกว่า ความน่าจะเป็นเท่ากับนั้นหมายถึงกระบวนการของการสุ่มตัวอย่างไม่ใช่ความน่าจะเป็นของผลลัพธ์ในตัวอย่าง การสุ่มตัวอย่างความน่าจะเป็นเท่ากับหมายความว่าตัวอย่างจะสะท้อนสัดส่วนของผลลัพธ์ในพื้นที่ตัวอย่างดั้งเดิม เช่นถ้าเราถาม 10 ผู้คนกว่าพันคนถ้าพวกเขาถูกจับกุมเป็นไปได้ว่าตัวอย่างที่เราจะลงเอยนั้นจะไม่ได้เป็นตัวแทนของกลุ่มประชากร - พื้นที่ตัวอย่าง - เนื่องจากคนที่ถูกจับกุมอาจปฏิเสธที่จะตอบดังนั้นสัดส่วนของผลลัพธ์ที่เป็นไปได้ (ถูกจับ - ไม่ถูกจับกุม) จะแตกต่างกันระหว่างกลุ่มตัวอย่างกับประชากรด้วยเหตุผลที่เป็นระบบ หรือถ้าเราเลือกพื้นที่ใกล้เคียงเพื่อทำการสำรวจผลลัพธ์จะไม่เป็นตัวแทนของเมืองโดยรวม การสุ่มตัวอย่างความน่าจะเป็นที่เท่ากันนั้นหมายความว่าไม่มีเหตุผลที่เป็นระบบ - นอกเหนือจากการสุ่มแบบบริสุทธิ์ - ที่ทำให้เราเชื่อว่าสัดส่วนของผลลัพธ์ที่เป็นไปได้ในตัวอย่างของเรานั้นแตกต่างจากสัดส่วนของผลลัพธ์ในพื้นที่ประชากร / ตัวอย่าง ดังนั้นสัดส่วนของผลลัพธ์ที่เป็นไปได้ (ถูกจับ - ไม่ถูกจับกุม) จะแตกต่างกันระหว่างกลุ่มตัวอย่างของเรากับประชากรด้วยเหตุผลที่เป็นระบบ หรือถ้าเราเลือกพื้นที่ใกล้เคียงเพื่อทำการสำรวจผลลัพธ์จะไม่เป็นตัวแทนของเมืองโดยรวม การสุ่มตัวอย่างความน่าจะเป็นที่เท่ากันนั้นหมายความว่าไม่มีเหตุผลที่เป็นระบบ - นอกเหนือจากการสุ่มแบบบริสุทธิ์ - ที่ทำให้เราเชื่อว่าสัดส่วนของผลลัพธ์ที่เป็นไปได้ในตัวอย่างของเรานั้นแตกต่างจากสัดส่วนของผลลัพธ์ในพื้นที่ประชากร / ตัวอย่าง ดังนั้นสัดส่วนของผลลัพธ์ที่เป็นไปได้ (ถูกจับ - ไม่ถูกจับกุม) จะแตกต่างกันระหว่างกลุ่มตัวอย่างของเรากับประชากรด้วยเหตุผลที่เป็นระบบ หรือถ้าเราเลือกพื้นที่ใกล้เคียงเพื่อทำการสำรวจผลลัพธ์จะไม่เป็นตัวแทนของเมืองโดยรวม การสุ่มตัวอย่างความน่าจะเป็นที่เท่ากันนั้นหมายความว่าไม่มีเหตุผลที่เป็นระบบ - นอกเหนือจากการสุ่มแบบบริสุทธิ์ - ที่ทำให้เราเชื่อว่าสัดส่วนของผลลัพธ์ที่เป็นไปได้ในตัวอย่างของเรานั้นแตกต่างจากสัดส่วนของผลลัพธ์ในพื้นที่ประชากร / ตัวอย่าง


-2

สุ่มตัวอย่างคือสำนึกของลำดับของตัวแปรสุ่ม ตัวแปรสุ่มเหล่านั้นอาจเป็น iid หรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.