ให้โดยk -มิติเวกเตอร์สุ่มคือคอลเลกชันคงตำแหน่งของตัวแปรสุ่ม (ฟังก์ชั่นที่สามารถวัดได้จริง)x=(X1,...,Xj,...,Xk)k−
พิจารณาเวกเตอร์ดังกล่าวจำนวนมากบอกว่าและดัชนีเวกเตอร์เหล่านี้โดยฉัน= 1 , . . , nดังนั้นพูดni=1,...,n
และถือว่าเป็นคอลเลกชันที่เรียกว่า "ตัวอย่าง"S=( x 1 ,..., xฉัน ,.., x n ) จากนั้นเราก็โทรหากันk-
xi=(X1i,...,Xji,...,Xki)
S=(x1,...,xi,...,xn)k− มิติเวกเตอร์เป็น "การสังเกต" (แม้ว่าจริง ๆ แล้วมันจะกลายเป็นหนึ่งเดียวเมื่อเราวัดและบันทึกการรับรู้ของตัวแปรสุ่มที่เกี่ยวข้อง)
ก่อนอื่นเรามาพิจารณากรณีที่มีฟังก์ชั่นความน่าจะเป็นแบบมวล (PMF) หรือฟังก์ชันความหนาแน่นของความน่าจะเป็น (PDF) และฟังก์ชั่นร่วมดังกล่าว แสดงว่าโดย PMF ร่วมหรือ PDF ร่วมกันของแต่ละเวกเตอร์สุ่มและ F ( x 1 , . . . , xฉัน , . . . , x n ) PMF ร่วมกันหรือร่วมกันในรูปแบบ PDF ของเวกเตอร์เหล่านี้ร่วมกัน fi(xi),i=1,...,nf(x1,...,xi,...,xn)
จากนั้นตัวอย่างจะถูกเรียกว่า "ตัวอย่างอิสระ" หากมีความเท่าเทียมกันทางคณิตศาสตร์ต่อไปนี้:S
f(x1,...,xi,...,xn)=∏i=1nfi(xi),∀(x1,...,xi,...,xn)∈DS
ที่ เป็นโดเมนร่วมกันสร้างขึ้นโดยnเวกเตอร์สุ่ม / ข้อสังเกตDSn
ซึ่งหมายความว่า "การสังเกต" คือ "อิสระร่วมกัน", (ในแง่สถิติหรือ "อิสระในความน่าจะเป็น" ตามที่เคยเป็นคำพูดเก่าที่ยังคงเห็นในวันนี้บางครั้ง) นิสัยคือเรียกพวกเขาว่า "การสังเกตอย่างอิสระ"
โปรดทราบว่าคุณสมบัติความเป็นอิสระทางสถิติที่นี่อยู่เหนือดัชนีคือระหว่างการสังเกต มันไม่เกี่ยวข้องกับความสัมพันธ์ของความน่าจะเป็น / สถิติระหว่างตัวแปรสุ่มในแต่ละการสังเกต (ในกรณีทั่วไปเราปฏิบัติต่อที่นี่โดยที่การสังเกตแต่ละครั้งนั้นมีหลายมิติ)i
โปรดทราบว่าในกรณีที่เรามีตัวแปรสุ่มแบบต่อเนื่องโดยไม่มีความหนาแน่นสามารถแสดงข้างต้นในรูปของฟังก์ชันการแจกแจง
นี่คือสิ่งที่ "สังเกตอิสระ" หมายถึง มันเป็นคุณสมบัติที่กำหนดไว้อย่างแม่นยำแสดงในแง่คณิตศาสตร์ เรามาดูกันว่ามันมีความหมายอย่างไร
ผลกระทบบางประการของการสังเกตการณ์โดยอิสระ
A.หากการสังเกตสองครั้งเป็นส่วนหนึ่งของกลุ่มการสังเกตการณ์อิสระร่วมกันพวกเขาก็จะเป็น "อิสระคู่ที่ชาญฉลาด" (สถิติ)
f(xi,xm)=fi(xi)fm(xm)∀i≠m,i,m=1,...,n
นี่ก็หมายความว่า PMF / PDFs แบบมีเงื่อนไขนั้นเท่ากับ "ส่วนเพิ่ม"
f(xi∣xm)=fi(xi)∀i≠m,i,m=1,...,n
สิ่งนี้ทำให้เกิดข้อโต้แย้งเงื่อนไขหรือเงื่อนไขหลายอย่าง
ฉ( xผม, xℓ∣ xม.) = f( xผม, xℓ) ,ฉ( xผม∣ xม., xℓ) = fผม( xผม)
ฯลฯ ตราบใดที่ดัชนีทางด้านซ้ายแตกต่างจากดัชนีทางด้านขวาของเส้นแนวตั้ง
นี่ก็หมายความว่าถ้าเราสังเกตการสังเกตจริง ๆ หนึ่งความน่าจะเป็นที่บ่งบอกลักษณะการสังเกตอื่น ๆ ของตัวอย่างจะไม่เปลี่ยนแปลง ดังนั้นสำหรับการคาดการณ์ตัวอย่างอิสระไม่ใช่เพื่อนที่ดีที่สุดของเรา เราต้องการที่จะพึ่งพาเพื่อให้การสังเกตแต่ละครั้งสามารถช่วยเราพูดอะไรบางอย่างเกี่ยวกับการสังเกตอื่น ๆ
B.ในทางกลับกันตัวอย่างอิสระมีเนื้อหาข้อมูลสูงสุด ทุกการสังเกตมีความเป็นอิสระนำข้อมูลที่ไม่สามารถอนุมานได้ทั้งหมดหรือบางส่วนโดยการสังเกตอื่น ๆ ในตัวอย่าง ดังนั้นผลรวมทั้งหมดจึงสูงสุดเมื่อเปรียบเทียบกับตัวอย่างที่เปรียบเทียบได้ซึ่งมีการพึ่งพาทางสถิติระหว่างการสังเกต แต่ข้อมูลนี้มีประโยชน์อย่างไรหากไม่สามารถช่วยเราปรับปรุงการทำนายของเราได้
นี่ก็คือข้อมูลทางอ้อมเกี่ยวกับความน่าจะเป็นที่จะบอกลักษณะของตัวแปรสุ่มในตัวอย่าง ยิ่งการสังเกตเหล่านี้มีลักษณะทั่วไป (การกระจายความน่าจะเป็นทั่วไปในกรณีของเรา) ยิ่งเราอยู่ในตำแหน่งที่ดีกว่าที่จะเปิดเผยพวกเขาหากตัวอย่างของเราเป็นอิสระ
กล่าวอีกนัยหนึ่งหากตัวอย่างมีความเป็นอิสระและ "กระจายแบบเหมือนกัน" หมายถึง
ฉผม( xผม) = fม.( xม.) = f( x ) ,ฉัน≠ เมตร
มันเป็นตัวอย่างที่ดีที่สุดเพื่อให้ได้ข้อมูลเกี่ยวกับการไม่เพียง แต่การกระจายความน่าจะเป็นร่วมกันทั่วไปแต่ยังสำหรับการกระจายร่อแร่ของตัวแปรสุ่มที่ประกอบด้วยการสังเกตแต่ละพูดฉJ ( x J ฉัน ) ฉ( x )ฉJ( xJ ฉัน)
f(xi∣xm)=fi(xi)xi fi
ดังนั้นในเรื่องการประเมิน (ซึ่งบางครั้งใช้เป็นคำที่จับได้ทั้งหมด แต่ที่นี่มันควรจะแตกต่างจากแนวคิดของการทำนาย ) ตัวอย่างอิสระคือ "เพื่อนที่ดีที่สุด" ของเราถ้ามันถูกรวมเข้ากับ "คุณสมบัติ
C.นอกจากนี้ยังเป็นไปตามตัวอย่างอิสระของการสังเกตซึ่งแต่ละตัวมีลักษณะการกระจายความน่าจะเป็นที่แตกต่างกันโดยสิ้นเชิงโดยไม่มีลักษณะทั่วไปใด ๆ ทั้งสิ้นการรวบรวมข้อมูลที่ไร้ค่าเท่าที่จะทำได้ (แน่นอนว่าข้อมูลทุกชิ้นในตัวมันเองคือ สมควรปัญหาที่นี่คือที่นำมารวมกันเหล่านี้ไม่สามารถรวมกันเพื่อนำเสนอสิ่งที่มีประโยชน์) ลองนึกภาพตัวอย่างที่มีข้อสังเกตสามอย่าง: ผลไม้หนึ่งชนิดที่บรรจุ (ลักษณะเชิงปริมาณ) จากอเมริกาใต้อีกชิ้นหนึ่งบรรจุภูเขาจากยุโรปและอีกหนึ่งชิ้นบรรจุเสื้อผ้าจากเอเชีย ข้อมูลที่น่าสนใจน่าสนใจแบ่งออกเป็นสามส่วนด้วยกัน แต่ตัวอย่างไม่สามารถทำสิ่งใดในเชิงสถิติที่มีประโยชน์สำหรับเรา
ในอีกทางหนึ่งเงื่อนไขที่จำเป็นและเพียงพอสำหรับตัวอย่างอิสระที่จะเป็นประโยชน์คือการสังเกตมีลักษณะทางสถิติบางอย่างที่เหมือนกัน นี่คือสาเหตุที่ในสถิติคำว่า "ตัวอย่าง" ไม่ได้มีความหมายเหมือนกันกับ "การรวบรวมข้อมูล" โดยทั่วไป แต่เป็นการ "รวบรวมข้อมูลเกี่ยวกับเอนทิตีที่มีลักษณะทั่วไปบางอย่าง"
ประยุกต์ใช้กับตัวอย่างข้อมูลของ OP
การตอบสนองต่อการร้องขอจาก user @gung เรามาดูตัวอย่างของ OP ด้วยเหตุผลข้างต้น เราคิดอย่างสมเหตุสมผลว่าเราอยู่ในโรงเรียนที่มีครูมากกว่าสองคนและนักเรียนมากกว่าหกคน ดังนั้น a) เราสุ่มตัวอย่างทั้งนักเรียนและครูและ b) เรารวมไว้ในข้อมูลของเราตั้งเกรดที่สอดคล้องกับการรวมกันของนักเรียนครู
GPTS=(s1,...,s6)
s1=(T1,P1,G1)s2=(T1,P2,G2)s3=(T1,P3,G3)s3=(T2,P4,G4)s4=(T2,P5,G5)s5=(T2,P6,G6)
PiGi
T1,T2
s1,s2,s3T1s4,s5,s6T2
โปรดสังเกตความแตกต่างระหว่าง "ตัวแปรสุ่มแบบเดียวกัน" และ "ตัวแปรสุ่มสองตัวแปรที่มีการแจกแจงที่เหมือนกัน" อย่างระมัดระวัง
s1,s2,s3T1s4,s5,s6T2
สมมติว่าตอนนี้เราแยกตัวแปร "ครู" แบบสุ่มออกจากตัวอย่างของเราแล้ว ตัวอย่าง (นักเรียนเกรด) ของการสังเกตหกครั้งเป็นตัวอย่างอิสระหรือไม่
ที่นี่สมมติฐานที่เราจะทำเกี่ยวกับความสัมพันธ์เชิงโครงสร้างระหว่างครูนักเรียนและผลการเรียนเป็นอย่างไร
T1T2G1,G2,G3T1
แต่บอกว่าครูเหมือนกันในแง่นั้น จากนั้นภายใต้สมมติฐานที่ระบุไว้ "ครูมีอิทธิพลต่อนักเรียน" เรามีอีกครั้งว่าการสังเกตสามครั้งแรกขึ้นอยู่กับแต่ละอื่น ๆ เพราะครูมีอิทธิพลต่อนักเรียนที่มีอิทธิพลต่อคะแนนและเรามาถึงผลลัพธ์เดียวกันแม้ว่าในกรณีนี้ทางอ้อม อีกสาม) ดังนั้นอีกตัวอย่างไม่เป็นอิสระ
กรณีของเพศ
GeM,F
s1=(Ge1,P1,G1)s2=(Ge2,P2,G2)s3=(Ge3,P3,G3)s3=(Ge4,P4,G4)s4=(Ge5,P5,G5)s5=(Ge6,P6,G6)
หมายเหตุอย่างรอบคอบว่าสิ่งที่เรารวมอยู่ในคำอธิบายของกลุ่มตัวอย่างที่เป็นเรื่องที่เกี่ยวกับเพศที่เป็นไม่ได้ค่าที่แท้จริงว่าจะใช้เวลาสำหรับนักเรียนแต่ละแต่ตัวแปรสุ่ม "เพศ" มองกลับไปที่จุดเริ่มต้นของคำตอบนี้นานมาก: ตัวอย่างที่ไม่ได้กำหนดไว้เป็นคอลเลกชันของตัวเลข (หรือคงที่ค่าตัวเลขหรือไม่ทั่วไป) แต่เป็นคอลเลกชันของตัวแปรสุ่ม (เช่นฟังก์ชั่น)
Gei1Ge1P2,P3,...ถ้าอย่างนั้นมันก็เป็นอีกแหล่งที่น่าเชื่อถือระหว่างการสังเกตการณ์ ในที่สุดเพศของนักเรียนมีอิทธิพลโดยตรงต่อคะแนนของนักเรียนอื่นหรือไม่? หากเรายืนยันว่าไม่เป็นเช่นนั้นเราจะได้รับตัวอย่างที่เป็นอิสระ (มีเงื่อนไขสำหรับนักเรียนทุกคนที่มีครูคนเดียวกัน)