ในชั้นเรียนของฉันฉันใช้สถานการณ์ที่ "เรียบง่าย" ที่อาจช่วยให้คุณสงสัยและอาจพัฒนาความรู้สึกที่มีต่ออิสรภาพในระดับที่อาจหมายถึง
มันเป็นวิธีการ "Forrest Gump" กับเรื่อง แต่มันก็คุ้มค่าที่จะลอง
พิจารณาคุณมี 10 ข้อสังเกตอิสระที่มาทางด้านขวาจากประชากรปกติที่มีค่าเฉลี่ยและความแปรปรวนเป็นที่รู้จักX1,X2,…,X10∼N(μ,σ2)μσ2
สังเกตของคุณนำมาให้คุณข้อมูลรวมทั้งเกี่ยวกับและ 2 ท้ายที่สุดการสังเกตของคุณมีแนวโน้มที่จะแพร่กระจายไปรอบ ๆ ค่ากลางเดียวซึ่งควรใกล้เคียงกับค่าจริงและไม่รู้จักและเช่นเดียวกันหากสูงหรือต่ำมากคุณก็คาดหวังว่าจะเห็นการสังเกตการณ์ของคุณ รวบรวมค่าสูงหรือต่ำมากตามลำดับ "การแทนที่" ที่ดีอย่างหนึ่งสำหรับ (หากไม่มีความรู้เกี่ยวกับมูลค่าที่แท้จริง) คือซึ่งเป็นค่าเฉลี่ยของการสังเกตของคุณ μσ2μμμX¯
นอกจากนี้หากการสังเกตของคุณอยู่ใกล้กันมากนั่นเป็นข้อบ่งชี้ว่าคุณสามารถคาดหวังว่าจะต้องเล็กและในทำนองเดียวกันถ้ามีขนาดใหญ่มากคุณสามารถคาดหวังว่าจะเห็นคุณค่าที่แตกต่างกัน สำหรับเพื่อ{10} σ2σ2X1X10
หากคุณต้องเดิมพันค่าจ้างรายสัปดาห์ซึ่งควรเป็นค่าจริงของและคุณจะต้องเลือกคู่ของค่าที่คุณจะเดิมพันเงินของคุณ อย่าคิดว่าจะเป็นอะไรที่น่าทึ่งเท่ากับเสียเงินจากเช็คของคุณจนกว่าคุณจะเดาอย่างถูกต้องจนกระทั่งตำแหน่งทศนิยมที่ 200 Nope ลองนึกถึงระบบการให้ผลตอบแทนที่ยิ่งคาดเดาและยิ่งคุณได้รับรางวัลมากเท่าไหร่μσ2μμσ2
ในความรู้สึกบางอย่างที่ดีกว่ามีข้อมูลมากขึ้นและสุภาพมากขึ้นเดาของคุณสำหรับค่า 's อาจจะX ในความรู้สึกที่คุณประเมินว่าจะต้องเป็นค่าบางอย่างรอบX ในทำนองเดียวกันหนึ่งที่ดี "แทน" สำหรับ (ไม่จำเป็นสำหรับตอนนี้) เป็นแปรปรวนตัวอย่างของคุณซึ่งจะทำให้ประมาณการที่ดีสำหรับ\μX¯μX¯σ2S2σ
หากคุณเชื่อว่าสารทดแทนเหล่านั้นเป็นค่าที่แท้จริงของและคุณอาจจะผิดเพราะเพรียวบางเป็นโอกาสที่คุณโชคดีมากที่การสังเกตการณ์ของคุณประสานงานเพื่อให้คุณได้รับของขวัญเท่ากับและเท่ากับ 2 ไม่หรอกมันอาจจะไม่เกิดขึ้นμσ2X¯μS2σ2
แต่คุณอาจจะอยู่ในระดับที่แตกต่างของความผิดแตกต่างไปจากผิดเล็กน้อยไปสู่ความจริงผิดอย่างน่าสังเวชจริงๆ (อาคาลาบายลาเช็คเงินเดือนสัปดาห์หน้าคุณ!)
ตกลงขอบอกว่าคุณเอาเป็นเดาของคุณสำหรับ\พิจารณาเพียงแค่สองสถานการณ์:และSในตอนแรกการสังเกตของคุณนั่งสวยและใกล้กัน ในระยะหลังการสังเกตของคุณแตกต่างกันไป ในสถานการณ์ใดที่คุณควรคำนึงถึงความสูญเสียที่อาจเกิดขึ้น หากคุณคิดถึงสิ่งที่สองคุณคิดถูก การที่มีการประมาณเปลี่ยนความเชื่อมั่นของคุณในการเดิมพันของคุณอย่างมีเหตุผลมากสำหรับใหญ่กว่านั้นคือยิ่งคุณคาดหวังว่าจะแปรปรวนมากขึ้นX¯μS2=2S2=20,000,000σ2σ2X¯
แต่นอกเหนือจากข้อมูลเกี่ยวกับและการสังเกตของคุณยังดำเนินการจำนวนเงินบางส่วนของความผันผวนสุ่มบริสุทธิ์เพียงที่ไม่ได้ให้ข้อมูลเกี่ยวกับค่ามิได้เกี่ยวกับ 2 μσ2μσ2
คุณจะสังเกตเห็นได้อย่างไร
ดีสมมติว่าเพื่อประโยชน์ในการโต้แย้งว่ามีพระเจ้าและว่าเขามีเวลาว่างพอที่จะให้ตัวเองเอาจริงเอาจังของบอกคุณโดยเฉพาะจริง (และอื่น ๆ ที่ไม่รู้จักไกล) ค่าของทั้งสองและ\μσ
และนี่คือพล็อตเรื่องน่ารำคาญที่บิดเบี้ยวเรื่องนี้: เขาบอกคุณหลังจากที่คุณวางเดิมพัน บางทีอาจจะให้ความกระจ่างแก่คุณเพื่อเตรียมคุณหรืออาจจะทำให้คุณเยาะเย้ย คุณจะรู้ได้อย่างไร
นั่นทำให้ข้อมูลเกี่ยวกับและมีอยู่ในการสังเกตของคุณไม่มีประโยชน์เลยในตอนนี้ ตำแหน่งศูนย์กลางและความแปรปรวนของสังเกตการณ์ไม่มีความช่วยเหลือใด ๆ ที่จะเข้าใกล้ค่าที่แท้จริงของและอีกต่อไปเพราะคุณรู้แล้วμσ2X¯S2μσ2
ข้อดีอย่างหนึ่งของการทำความคุ้นเคยกับพระเจ้าคือการที่คุณรู้ว่าคุณไม่สามารถเดาได้อย่างถูกต้องโดยใช้นั่นคือข้อผิดพลาดในการประมาณของคุณμX¯(X¯−μ)
อืมเนื่องจากจากนั้น (เชื่อฉันเถอะถ้าคุณต้องการ), (ตกลงเชื่อฉันในเรื่องนั้นด้วย) และในที่สุด
(เดาอะไรไว้วางใจผมในการที่หนึ่งเช่นกัน) ซึ่งดำเนินการอย่างไม่มีข้อมูลเกี่ยวกับหรือ 2Xi∼N(μ,σ2)X¯∼N(μ,σ2/10)(X¯−μ)∼N(0,σ2/10)
X¯−μσ/10−−√∼N(0,1)
μσ2
คุณรู้อะไรไหม? ถ้าคุณเอาใด ๆ ของการสังเกตของแต่ละบุคคลเป็นเดาสำหรับข้อผิดพลาดการประมาณค่าของคุณจะกระจายเป็น2) ทีนี้ระหว่างการประมาณกับและใด ๆการเลือกจะเป็นธุรกิจที่ดีกว่าเพราะดังนั้นมีแนวโน้มที่จะหลงทางจากน้อยกว่าเดี่ยวๆμ(Xi−μ)N(0,σ2)μX¯XiX¯Var(X¯)=σ2/10<σ2=Var(Xi)X¯μXi
อย่างไรก็ตามก็ไม่ให้ข้อมูลเกี่ยวกับหรืออย่างแน่นอน(Xi−μ)/σ∼N(0,1)μσ2
เรื่องนี้จะจบลงไหม? คุณอาจจะคิด คุณอาจกำลังคิดว่า "มีความผันผวนแบบสุ่มอีกหรือไม่ที่ไม่ให้ข้อมูลเกี่ยวกับและ ?"μσ2
[ฉันชอบที่จะคิดว่าคุณกำลังคิดถึงสิ่งหลัง]
ใช่แล้ว!
กำลังสองของข้อผิดพลาดการประมาณค่าของคุณสำหรับกับหารด้วย ,
มีการแจกแจงแบบ Chi-squared ซึ่งเป็นการกระจายของจตุของมาตรฐานปกติซึ่งฉันแน่ใจว่าคุณสังเกตเห็นว่ามีอย่างแน่นอน ไม่มีข้อมูลเกี่ยวกับหรือแต่ให้ข้อมูลเกี่ยวกับความแปรปรวนที่คุณควรคาดหวังμXiσ
(Xi−μ)2σ2=(Xi−μσ)2∼χ2
Z2Z∼N(0,1)μσ2
นั่นคือการกระจายที่รู้จักกันดีที่เกิดขึ้นตามธรรมชาติจากสถานการณ์การพนันของคุณสำหรับทุก ๆ การสังเกตของคุณและจากค่าเฉลี่ยของคุณ:
และจากการรวบรวมการเปลี่ยนแปลงสิบข้อสังเกตของคุณ:
ตอนนี้ผู้ชายคนสุดท้ายไม่มีการกระจายตัวแบบไคสแควร์เพราะเขาเป็นผลรวมของการแจกแจงแบบไคสแควร์สิบตัวพวกเขาทั้งหมดเป็นอิสระจากกัน (เพราะเช่นนั้นคือ
(X¯−μ)2σ2/10=(X¯−μσ/10−−√)2=(N(0,1))2∼χ2
∑i=110(Xi−μ)2σ2/10=∑i=110(Xi−μσ/10−−√)2=∑i=110(N(0,1))2=∑i=110χ2.
X1,…,X10) หนึ่งในการแจกแจงแบบไคสแควร์เดี่ยวแต่ละอันนั้นมีส่วนร่วมอย่างใดอย่างหนึ่งต่อจำนวนความแปรปรวนแบบสุ่มที่คุณควรคาดหวังว่าจะได้รับ
มูลค่าของการบริจาคแต่ละครั้งไม่เท่ากับในเชิงคณิตศาสตร์เท่ากับอีกเก้าคน แต่ทั้งหมดนี้มีพฤติกรรมที่คาดหวังไว้เหมือนกันในการแจกแจง ในแง่ที่พวกเขามีความสมมาตรอย่างใด
หนึ่งใน Chi-square นั้นมีส่วนร่วมอย่างใดอย่างหนึ่งต่อจำนวนความแปรปรวนแบบสุ่มที่คุณควรคาดหวังจากผลรวมนั้น
หากคุณมีการสังเกต 100 ครั้งผลรวมข้างต้นจะคาดว่าจะใหญ่ขึ้นเพียงเพราะมีแหล่งที่มาของข้อผูกมัดมากขึ้น
แต่ละคน "แหล่งที่มาของผลงาน" ที่มีพฤติกรรมเดียวกันสามารถเรียกได้ว่าระดับของเสรีภาพ
ทีนี้กลับไปหนึ่งหรือสองขั้นตอนอ่านย่อหน้าก่อนหน้าอีกครั้งหากจำเป็นเพื่อรองรับการมาถึงของคุณในทันที
อ๋อระดับของเสรีภาพแต่ละคนสามารถจะคิดว่าเป็นหนึ่งหน่วยของความแปรปรวนที่คาดว่าจะเกิดขึ้น obligatorily และที่จะนำอะไรที่จะปรับปรุงการคาดเดาของหรือ 2μσ2
สิ่งที่เกิดขึ้นคือคุณเริ่มนับว่าพฤติกรรมของแหล่งที่มาของความแปรปรวนที่เทียบเท่ากัน 10 แหล่งนั้น หากคุณมีการสังเกต 100 ครั้งคุณจะมีแหล่งที่มาอิสระที่มีพฤติกรรมเหมือนกัน 100 แหล่งที่มีความผันผวนแบบสุ่มอย่างเข้มงวดกับผลรวมนั้น
ผลรวมของ 10 จิสี่เหลี่ยมที่ได้รับการเรียกว่าการแจกแจงไคสแควร์กับ10องศาอิสระจากนี้และเขียน{10} เราสามารถอธิบายสิ่งที่คาดหวังจากมันเริ่มต้นจากฟังก์ชั่นความหนาแน่นของความน่าจะเป็นของตนที่จะได้รับทางคณิตศาสตร์จากความหนาแน่นจากว่าการกระจาย Chi-Squared เดียว (จากนี้เรียกว่าการกระจายไคสแควร์กับหนึ่งระดับของเสรีภาพและการเขียน ) ซึ่งสามารถได้มาทางคณิตศาสตร์จากความหนาแน่นของการแจกแจงแบบปกติχ210χ21
"งั้นเหรอ?" --- คุณอาจจะคิดว่า --- "นั่นเป็นเรื่องดีถ้าพระเจ้าใช้เวลาในการบอกคุณค่าของและทุกสิ่งที่เขาสามารถบอกฉันได้!"μσ2
หากพระเจ้าผู้ทรงอำนาจไม่ว่างเกินไปที่จะบอกคุณค่าของและคุณจะยังคงมี 10 แหล่งที่มานั่นคือ 10 องศาอิสระμσ2
สิ่งต่าง ๆ เริ่มแปลก ๆ (ฮ่าฮ่าฮ่าฮ่าเพียงแค่ตอนนี้!) เมื่อคุณกบฏต่อพระเจ้าและลองด้วยตัวเองโดยไม่คาดหวังว่าจะให้การอุปถัมภ์คุณ
คุณมีและประมาณค่าสำหรับและ 2 คุณสามารถค้นหาวิธีการเดิมพันที่ปลอดภัยยิ่งขึ้นX¯S2μσ2
คุณสามารถลองคำนวณผลรวมข้างต้นด้วยและในตำแหน่งของและ :
แต่นั่นคือ ไม่เหมือนกับผลรวมดั้งเดิมX¯S2μσ2
∑i=110(Xi−X¯)2S2/10=∑i=110(Xi−X¯S/10−−√)2,
"ทำไมจะไม่ล่ะ?" คำในสี่เหลี่ยมจัตุรัสของผลรวมทั้งสองนั้นแตกต่างกันมาก ยกตัวอย่างเช่นไม่น่าเป็นไปได้ แต่การสังเกตของคุณทั้งหมดจะมีขนาดใหญ่กว่าซึ่งในกรณีนี้ซึ่งมีความหมายว่าแต่ตามลำดับเพราะ0 μ(Xi−μ)>0∑10i=1(Xi−μ)>0∑10i=1(Xi−X¯)=0∑10i=1Xi−10X¯=10X¯−10X¯=0
แย่กว่านั้นคุณสามารถพิสูจน์ได้อย่างง่ายดาย (ฮาฮาฮาฮา; ขวา!) ที่มีความไม่เท่าเทียมอย่างเข้มงวดเมื่อการสังเกตอย่างน้อยสองครั้งแตกต่างกัน (ซึ่งไม่ใช่เรื่องผิดปกติ)∑10i=1(Xi−X¯)2≤∑10i=1(Xi−μ)2
"แต่เดี๋ยวก่อน! มีอีกมาก!"
ไม่มีการแจกแจงแบบปกติมาตรฐาน
ไม่มี การกระจายแบบไคสแควร์ที่มีอิสระในระดับหนึ่ง
ไม่มีการกระจายแบบไคสแควร์ด้วย อิสรภาพ 10 องศา
ไม่มีการแจกแจงแบบปกติมาตรฐาน
Xi−X¯S/10−−√
(Xi−X¯)2S2/10
∑i=110(Xi−X¯)2S2/10
X¯−μS/10−−√
"มันทั้งหมดเพื่ออะไร?"
ไม่มีทาง. ตอนนี้ความมหัศจรรย์มาแล้ว! โปรดทราบว่า
หรือเทียบเท่า
∑i=110(Xi−X¯)2σ2=∑i=110[Xi−μ+μ−X¯]2σ2=∑i=110[(Xi−μ)−(X¯−μ)]2σ2=∑i=110(Xi−μ)2−2(Xi−μ)(X¯−μ)+(X¯−μ)2σ2=∑i=110(Xi−μ)2−(X¯−μ)2σ2=∑i=110(Xi−μ)2σ2−∑i=110(X¯−μ)2σ2=∑i=110(Xi−μ)2σ2−10(X¯−μ)2σ2=∑i=110(Xi−μ)2σ2−(X¯−μ)2σ2/10
∑i=110(Xi−μ)2σ2=∑i=110(Xi−X¯)2σ2+(X¯−μ)2σ2/10.
ตอนนี้เรากลับไปที่ใบหน้าที่รู้จักกัน
เทอมแรกมีการแจกแจงแบบ Chi-squared ที่มีอิสระ 10 องศาและเทอมสุดท้ายจะมีการแจกแจงแบบ Chi-squared ที่มีระดับความอิสระหนึ่งระดับ (!)
เราแยก Chi-square ด้วย 10 แหล่งที่มาของความแปรปรวนอย่างเท่าเทียมกันในสองส่วนทั้งบวก: ส่วนที่หนึ่งคือ Chi-square ที่มีแหล่งที่มาของความแปรปรวนและอีกหนึ่งที่เราสามารถพิสูจน์ได้ (ก้าวกระโดดของความเชื่อ? ) ที่จะเป็น Chi-square ด้วย 9 (= 10-1) แหล่งที่มาของความแปรปรวนอย่างเท่าเทียมกันอย่างอิสระโดยที่ทั้งสองส่วนเป็นอิสระจากกัน
นี่เป็นข่าวดีอยู่แล้วตั้งแต่ตอนนี้เรามีการเผยแพร่
อนิจจามันใช้ซึ่งเราไม่สามารถเข้าถึงได้ (โปรดจำไว้ว่าพระเจ้ากำลังสร้างความสนุกสนานให้กับตัวเองในการเฝ้าดูการต่อสู้ของเรา)σ2
ดี
ดังนั้น
ดังนั้น
ซึ่งเป็นการแจกแจงที่ไม่ใช่มาตรฐานปกติ แต่ความหนาแน่นสามารถมาจาก ความหนาแน่นของมาตรฐานทั่วไปและ Chi-squared กับองศาอิสระ
S2=110−1∑i=110(Xi−X¯)2,
∑i=110(Xi−X¯)2σ2=∑10i=1(Xi−X¯)2σ2=(10−1)S2σ2∼χ2(10−1)
X¯−μS/10−−√=X¯−μσ/10√Sσ=X¯−μσ/10√S2σ2−−−√=X¯−μσ/10√(10−1)S2σ2(10−1)−−−−−−√=N(0,1)χ2(10−1)(10−1)−−−−−√,
(10−1)
ผู้ชายที่ฉลาดหลักแหลมคนหนึ่งทำคณิตศาสตร์ [^ 1] ในช่วงต้นศตวรรษที่ 20 และด้วยเหตุนี้เขาจึงทำให้หัวหน้าของเขาเป็นผู้นำระดับโลกในอุตสาหกรรมเบียร์สเตาต์ ฉันกำลังพูดคุยเกี่ยวกับวิลเลียมซีลี Gosset (aka นักศึกษา; ใช่ว่านักศึกษาจากกระจาย) และเซนต์เจมส์ประตูโรงเบียร์ (aka โรงเบียร์กินเน ) ที่ฉันศรัทธาt
[^ 1]: @whuber บอกในความคิดเห็นด้านล่างว่า Gosset ไม่ได้ทำคณิตศาสตร์ แต่คาดเดาแทน! ฉันไม่รู้จริง ๆ ว่าเพลงใดที่น่าแปลกใจมากกว่าในตอนนั้น
นั่นคือเพื่อนที่รักของฉันคือที่มาของการแจกแจงมีองศาอิสระอัตราส่วนของมาตรฐานปกติและรากกำลังสองของไค - สแควร์อิสระหารด้วยองศาอิสระซึ่งคาดเดาได้จากกระแสน้ำที่ไม่อาจคาดการณ์ได้อธิบายถึงพฤติกรรมที่คาดหวังของข้อผิดพลาดในการประมาณที่คุณได้รับเมื่อใช้ค่าเฉลี่ยตัวอย่างเพื่อประเมินและการใช้เพื่อประเมินความแปรปรวนของXt(10−1)X¯μS2X¯
ไปแล้ว ด้วยรายละเอียดทางเทคนิคจำนวนมากที่น่าสะพรึงกลัวกวาดไปด้านหลังพรม แต่ไม่ได้ขึ้นอยู่กับการแทรกแซงของพระเจ้าเพียงอย่างเดียวที่จะวางเดิมพันทั้งหมด