จะเข้าใจองศาอิสระได้อย่างไร?


257

จากWikipediaมีการตีความสามระดับของอิสรภาพในสถิติ:

ในสถิติจำนวนองศาความเป็นอิสระคือจำนวนของค่าในการคำนวณขั้นสุดท้ายของสถิติที่สามารถเปลี่ยนแปลงได้ฟรี

การประมาณค่าพารามิเตอร์ทางสถิติอาจขึ้นอยู่กับจำนวนข้อมูลหรือข้อมูลที่แตกต่างกัน จำนวนชิ้นส่วนข้อมูลอิสระที่เข้าสู่การประมาณค่าพารามิเตอร์เรียกว่า degree of freedom (df) โดยทั่วไปแล้วองศาอิสระของการประมาณค่าพารามิเตอร์จะเท่ากับจำนวนคะแนนอิสระที่เข้าไปในการประมาณลบด้วยจำนวนพารามิเตอร์ที่ใช้เป็นขั้นตอนกลางในการประมาณค่าพารามิเตอร์ของตัวเอง (ซึ่งในความแปรปรวนตัวอย่าง) หนึ่งเนื่องจากค่าเฉลี่ยตัวอย่างเป็นเพียงขั้นตอนกลางเท่านั้น)

ศาสตร์องศาอิสระคือมิติของโดเมนของเวกเตอร์สุ่มหรือหลักจำนวนขององค์ประกอบ 'ฟรี': วิธีหลายส่วนประกอบจะต้องมีการรู้จักมาก่อนเวกเตอร์จะถูกกำหนดอย่างเต็มที่

คำที่เป็นตัวหนาคือสิ่งที่ฉันไม่ค่อยเข้าใจ ถ้าเป็นไปได้สูตรทางคณิตศาสตร์บางอย่างจะช่วยอธิบายแนวคิด

การตีความทั้งสามนี้เห็นด้วยกันหรือไม่



3
ดูคำถามนี้ด้วย"องศาอิสระคืออะไร"
Jeromy Anglim

คำตอบ:


242

นี่เป็นคำถามที่ละเอียดอ่อน คนที่มีน้ำใจไม่เข้าใจคำพูดเหล่านั้น! แม้ว่าพวกเขาจะมีการชี้นำ แต่ปรากฎว่าไม่มีพวกเขาถูกต้องหรือโดยทั่วไป ฉันไม่มีเวลา (และที่นี่ไม่มีที่ว่าง) เพื่ออธิบายอย่างเต็มรูปแบบ แต่ฉันต้องการแบ่งปันวิธีหนึ่งและข้อมูลเชิงลึกที่แนะนำ

แนวคิดขององศาอิสระ (DF) เกิดขึ้นที่ไหน บริบทที่พบในการรักษาเบื้องต้นคือ:

  • การทดสอบ t-Studentและการแปรผันของมันเช่น Welch หรือ Satterthwaite โซลูชั่นสำหรับปัญหา Behrens-Fisher (ที่ประชากรสองคนมีความแตกต่างกัน)

  • การแจกแจงแบบไคสแควร์ (นิยามเป็นผลรวมของกำลังสองของเกณฑ์มาตรฐานอิสระ) ซึ่งเกี่ยวข้องในการกระจายตัวตัวอย่างของความแปรปรวน

  • การทดสอบ F (ของอัตราส่วนความแปรปรวนโดยประมาณ)

  • การทดสอบ Chi-squaredซึ่งประกอบด้วยการใช้ใน (a) การทดสอบเพื่อความเป็นอิสระในตารางฉุกเฉินและ (b) การทดสอบเพื่อความดีพอดีกับการประมาณการแบบกระจาย

ด้วยจิตวิญญาณการทดสอบเหล่านี้ใช้ขอบเขตเสียงที่แน่นอน (การทดสอบนักเรียน t-test และ F-test สำหรับการแปรผันตามปกติ) ไปจนถึงการประมาณที่ดี (การทดสอบนักเรียน t และการทดสอบ Welch / Satterthwaite สำหรับข้อมูลที่ไม่บิดเบือน ) ขึ้นอยู่กับการประมาณเชิงเส้นกำกับ (การทดสอบ Chi-squared) แง่มุมที่น่าสนใจของสิ่งเหล่านี้คือการปรากฏตัวของ "ดีกรีอิสระ" ที่ไม่ครบถ้วน (การทดสอบของ Welch / Satterthwaite และอย่างที่เราจะเห็นการทดสอบ Chi-squared) นี่เป็นเรื่องที่น่าสนใจเป็นพิเศษเพราะมันเป็นคำใบ้แรกที่ DF ไม่ได้มีการอ้างถึง

เราสามารถกำจัดข้อเรียกร้องบางอย่างได้ทันที เพราะ "การคำนวณขั้นสุดท้ายของสถิติ" ไม่ได้กำหนดไว้อย่างชัดเจน (มันขึ้นอยู่กับว่าอัลกอริทึมใดที่ใช้สำหรับการคำนวณ) มันอาจจะไม่มากไปกว่าคำแนะนำที่คลุมเครือและไม่มีค่าสำหรับการวิจารณ์เพิ่มเติม ในทำนองเดียวกันไม่มี "จำนวนคะแนนอิสระที่เข้าสู่ประมาณการ" และ "จำนวนพารามิเตอร์ที่ใช้เป็นขั้นตอนกลาง" ไม่ได้กำหนดไว้อย่างดี

"ชิ้นส่วนที่เป็นอิสระของข้อมูลที่เข้าสู่การประเมิน [เป็นการ]"นั้นยากที่จะจัดการเพราะมีความรู้สึกที่แตกต่างกัน แต่มีความสัมพันธ์อย่างใกล้ชิดของ "อิสระ" ที่สามารถเกี่ยวข้องได้ที่นี่ หนึ่งคือความเป็นอิสระของตัวแปรสุ่ม อื่น ๆ ที่เป็นอิสระในการทำงาน ตัวอย่างหลังเราสมมติว่าเรารวบรวมการวัด morphometric ของวัตถุ - พูดเพื่อความเรียบง่ายความยาวสามด้าน , , , พื้นที่ผิวและปริมาตรของ ชุดของบล็อกไม้ ความยาวทั้งสามด้านสามารถพิจารณาได้ว่าเป็นตัวแปรสุ่มแบบอิสระ แต่ตัวแปรทั้งห้านั้นเป็น RVs ที่ต้องพึ่งพา ห้ายังทำหน้าที่Y Z S = 2 ( X Y + Y Z + Z X ) V = X Y Z ( X , Y , Z , S , V ) R 5 ω R 5 ω กรัมω ω ( X ( ψ ) , , V ( ψ ) ) = 0 g ωXYZS=2(XY+YZ+ZX)V=XYZเพราะขึ้นอยู่กับโคโดเมน ( ไม่ได้ว่า "โดเมน"!) ของตัวแปรสุ่มเวกเตอร์ร่องรอยจากนานาสามมิติใน 5 (ดังนั้นเฉพาะที่จุดใดมีสองฟังก์ชันและที่และสำหรับคะแนน "ใกล้"และอนุพันธ์ของและประเมินที่(X,Y,Z,S,V)R5ωR5fωgωfω(X(ψ),,V(ψ))=0ψ ω กรัมω ( X , S , V )gω(X(ψ),,V(ψ))=0ψωfgωมีความเป็นอิสระเป็นเส้นตรง) อย่างไรก็ตาม. - นี่คือนักเตะ - มาตรการความน่าจะเป็นมากในบล็อกย่อยของตัวแปรเช่นมีขึ้นเป็นตัวแปรสุ่ม แต่หน้าที่อิสระ(X,S,V)

ได้รับการแจ้งเตือนจากความกำกวมที่อาจเกิดขึ้นเหล่านี้มาทดสอบความพอดีของ Chi-squared ของการทดสอบเพราะ (a) มันง่าย (b) เป็นหนึ่งในสถานการณ์ทั่วไปที่ผู้คนจำเป็นต้องรู้เกี่ยวกับ DF เพื่อรับ ค่า p ถูกต้องและ (c) มันมักจะใช้ไม่ถูกต้อง ต่อไปนี้เป็นบทสรุปโดยย่อของการใช้การโต้เถียงน้อยที่สุดของการทดสอบนี้:

  • คุณมีการรวบรวมค่าข้อมูลซึ่งถือเป็นตัวอย่างของประชากร(x1,,xn)

  • คุณได้ประเมินพารามิเตอร์ของการกระจาย ตัวอย่างเช่นคุณประเมินค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของการแจกแจงแบบปกติโดยสมมติว่าประชากรกระจายตามปกติ แต่ไม่ทราบ (ล่วงหน้าก่อนที่จะได้รับข้อมูล) สิ่งที่หรืออาจเป็นθ 1 θ 2 = θ p θ 1 θ 2θ1,,θpθ1θ2=θpθ1θ2

  • ล่วงหน้าคุณได้สร้างชุด "ถังขยะ" สำหรับข้อมูล (มันอาจเป็นปัญหาเมื่อข้อมูลถูกกำหนดโดยถังขยะแม้ว่าจะทำสิ่งนี้บ่อยครั้ง) เมื่อใช้ถังขยะเหล่านี้ข้อมูลจะถูกลดลงเป็นชุดของการนับภายในถังขยะแต่ละถัง เมื่อคาดหวังว่ามูลค่าที่แท้จริงของอาจเป็นคุณได้จัดเตรียมไว้เพื่อ (หวังว่า) แต่ละ bin จะได้รับจำนวนใกล้เคียงกัน (ความน่าจะเป็นที่เท่าเทียมกัน binning ทำให้แน่ใจว่าการกระจายตัวไคสแควร์จริง ๆ เป็นการประมาณที่ดีกับการกระจายตัวที่แท้จริงของสถิติไคสแควร์กำลังจะอธิบาย)( θ )k(θ)

  • คุณมีข้อมูลจำนวนมาก - เพียงพอที่จะมั่นใจได้ว่าถังขยะเกือบทั้งหมดควรมีจำนวน 5 หรือมากกว่า (ซึ่งเราหวังว่าจะช่วยให้การกระจายการสุ่มตัวอย่างของสถิติที่จะประมาณได้อย่างเพียงพอโดยบางกระจาย.)χ 2χ2χ2

การใช้การประมาณพารามิเตอร์คุณสามารถคำนวณจำนวนที่คาดไว้ในแต่ละ bin สถิติไคสแควร์คือผลรวมของอัตราส่วน

(observedexpected)2expected.

เจ้าหน้าที่จำนวนมากบอกเราว่าควรจะมีการแจกแจงแบบ Chi-squared (ใกล้เคียงกันมาก) แต่มีครอบครัวของการแจกแจงแบบนี้ทั้งครอบครัว พวกเขาจะแตกต่างกันโดยพารามิเตอร์มักจะเรียกว่า "องศาอิสระ" การใช้เหตุผลมาตรฐานเกี่ยวกับวิธีพิจารณาเช่นนี้เข้าพบνν

ฉันมีค่านั่นคือชิ้นส่วนของข้อมูล แต่มีความสัมพันธ์( หน้าที่ ) ในหมู่พวกเขา เริ่มต้นด้วยผมรู้ล่วงหน้าว่าผลรวมของการนับที่ต้องเท่ากับnนั่นคือความสัมพันธ์เดียว ฉันประมาณสองพารามิเตอร์(หรือโดยทั่วไป) จากข้อมูล นั่นคือความสัมพันธ์เพิ่มเติมสองรายการ (หรือ ) โดยให้ความสัมพันธ์รวมกับทะนงพวกเขา (พารามิเตอร์) ทั้งหมด ( หน้าที่ ) อิสระที่ใบเท่านั้น ( หน้าที่ ) อิสระ "องศาความเป็นอิสระ" ที่คุ้มค่าที่จะใช้สำหรับ\k n p p p + 1 k - p - 1 νkknppp+1kp1ν

ปัญหาเกี่ยวกับการใช้เหตุผลนี้ (ซึ่งเป็นการเรียงลำดับของการคำนวณใบเสนอราคาในคำถามเป็นคำใบ้ที่) คือว่ามันผิดยกเว้นเมื่อมีเงื่อนไขเพิ่มเติมพิเศษบางอย่างค้างไว้ ยิ่งไปกว่านั้นเงื่อนไขเหล่านั้นไม่มีส่วนเกี่ยวข้องกับความเป็นอิสระ (การทำงานหรือสถิติ) ด้วยจำนวนของ "ส่วนประกอบ" ของข้อมูลพร้อมกับจำนวนพารามิเตอร์หรือกับสิ่งอื่นใดที่อ้างถึงในคำถามดั้งเดิม

ให้ฉันแสดงตัวอย่างให้คุณดู (เพื่อให้ชัดเจนที่สุดฉันใช้ถังขยะจำนวนเล็กน้อย แต่ไม่จำเป็น) ลองสร้างมาตรฐานอิสระ (iid) 20 รายการและกระจายตัวเหมือนกันตัวแปรปกติและประเมินค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานด้วยสูตรปกติ ( เฉลี่ย = ผลรวม / นับฯลฯ .) เพื่อทดสอบความดีของความพอดีให้สร้างสี่ถังขยะที่มีจุดตัดที่ควอไทล์ของมาตรฐานปกติ: -0.675, 0, +0.657 และใช้จำนวนถังเพื่อสร้างสถิติ Chi-squared ทำซ้ำตามความอดทนช่วย ฉันมีเวลาทำซ้ำ 10,000 ครั้ง

ภูมิปัญญามาตรฐานเกี่ยวกับ DF กล่าวว่าเรามี 4 ถังขยะและ 1 + 2 = 3 ข้อ จำกัด ซึ่งหมายถึงการกระจายของสถิติ 10,000 Chi-squared เหล่านี้ควรเป็นไปตามการกระจาย Chi-Squared ด้วย 1 DF นี่คือฮิสโตแกรม:

รูปที่ 1

เส้นสีน้ำเงินเข้มกราฟ PDF ของการ - อันที่เราคิดว่าใช้ได้ - ในขณะที่กราฟเส้นสีแดงเข้มที่การของ (ซึ่งจะดี เดาว่ามีคนบอกคุณว่าไม่ถูกต้อง) ไม่เหมาะกับข้อมูลχ 2 ( 2 ) ν = 1χ2(1)χ2(2)ν=1

คุณอาจคาดหวังว่าปัญหาจะเกิดจากชุดข้อมูลขนาดเล็ก ( = 20) หรืออาจเป็นขนาดเล็กของจำนวนถังขยะ อย่างไรก็ตามปัญหายังคงอยู่แม้จะมีชุดข้อมูลขนาดใหญ่มากและถังขยะจำนวนมาก: มันไม่ได้เป็นเพียงความล้มเหลวในการเข้าถึงการประมาณแบบเชิงเส้นกำกับn

มีสิ่งผิดปกติเกิดขึ้นเพราะฉันละเมิดข้อกำหนดสองข้อของการทดสอบ Chi-squared:

  1. คุณต้องใช้การประเมินความน่าจะเป็นสูงสุดของพารามิเตอร์ (ในทางปฏิบัติข้อกำหนดนี้สามารถละเมิดเล็กน้อย)

  2. คุณต้องยึดพื้นฐานการประมาณในการนับไม่ใช่ข้อมูลจริง! (สิ่งนี้สำคัญมาก)

รูปที่ 2

ฮิสโตแกรมสีแดงแสดงให้เห็นถึงสถิติแบบไคสแควร์สำหรับการวนซ้ำ 10,000 ครั้งตามข้อกำหนดเหล่านี้ แน่นอนว่ามันชัดเจนตามโค้ง (โดยมีข้อผิดพลาดในการสุ่มตัวอย่างที่ยอมรับได้) ตามที่เราคาดหวังไว้χ2(1)

จุดของการเปรียบเทียบนี้ - ซึ่งฉันหวังว่าคุณจะได้เห็น - คือ DF ที่ถูกต้องที่จะใช้สำหรับการคำนวณค่า p ขึ้นอยู่กับหลายอย่างอื่นนอกเหนือจากมิติของแมนิโฟลด์นับจำนวนความสัมพันธ์การทำงานหรือเรขาคณิตของตัวแปรปกติ . มีปฏิสัมพันธ์ที่ละเอียดอ่อนและละเอียดอ่อนระหว่างการพึ่งพาการทำงานบางอย่างที่พบในความสัมพันธ์ทางคณิตศาสตร์ระหว่างปริมาณและการแจกแจงของข้อมูลสถิติของพวกเขาและตัวประมาณที่เกิดขึ้นจากพวกเขา ดังนั้นจึงไม่สามารถอธิบายได้ว่า DF นั้นเพียงพอในด้านเรขาคณิตของการแจกแจงปกติหลายตัวแปรหรือในแง่ของความเป็นอิสระในการทำงานหรือเป็นจำนวนพารามิเตอร์หรือสิ่งอื่นใดในลักษณะนี้

จากนั้นเราจะเห็นว่า "องศาอิสระ" เป็นเพียงฮิวริสติกที่แสดงให้เห็นว่าการกระจายตัวตัวอย่างของสถิติ (t, Chi-squared หรือ F) ควรจะเป็นอย่างไร ความเชื่อที่ว่ามันเป็นเชิงนำไปสู่ข้อผิดพลาดอย่างมหันต์ (ตัวอย่างเช่นสิ่งที่ฮิตที่สุดใน Google เมื่อค้นหา "chi squared goodness of fit" เป็นหน้าเว็บจากมหาวิทยาลัย Ivy Leagueที่ได้รับความผิดพลาดเกือบทั้งหมดโดยเฉพาะการจำลองตามคำแนะนำของมันแสดงให้เห็นว่าไคสแควร์ ค่าที่แนะนำคือการมี 7 DF จริง ๆ มี 9 DF)

ด้วยความเข้าใจที่เหมาะสมยิ่งขึ้นมันก็คุ้มค่าที่จะอ่านบทความวิกิพีเดียที่เป็นปัญหาอีกครั้ง: ในรายละเอียดจะได้สิ่งที่ถูกต้องโดยชี้ให้เห็นว่าฮิวริสติกของ DF นั้นมีแนวโน้มที่จะทำงานอย่างไรและเป็นอย่างไร


บัญชีที่ดีของปรากฏการณ์ที่แสดงที่นี่ (DF สูงไม่คาดคิดในการทดสอบการขาดไคสแควร์) ปรากฏในเล่มที่สองของเคนดอลและสจวตรุ่นที่ 5 ฉันขอบคุณสำหรับโอกาสที่คำถามนี้นำไปสู่ข้อความที่ยอดเยี่ยมซึ่งเต็มไปด้วยการวิเคราะห์ที่มีประโยชน์เช่นนี้


แก้ไข (ม.ค. 2017)

นี่คือRรหัสในการสร้างรูปตาม "ภูมิปัญญามาตรฐานเกี่ยวกับ DF ... "

#
# Simulate data, one iteration per column of `x`.
#
n <- 20
n.sim <- 1e4
bins <- qnorm(seq(0, 1, 1/4))
x <- matrix(rnorm(n*n.sim), nrow=n)
#
# Compute statistics.
#
m <- colMeans(x)
s <- apply(sweep(x, 2, m), 2, sd)
counts <- apply(matrix(as.numeric(cut(x, bins)), nrow=n), 2, tabulate, nbins=4)
expectations <- mapply(function(m,s) n*diff(pnorm(bins, m, s)), m, s)
chisquared <- colSums((counts - expectations)^2 / expectations)
#
# Plot histograms of means, variances, and chi-squared stats.  The first
# two confirm all is working as expected.
#
mfrow <- par("mfrow")
par(mfrow=c(1,3))
red <- "#a04040"  # Intended to show correct distributions
blue <- "#404090" # To show the putative chi-squared distribution
hist(m, freq=FALSE)
curve(dnorm(x, sd=1/sqrt(n)), add=TRUE, col=red, lwd=2)
hist(s^2, freq=FALSE)
curve(dchisq(x*(n-1), df=n-1)*(n-1), add=TRUE, col=red, lwd=2)
hist(chisquared, freq=FALSE, breaks=seq(0, ceiling(max(chisquared)), 1/4), 
     xlim=c(0, 13), ylim=c(0, 0.55), 
     col="#c0c0ff", border="#404040")
curve(ifelse(x <= 0, Inf, dchisq(x, df=2)), add=TRUE, col=red, lwd=2)
curve(ifelse(x <= 0, Inf, dchisq(x, df=1)), add=TRUE, col=blue, lwd=2)
par(mfrow=mfrow)

40
นี่คือคำตอบที่น่าอัศจรรย์ คุณชนะที่อินเทอร์เน็ตสำหรับสิ่งนี้
Adam

6
@caracal: ดังที่คุณทราบวิธีการ ML สำหรับข้อมูลดั้งเดิมเป็นกิจวัตรและแพร่หลาย: สำหรับการแจกแจงแบบปกติตัวอย่างเช่น MLE ofเป็นค่าเฉลี่ยตัวอย่างและ MLE ของเป็นรากที่สองของค่าเบี่ยงเบนมาตรฐานตัวอย่าง ( ไม่มีการแก้ไขอคติตามปกติ) ในการรับประมาณการโดยอิงตามจำนวนฉันคำนวณฟังก์ชันความน่าจะเป็นสำหรับการนับ - สิ่งนี้ต้องใช้ค่าการคำนวณของ CDF ที่จุดตัด, นำบันทึกของพวกเขา, คูณด้วยจำนวนและเพิ่ม - และปรับให้เหมาะสมโดยใช้ซอฟต์แวร์การเพิ่มประสิทธิภาพทั่วไป σμσ
whuber

4
@caracal คุณอาจไม่จำเป็นต้องใช้มัน แต่ตัวอย่างของRสำหรับ ML เหมาะสมของข้อมูล binned ในขณะนี้ปรากฏในคำถามที่เกี่ยวข้อง: stats.stackexchange.com/a/34894
whuber

1
"ปัญหาเกี่ยวกับการใช้เหตุผลนี้ (ซึ่งเป็นการเรียงลำดับของการคำนวณใบเสนอราคาในคำถามที่บอกใบ้) คือมันผิดยกเว้นเมื่อมีเงื่อนไขเพิ่มเติมบางอย่างค้างไว้" ตอนนี้ฉัน (เกือบ) ถึงสองภาคการศึกษาของลำดับโมเดลเชิงเส้นและฉันเข้าใจองศาอิสระที่จะเป็นอันดับของเมทริกซ์ใน "กลาง" ของรูปสี่เหลี่ยมกำลังสอง "เงื่อนไขเพิ่มเติม" เหล่านี้คืออะไร?
Clarinetist

4
@Clarinetist จุดสำคัญของคำตอบของฉันคือการแนะนำว่าสิ่งที่คุณได้รับการสอนนั้นขึ้นอยู่กับความสับสนของสองแนวคิดของ DF แม้ว่าความสับสนนั้นจะไม่เกิดปัญหากับตัวแบบปกติทฤษฏีสี่เหลี่ยมจัตุรัสน้อยที่สุด แต่ก็นำไปสู่ข้อผิดพลาดแม้ในสถานการณ์ทั่วไปที่เรียบง่ายเช่นการวิเคราะห์ตารางฉุกเฉิน อันดับของเมทริกซ์นั้นให้DF การทำงาน ในอย่างน้อยสี่เหลี่ยมโมเดลเชิงเส้นตรงที่มันเกิดขึ้นเพื่อให้ถูกต้อง DF บางประเภทของการทดสอบเช่นการทดสอบ F สำหรับการทดสอบแบบไคสแควร์เงื่อนไขพิเศษจะแจกแจงในภายหลังในคำตอบเป็นคะแนน (1) และ (2)
whuber

74

หรือเพียงแค่: จำนวนองค์ประกอบในอาร์เรย์ตัวเลขที่คุณได้รับอนุญาตให้เปลี่ยนเพื่อให้ค่าของสถิติยังคงไม่เปลี่ยนแปลง

# for instance if:
x + y + z = 10

คุณสามารถเปลี่ยนเช่นxและy ที่ที่สุ่ม แต่คุณไม่สามารถเปลี่ยนZ (คุณสามารถ แต่ไม่ได้อยู่ที่การสุ่มดังนั้นคุณไม่ได้ฟรีที่จะเปลี่ยนมัน - ดูความคิดเห็นของฮาร์วีย์) 'ทำให้คุณจะเปลี่ยนค่า ของสถิติ (Σ = 10) ดังนั้นในกรณีนี้ df = 2


19
มันไม่ถูกต้องนักที่จะพูดว่า "คุณไม่สามารถเปลี่ยน z" ได้ ที่จริงแล้วคุณต้องเปลี่ยน z เพื่อให้ผลรวมเท่ากับ 10 แต่คุณไม่มีทางเลือก (ไม่มีอิสระ) เกี่ยวกับสิ่งที่มันเปลี่ยนไป คุณสามารถเปลี่ยนค่าสองค่าได้ แต่ไม่ใช่ค่าที่สาม
Harvey Motulsky

53

เป็นแนวคิดที่ไม่ได้อยู่ที่ยากทั้งหมดเพื่อให้มีความแม่นยำทางคณิตศาสตร์ได้รับเกร็ดความรู้ทั่วไปของเรขาคณิตมิติยุคลิด subspaces และประมาณการมุมฉากn

ถ้าคือorthogonal เงื้อมมือจากไปยัง -dimensional subspaceและเป็นกฎเกณฑ์ -vector ดังนั้นจึงอยู่ใน ,และเป็น orthogonal และอยู่ในที่สมบูรณ์มุมฉากของLมิติของส่วนประกอบฉากนี้เป็นNPถ้ามีอิสระในการเปลี่ยนแปลงในช่องว่าง -dimensional แล้วมีอิสระที่จะเปลี่ยนแปลงในR n p L x n P x L x - P x P x x - P x L L L n - p x n x - P x n - p x - P x n - pPRnpLxnPxLxPxPxxPxLLLnpxnxPxnpพื้นที่มิติด้วยเหตุนี้เราบอกว่ามีองศาอิสระxPxnp

พิจารณาเหล่านี้มีความสำคัญต่อสถิติเพราะถ้าเป็นเวกเตอร์สุ่มมิติและเป็นรูปแบบของค่าเฉลี่ยที่เป็นค่าเฉลี่ยเวกเตอร์อยู่ในแล้วเราเรียกว่าเวกเตอร์ของเหลือ , และเราใช้ส่วนที่เหลือเพื่อประเมินความแปรปรวน เวกเตอร์ของเศษมีองศาอิสระนั่นคือมันเป็นข้อ จำกัด ในการสเปซของมิติNPn L E ( X ) L X - P X n - p n - pXnLE(X)LXPXnpnp

ถ้าพิกัดของมีความเป็นอิสระและกระจายตามปกติที่มีความแปรปรวนเดียวกันแล้วσ 2Xσ2

  • เวกเตอร์และเป็นอิสระX - P XPXXPX
  • ถ้าการกระจายของกำลังสองของเวกเตอร์ของส่วนที่เหลือคือ aกระจายที่มีสเกลพารามิเตอร์และพารามิเตอร์อื่นที่เกิดขึ้น องศาของเสรีภาพNP| | X - P X | | 2 χ 2 σ 2 n - pE(X)L||XPX||2χ2σ2np

ร่างของการพิสูจน์ข้อเท็จจริงเหล่านี้ได้รับด้านล่าง ผลลัพธ์ทั้งสองเป็นศูนย์กลางสำหรับการพัฒนาเพิ่มเติมของทฤษฎีสถิติตามการแจกแจงแบบปกติ โปรดทราบด้วยว่านี่คือสาเหตุที่ -distribution มีการตั้งค่าไว้เป็นอย่างดี นอกจากนี้ยังเป็น -distribution พร้อมสเกลพารามิเตอร์และพารามิเตอร์รูปร่างแต่ในบริบทข้างต้นมันเป็นเรื่องธรรมดาที่จะมีพาราเมาท์ในแง่ขององศาอิสระ Γ 2 σ 2 ( n - p ) / 2χ2Γ2σ2(np)/2

ฉันต้องยอมรับว่าฉันไม่พบย่อหน้าใด ๆ ที่อ้างถึงจากบทความวิกิพีเดียโดยเฉพาะอย่างยิ่งการรู้แจ้ง แต่พวกเขาก็ไม่ได้ผิดหรือขัดแย้งอย่างแท้จริง พวกเขาบอกว่าไม่แน่ชัดและในความหมายทั่วไปที่ว่าเมื่อเราคำนวณการประมาณค่าพารามิเตอร์ความแปรปรวน แต่ทำตามส่วนที่เหลือเราจะคำนวณการคำนวณบนเวกเตอร์ที่มีอิสระเท่านั้นที่จะเปลี่ยนแปลงในปริภูมิมิติ .np

นอกเหนือจากทฤษฎีของแบบจำลองเชิงเส้นตรงการใช้แนวคิดเรื่ององศาอิสระอาจทำให้สับสนได้ ยกตัวอย่างเช่นมันใช้ในการสร้างตัวแปรของกระจายว่ามีการอ้างอิงถึงสิ่งใดก็ตามที่อาจมีองศาอิสระหรือไม่ เมื่อเราพิจารณาการวิเคราะห์เชิงสถิติของข้อมูลที่เป็นหมวดหมู่อาจมีความสับสนว่าควรจะนับ "ชิ้นส่วนอิสระ" ก่อนหรือหลังการเรียงตาราง ยิ่งไปกว่านั้นสำหรับข้อ จำกัด แม้สำหรับรุ่นปกติที่ไม่ใช่ข้อ จำกัด ของสเปซนั้นก็ไม่ชัดเจนว่าจะขยายแนวคิดขององศาอิสระได้อย่างไร ข้อเสนอแนะต่าง ๆ มักจะอยู่ภายใต้ชื่อของที่มีประสิทธิภาพองศาอิสระχ2

ก่อนที่จะพิจารณาการใช้งานและความหมายอื่น ๆ ขององศาอิสระผมขอแนะนำอย่างยิ่งให้มั่นใจในบริบทของโมเดลปกติเชิงเส้น การอ้างอิงเกี่ยวกับคลาสโมเดลนี้คือA First Course in The Linear Model Theoryและมีการอ้างอิงเพิ่มเติมในส่วนนำของหนังสือกับหนังสือคลาสสิกอื่น ๆ ในโมเดลเชิงเส้น

ข้อพิสูจน์ผลลัพธ์ด้านบน:ให้ , โปรดสังเกตว่าเมทริกซ์ความแปรปรวนคือและเลือกพื้นฐาน orthonormalของและพื้นฐาน orthonormalของperp} จากนั้นเป็น orthonormal พื้นฐานของ n ให้แทน -vector ของสัมประสิทธิ์ของในพื้นฐานนี้นั่นคือ ซึ่งสามารถเขียนเป็นโดยที่คือเมทริกซ์มุมฉากกับσ 2ฉันZ 1 , ... , Z P L Z P + 1 , ... , Z n L Z 1 , ... , Z n R n ~ X n X ~ Xฉัน = Z T ฉัน X ˜ X = Z T X Z z ฉัน˜ Xξ=E(X)σ2Iz1,,zpLzp+1,,znLz1,,znRnX~nX

X~i=ziTX.
X~=ZTXZziในคอลัมน์ แล้วเรามีการใช้งานที่มีการแจกแจงแบบปกติที่มีค่าเฉลี่ยและเพราะเป็นมุมฉากแปรปรวนเมทริกซ์ฉัน ตามมาจากผลการแปลงเชิงเส้นทั่วไปของการแจกแจงปกติ พื้นฐานถูกเลือกเพื่อให้สัมประสิทธิ์ของเป็นสำหรับและสัมประสิทธิ์ของคือสำหรับ . เนื่องจากสัมประสิทธิ์ไม่มีการเชื่อมโยงกันและร่วมกันพวกมันจึงเป็นอิสระและนี่ก็หมายความว่า และ X~Z σ 2ฉันP X ˜ Xฉันฉัน= 1 , , p X - P X ˜ Xฉันฉัน= p + 1 , , n P X = p ฉัน= 1 ˜ Xฉันz ฉัน X ฉัน - P X = n i = p + 1 ˜ZTξZσ2IPXX~ii=1,,pXPXX~ii=p+1,,n
PX=i=1pX~izi
| | X-PX| | 2=n Σฉัน=P+1 ~ X 2ฉัน ξLE( ~ Xฉัน)=Z T ฉัน ξ=0ฉัน=P+1,...,nZฉันLZฉันξ|
XPX=i=p+1nX~izi
มีความเป็นอิสระ ยิ่งกว่านั้น ถ้าดังนั้นสำหรับเพราะและ\ ในกรณีนี้คือผลรวมของอิสระกระจายตัวแปรสุ่มซึ่งการกระจายโดยนิยามคือกระจายด้วยพารามิเตอร์สเกลและองศาอิสระ
||XPX||2=i=p+1nX~i2.
ξLE(X~i)=ziTξ=0i=p+1,,nziLziξ||XPX||2npχ 2 σ 2 n - pN(0,σ2)χ2σ2np

NRH ขอบคุณ! (1) ทำไมที่จำเป็นต้องอยู่ภายใน ? (2) ทำไมและจึงมีความเป็นอิสระ (3) มีการกำหนดอานนท์ในบริบทตัวแปรสุ่มที่กำหนดจากอานนท์ในกรณีที่กำหนดขึ้นหรือไม่? ตัวอย่างเช่นเหตุผลของมี dof เพราะมันเป็นจริงเมื่อเป็นตัวแปรที่กำหนดขึ้นแทนที่จะเป็นตัวแปรสุ่ม? (4) มีการอ้างอิง (หนังสือเอกสารหรือลิงค์) ที่มีความเห็นเหมือนหรือคล้ายกับของคุณหรือไม่? L P X X - P X | | X - P X | | 2 n - p XE(X)LPXXPX||XPX||2npX
ทิม

@ Tim,และมีความเป็นอิสระเนื่องจากเป็นเรื่องปกติและไม่เกี่ยวข้องกัน PXXPX
mpiktas

@ เวลาฉันได้รับคำตอบเพียงเล็กน้อยและได้รับการพิสูจน์ผลลัพธ์ตามที่ระบุไว้ ค่าเฉลี่ยจะต้องอยู่ในเพื่อพิสูจน์ผลลัพธ์เกี่ยวกับ -distribution มันเป็นสมมติฐานแบบ ในวรรณกรรมคุณควรมองหาโมเดลปกติเชิงเส้นเชิงเส้นหรือโมเดลเชิงเส้นทั่วไป แต่ตอนนี้ฉันจำได้เฉพาะบางส่วน ฉันจะดูว่าฉันสามารถหาข้อมูลอ้างอิงที่เหมาะสมได้หรือไม่ Lχ2
NRH

คำตอบที่ยอดเยี่ยม ขอบคุณสำหรับความเข้าใจ หนึ่งคำถาม: ผมได้สูญเสียสิ่งที่คุณหมายโดยวลี "เวกเตอร์เฉลี่ยอยู่ใน " คุณสามารถอธิบาย? คุณพยายามกำหนดหรือไม่? เพื่อกำหนด ? อื่น ๆ อีก? บางทีประโยคนี้กำลังพยายามทำมากเกินไปหรือรัดกุมเกินไปสำหรับฉัน คุณช่วยอธิบายความหมายของในบริบทที่คุณพูดถึงได้ไหม: มันเป็นแค่ ? คุณสามารถอธิบายรายละเอียดเกี่ยวกับในบริบทนี้ (ของพิกัด iid ปกติ) ได้อย่างไร? มันเป็นแค่ ? EXLELEE(x1,x2,,xn)=(x1+x2++xn)/nLL=R
DW

@DW Theเป็นผู้ดำเนินการที่คาดหวัง ดังนั้นเป็นเวกเตอร์ของความคาดหวัง coordinatewise ของXสเปซใด ๆสเปซมิติของ n มันเป็นช่องว่างของ -vector และไม่ใช่แต่มันอาจเป็นมิติเดียวได้ ตัวอย่างที่ง่ายที่สุดคือบางทีเมื่อมันถูกขยายโดย -vector พร้อมกับ 1 ในทุก -coordinates นี่คือแบบจำลองของพิกัดทั้งหมดของซึ่งมีค่าเฉลี่ยเท่ากัน แต่มีแบบจำลองที่ซับซ้อนกว่านี้ได้หลายแบบ EE(X)XLpRnnR1nX
NRH

30

มันไม่แตกต่างจากวิธีที่คำว่า "ดีกรีอิสระ" ทำงานในสาขาอื่น ตัวอย่างเช่นสมมติว่าคุณมีตัวแปรสี่ตัว ได้แก่ ความยาวความกว้างพื้นที่และขอบเขตของสี่เหลี่ยมผืนผ้า คุณรู้สี่สิ่งจริง ๆ หรือไม่ ไม่เพราะมีเสรีภาพเพียงสององศาเท่านั้น หากคุณทราบความยาวและความกว้างคุณสามารถหาพื้นที่และปริมณฑลได้ หากคุณทราบความยาวและพื้นที่คุณสามารถรับความกว้างและขอบเขตได้ หากคุณรู้ว่าพื้นที่และปริมณฑลคุณสามารถได้รับความยาวและความกว้าง (สูงสุดถึงการหมุน) หากคุณมีทั้งสี่คุณสามารถพูดได้ว่าระบบมีความสอดคล้องกัน (ตัวแปรทั้งหมดเห็นด้วยกัน) หรือไม่สอดคล้องกัน (ไม่มีรูปสี่เหลี่ยมผืนผ้าจริง ๆ สามารถตอบสนองทุกเงื่อนไข) สี่เหลี่ยมคือสี่เหลี่ยมจัตุรัสที่ลบองศาอิสระ

ในสถิติสิ่งต่าง ๆ มีความคลุมเครือมากขึ้น แต่ความคิดยังคงเหมือนเดิม หากข้อมูลทั้งหมดที่คุณใช้เป็นอินพุตสำหรับฟังก์ชั่นเป็นตัวแปรอิสระคุณก็จะมีอิสระภาพมากเท่ากับที่คุณมีอินพุต แต่ถ้าพวกเขามีการพึ่งพาอาศัยในทางใดทางหนึ่งเช่นถ้าคุณมีอินพุต n - k คุณสามารถหาส่วนที่เหลือ k ได้คุณก็จะได้อิสรภาพ n - k องศาเท่านั้น และบางครั้งคุณต้องคำนึงถึงเรื่องนี้ด้วยมิฉะนั้นคุณจะมั่นใจได้ว่าข้อมูลมีความน่าเชื่อถือหรือมีพลังในการทำนายมากกว่าที่ทำได้จริงโดยการนับจุดข้อมูลมากกว่าที่คุณมีบิตของข้อมูลที่เป็นอิสระ

(นำมาจากโพสต์ที่http://www.reddit.com/r/math/comments/9qbut/could_someone_explain_to_me_what_degrees_of/c0dxtbq?context=3 )

ยิ่งกว่านั้นคำจำกัดความทั้งสามนี้เกือบจะพยายามให้ข้อความเดียวกัน


1
พื้นฐานถูกต้อง แต่ฉันกังวลว่าย่อหน้ากลางสามารถอ่านได้ในลักษณะที่ทำให้เกิดความสับสนความสัมพันธ์ความเป็นอิสระ (ของตัวแปรสุ่ม) และความเป็นอิสระในการทำงาน (ของตัวแปรต่าง ๆ ) ความแตกต่างระหว่างความสัมพันธ์ - อิสระเป็นสิ่งสำคัญอย่างยิ่งในการรักษา
whuber

@whuber: มันดีหรือไม่
Biostat

3
มันถูกต้อง แต่วิธีการใช้คำศัพท์น่าจะทำให้บางคนสับสน มันยังไม่แยกความแตกต่างอย่างชัดเจนของการพึ่งพาตัวแปรสุ่มจากการพึ่งพาการทำงาน ตัวอย่างเช่นตัวแปรสองตัวในการแจกแจงแบบปกติแบบไม่ จำกัด คู่ที่มีความสัมพันธ์แบบไม่เป็นศูนย์จะขึ้นอยู่กับ (เป็นตัวแปรสุ่ม) แต่พวกเขายังคงเสนออิสรภาพสององศา
whuber

5
นี้ได้รับการคัดลอกวางจากการโพสต์ Reddit ฉันทำในปี 2009
ฮอบส์

2
ศูนย์ช่วยเหลือของเราให้คำแนะนำที่ชัดเจนเกี่ยวกับวิธีการอ้างอิงเนื้อหาที่เขียนโดยคนอื่นดังนั้นฉันหวังว่า OP จะกลับมาที่โพสต์นี้เพื่อดำเนินการที่เหมาะสมและมีส่วนร่วมในการโต้ตอบที่สร้างสรรค์ (เราไม่เคยเห็นเขามาก่อน)
chl

19

ฉันชอบประโยคแรกจาก The Little Handbook of Practice Practice บทที่ดีกรีอิสระ

หนึ่งในคำถามที่ผู้สอนสงสัยมากที่สุดจากผู้ชมที่ไม่มีความซับซ้อนทางคณิตศาสตร์คือ "อะไรคือองศาความอิสระ"

ฉันคิดว่าคุณสามารถเข้าใจอย่างถ่องแท้เกี่ยวกับองศาอิสระจากการอ่านบทนี้


6
มันจะดีถ้ามีคำอธิบายว่าทำไมองศาอิสระเป็นสิ่งที่สำคัญมากกว่าแค่ว่ามันคืออะไร ตัวอย่างเช่นแสดงให้เห็นว่าการประมาณค่าความแปรปรวนกับ 1 / n นั้นมีความเอนเอียง แต่การใช้ 1 / (n-1) จะให้ค่าประมาณที่ไม่เอนเอียง
อุโมงค์

9

วิกิพีเดียยืนยันว่าองศาอิสระของเวกเตอร์สุ่มสามารถตีความได้ว่าขนาดของพื้นที่ย่อยเวกเตอร์ ฉันต้องการไปทีละขั้นตอนโดยทั่วไปผ่านสิ่งนี้เป็นคำตอบบางส่วนและทำอย่างละเอียดในรายการ Wikipedia

ตัวอย่างที่นำเสนอเป็นที่ของเวกเตอร์สุ่มที่สอดคล้องกับการวัดของตัวแปรอย่างต่อเนื่องสำหรับวิชาที่แตกต่างกันแสดงเป็นเวกเตอร์ที่ยื่นออกมาจากต้นกำเนิด T การฉายฉากมุมฉากบนเวกเตอร์ผลลัพธ์ในเวกเตอร์เท่ากับการฉายภาพเวกเตอร์ของการวัดหมายถึง ( ), ie , มีจุดด้วยเวกเตอร์,ประมาณการนี้ลงบนพื้นที่ย่อยที่เวกเตอร์ของ คนมี{ระดับของเสรีภาพ} เหลือเวกเตอร์ (ระยะทางจากค่าเฉลี่ย) คือการฉายอย่างน้อยสี่เหลี่ยมบน[abc]T[111]Tx¯=1/3(a+b+c)[x¯x¯x¯]T1[111]T1degree of freedom(n1)มิติประกอบฉากของมิติย่อยนี้และมี ,เป็นจำนวนส่วนประกอบทั้งหมดของเวกเตอร์ (ในกรณีของเราเนื่องจากเราอยู่ในใน ตัวอย่าง) สิ่งนี้สามารถพิสูจน์ได้ง่ายๆโดยการหาผลคูณของด้วยความแตกต่างระหว่างและ :n1degrees of freedomn3R3[x¯x¯x¯]T[abc]T[x¯x¯x¯]T

[x¯x¯x¯][ax¯bx¯cx¯]=

=[(a+b+c)3(a(a+b+c)3)]+[(a+b+c)3(b(a+b+c)3)]+[(a+b+c)3(c(a+b+c)3)]

=(a+b+c)3[(a(a+b+c)3)+(b(a+b+c)3)+(c(a+b+c)3)]

=(a+b+c)3[13(3a(a+b+c)+3b(a+b+c)+3c(a+b+c))]

=(a+b+c)3[13(3a3a+3b3b+3c3c)]=0
0

และความสัมพันธ์นี้จะขยายไปสู่จุดใด ๆ ในฉากเครื่องบิน T แนวคิดนี้มีความสำคัญในการทำความเข้าใจว่าทำไมขั้นตอนในการสืบทอด t-distribution ( ที่นี่และที่นี่ )[x¯x¯x¯]T1σ2((X1X¯)2++(XnX¯)2)χn12

เอาจุด , ซึ่งสอดคล้องกับข้อสังเกตสามข้อ ค่าเฉลี่ยคือและเวกเตอร์เป็นปกติ (มุมฉาก) เพื่อเครื่องบินD เสียบจุดพิกัดลงในสมเครื่องบิน-9075[355080]T55[555555]T55x+55y+55z=DD=9075

ตอนนี้เราสามารถเลือกจุดอื่น ๆ ในระนาบนี้และค่าเฉลี่ยของพิกัดของมันเป็นไปได้ , เรขาคณิตที่สอดคล้องกับการฉายภาพลงบนเวกเตอร์ T ดังนั้นสำหรับทุกค่าเฉลี่ย (ในตัวอย่างของเรา ) เราสามารถเลือกจำนวนคู่ของพิกัดในไม่ จำกัด ( ); เลยตั้งแต่เครื่องบินอยู่ใน ที่สามประสานงานจะมากำหนดโดยสมการของเครื่องบิน (หรือเรขาคณิตประมาณการมุมฉากของจุดบน T55[111]T55R22degrees of freedomR3[555555]T

นี่คือตัวแทนของสามจุด (เป็นสีขาว) นอนอยู่บนระนาบ (cerulean blue) orthogonal ถึง (ลูกศร): ,และทั้งหมดนี้อยู่บนระนาบ (subspace ที่มี ) และด้วยค่าเฉลี่ยของส่วนประกอบของและ orthogonal เงื้อมมือให้กับ (subspace กับ ) เท่ากับ :[555555]T[355080]T[80805][901560]2df55[111]T1df[555555]T


9

ในชั้นเรียนของฉันฉันใช้สถานการณ์ที่ "เรียบง่าย" ที่อาจช่วยให้คุณสงสัยและอาจพัฒนาความรู้สึกที่มีต่ออิสรภาพในระดับที่อาจหมายถึง

มันเป็นวิธีการ "Forrest Gump" กับเรื่อง แต่มันก็คุ้มค่าที่จะลอง

พิจารณาคุณมี 10 ข้อสังเกตอิสระที่มาทางด้านขวาจากประชากรปกติที่มีค่าเฉลี่ยและความแปรปรวนเป็นที่รู้จักX1,X2,,X10N(μ,σ2)μσ2

สังเกตของคุณนำมาให้คุณข้อมูลรวมทั้งเกี่ยวกับและ 2 ท้ายที่สุดการสังเกตของคุณมีแนวโน้มที่จะแพร่กระจายไปรอบ ๆ ค่ากลางเดียวซึ่งควรใกล้เคียงกับค่าจริงและไม่รู้จักและเช่นเดียวกันหากสูงหรือต่ำมากคุณก็คาดหวังว่าจะเห็นการสังเกตการณ์ของคุณ รวบรวมค่าสูงหรือต่ำมากตามลำดับ "การแทนที่" ที่ดีอย่างหนึ่งสำหรับ (หากไม่มีความรู้เกี่ยวกับมูลค่าที่แท้จริง) คือซึ่งเป็นค่าเฉลี่ยของการสังเกตของคุณ μσ2μμμX¯

นอกจากนี้หากการสังเกตของคุณอยู่ใกล้กันมากนั่นเป็นข้อบ่งชี้ว่าคุณสามารถคาดหวังว่าจะต้องเล็กและในทำนองเดียวกันถ้ามีขนาดใหญ่มากคุณสามารถคาดหวังว่าจะเห็นคุณค่าที่แตกต่างกัน สำหรับเพื่อ{10} σ2σ2X1X10

หากคุณต้องเดิมพันค่าจ้างรายสัปดาห์ซึ่งควรเป็นค่าจริงของและคุณจะต้องเลือกคู่ของค่าที่คุณจะเดิมพันเงินของคุณ อย่าคิดว่าจะเป็นอะไรที่น่าทึ่งเท่ากับเสียเงินจากเช็คของคุณจนกว่าคุณจะเดาอย่างถูกต้องจนกระทั่งตำแหน่งทศนิยมที่ 200 Nope ลองนึกถึงระบบการให้ผลตอบแทนที่ยิ่งคาดเดาและยิ่งคุณได้รับรางวัลมากเท่าไหร่μσ2μμσ2

ในความรู้สึกบางอย่างที่ดีกว่ามีข้อมูลมากขึ้นและสุภาพมากขึ้นเดาของคุณสำหรับค่า 's อาจจะX ในความรู้สึกที่คุณประเมินว่าจะต้องเป็นค่าบางอย่างรอบX ในทำนองเดียวกันหนึ่งที่ดี "แทน" สำหรับ (ไม่จำเป็นสำหรับตอนนี้) เป็นแปรปรวนตัวอย่างของคุณซึ่งจะทำให้ประมาณการที่ดีสำหรับ\μX¯μX¯σ2S2σ

หากคุณเชื่อว่าสารทดแทนเหล่านั้นเป็นค่าที่แท้จริงของและคุณอาจจะผิดเพราะเพรียวบางเป็นโอกาสที่คุณโชคดีมากที่การสังเกตการณ์ของคุณประสานงานเพื่อให้คุณได้รับของขวัญเท่ากับและเท่ากับ 2 ไม่หรอกมันอาจจะไม่เกิดขึ้นμσ2X¯μS2σ2

แต่คุณอาจจะอยู่ในระดับที่แตกต่างของความผิดแตกต่างไปจากผิดเล็กน้อยไปสู่ความจริงผิดอย่างน่าสังเวชจริงๆ (อาคาลาบายลาเช็คเงินเดือนสัปดาห์หน้าคุณ!)

ตกลงขอบอกว่าคุณเอาเป็นเดาของคุณสำหรับ\พิจารณาเพียงแค่สองสถานการณ์:และSในตอนแรกการสังเกตของคุณนั่งสวยและใกล้กัน ในระยะหลังการสังเกตของคุณแตกต่างกันไป ในสถานการณ์ใดที่คุณควรคำนึงถึงความสูญเสียที่อาจเกิดขึ้น หากคุณคิดถึงสิ่งที่สองคุณคิดถูก การที่มีการประมาณเปลี่ยนความเชื่อมั่นของคุณในการเดิมพันของคุณอย่างมีเหตุผลมากสำหรับใหญ่กว่านั้นคือยิ่งคุณคาดหวังว่าจะแปรปรวนมากขึ้นX¯μS2=2S2=20,000,000σ2σ2X¯

แต่นอกเหนือจากข้อมูลเกี่ยวกับและการสังเกตของคุณยังดำเนินการจำนวนเงินบางส่วนของความผันผวนสุ่มบริสุทธิ์เพียงที่ไม่ได้ให้ข้อมูลเกี่ยวกับค่ามิได้เกี่ยวกับ 2 μσ2μσ2

คุณจะสังเกตเห็นได้อย่างไร

ดีสมมติว่าเพื่อประโยชน์ในการโต้แย้งว่ามีพระเจ้าและว่าเขามีเวลาว่างพอที่จะให้ตัวเองเอาจริงเอาจังของบอกคุณโดยเฉพาะจริง (และอื่น ๆ ที่ไม่รู้จักไกล) ค่าของทั้งสองและ\μσ

และนี่คือพล็อตเรื่องน่ารำคาญที่บิดเบี้ยวเรื่องนี้: เขาบอกคุณหลังจากที่คุณวางเดิมพัน บางทีอาจจะให้ความกระจ่างแก่คุณเพื่อเตรียมคุณหรืออาจจะทำให้คุณเยาะเย้ย คุณจะรู้ได้อย่างไร

นั่นทำให้ข้อมูลเกี่ยวกับและมีอยู่ในการสังเกตของคุณไม่มีประโยชน์เลยในตอนนี้ ตำแหน่งศูนย์กลางและความแปรปรวนของสังเกตการณ์ไม่มีความช่วยเหลือใด ๆ ที่จะเข้าใกล้ค่าที่แท้จริงของและอีกต่อไปเพราะคุณรู้แล้วμσ2X¯S2μσ2

ข้อดีอย่างหนึ่งของการทำความคุ้นเคยกับพระเจ้าคือการที่คุณรู้ว่าคุณไม่สามารถเดาได้อย่างถูกต้องโดยใช้นั่นคือข้อผิดพลาดในการประมาณของคุณμX¯(X¯μ)

อืมเนื่องจากจากนั้น (เชื่อฉันเถอะถ้าคุณต้องการ), (ตกลงเชื่อฉันในเรื่องนั้นด้วย) และในที่สุด (เดาอะไรไว้วางใจผมในการที่หนึ่งเช่นกัน) ซึ่งดำเนินการอย่างไม่มีข้อมูลเกี่ยวกับหรือ 2XiN(μ,σ2)X¯N(μ,σ2/10)(X¯μ)N(0,σ2/10)

X¯μσ/10N(0,1)
μσ2

คุณรู้อะไรไหม? ถ้าคุณเอาใด ๆ ของการสังเกตของแต่ละบุคคลเป็นเดาสำหรับข้อผิดพลาดการประมาณค่าของคุณจะกระจายเป็น2) ทีนี้ระหว่างการประมาณกับและใด ๆการเลือกจะเป็นธุรกิจที่ดีกว่าเพราะดังนั้นมีแนวโน้มที่จะหลงทางจากน้อยกว่าเดี่ยวๆμ(Xiμ)N(0,σ2)μX¯XiX¯Var(X¯)=σ2/10<σ2=Var(Xi)X¯μXi

อย่างไรก็ตามก็ไม่ให้ข้อมูลเกี่ยวกับหรืออย่างแน่นอน(Xiμ)/σN(0,1)μσ2

เรื่องนี้จะจบลงไหม? คุณอาจจะคิด คุณอาจกำลังคิดว่า "มีความผันผวนแบบสุ่มอีกหรือไม่ที่ไม่ให้ข้อมูลเกี่ยวกับและ ?"μσ2

[ฉันชอบที่จะคิดว่าคุณกำลังคิดถึงสิ่งหลัง]

ใช่แล้ว!

กำลังสองของข้อผิดพลาดการประมาณค่าของคุณสำหรับกับหารด้วย , มีการแจกแจงแบบ Chi-squared ซึ่งเป็นการกระจายของจตุของมาตรฐานปกติซึ่งฉันแน่ใจว่าคุณสังเกตเห็นว่ามีอย่างแน่นอน ไม่มีข้อมูลเกี่ยวกับหรือแต่ให้ข้อมูลเกี่ยวกับความแปรปรวนที่คุณควรคาดหวังμXiσ

(Xiμ)2σ2=(Xiμσ)2χ2
Z2ZN(0,1)μσ2

นั่นคือการกระจายที่รู้จักกันดีที่เกิดขึ้นตามธรรมชาติจากสถานการณ์การพนันของคุณสำหรับทุก ๆ การสังเกตของคุณและจากค่าเฉลี่ยของคุณ: และจากการรวบรวมการเปลี่ยนแปลงสิบข้อสังเกตของคุณ: ตอนนี้ผู้ชายคนสุดท้ายไม่มีการกระจายตัวแบบไคสแควร์เพราะเขาเป็นผลรวมของการแจกแจงแบบไคสแควร์สิบตัวพวกเขาทั้งหมดเป็นอิสระจากกัน (เพราะเช่นนั้นคือ

(X¯μ)2σ2/10=(X¯μσ/10)2=(N(0,1))2χ2
i=110(Xiμ)2σ2/10=i=110(Xiμσ/10)2=i=110(N(0,1))2=i=110χ2.
X1,,X10) หนึ่งในการแจกแจงแบบไคสแควร์เดี่ยวแต่ละอันนั้นมีส่วนร่วมอย่างใดอย่างหนึ่งต่อจำนวนความแปรปรวนแบบสุ่มที่คุณควรคาดหวังว่าจะได้รับ

มูลค่าของการบริจาคแต่ละครั้งไม่เท่ากับในเชิงคณิตศาสตร์เท่ากับอีกเก้าคน แต่ทั้งหมดนี้มีพฤติกรรมที่คาดหวังไว้เหมือนกันในการแจกแจง ในแง่ที่พวกเขามีความสมมาตรอย่างใด

หนึ่งใน Chi-square นั้นมีส่วนร่วมอย่างใดอย่างหนึ่งต่อจำนวนความแปรปรวนแบบสุ่มที่คุณควรคาดหวังจากผลรวมนั้น

หากคุณมีการสังเกต 100 ครั้งผลรวมข้างต้นจะคาดว่าจะใหญ่ขึ้นเพียงเพราะมีแหล่งที่มาของข้อผูกมัดมากขึ้น

แต่ละคน "แหล่งที่มาของผลงาน" ที่มีพฤติกรรมเดียวกันสามารถเรียกได้ว่าระดับของเสรีภาพ

ทีนี้กลับไปหนึ่งหรือสองขั้นตอนอ่านย่อหน้าก่อนหน้าอีกครั้งหากจำเป็นเพื่อรองรับการมาถึงของคุณในทันที

อ๋อระดับของเสรีภาพแต่ละคนสามารถจะคิดว่าเป็นหนึ่งหน่วยของความแปรปรวนที่คาดว่าจะเกิดขึ้น obligatorily และที่จะนำอะไรที่จะปรับปรุงการคาดเดาของหรือ 2μσ2

สิ่งที่เกิดขึ้นคือคุณเริ่มนับว่าพฤติกรรมของแหล่งที่มาของความแปรปรวนที่เทียบเท่ากัน 10 แหล่งนั้น หากคุณมีการสังเกต 100 ครั้งคุณจะมีแหล่งที่มาอิสระที่มีพฤติกรรมเหมือนกัน 100 แหล่งที่มีความผันผวนแบบสุ่มอย่างเข้มงวดกับผลรวมนั้น

ผลรวมของ 10 จิสี่เหลี่ยมที่ได้รับการเรียกว่าการแจกแจงไคสแควร์กับ10องศาอิสระจากนี้และเขียน{10} เราสามารถอธิบายสิ่งที่คาดหวังจากมันเริ่มต้นจากฟังก์ชั่นความหนาแน่นของความน่าจะเป็นของตนที่จะได้รับทางคณิตศาสตร์จากความหนาแน่นจากว่าการกระจาย Chi-Squared เดียว (จากนี้เรียกว่าการกระจายไคสแควร์กับหนึ่งระดับของเสรีภาพและการเขียน ) ซึ่งสามารถได้มาทางคณิตศาสตร์จากความหนาแน่นของการแจกแจงแบบปกติχ102χ12

"งั้นเหรอ?" --- คุณอาจจะคิดว่า --- "นั่นเป็นเรื่องดีถ้าพระเจ้าใช้เวลาในการบอกคุณค่าของและทุกสิ่งที่เขาสามารถบอกฉันได้!"μσ2

หากพระเจ้าผู้ทรงอำนาจไม่ว่างเกินไปที่จะบอกคุณค่าของและคุณจะยังคงมี 10 แหล่งที่มานั่นคือ 10 องศาอิสระμσ2

สิ่งต่าง ๆ เริ่มแปลก ๆ (ฮ่าฮ่าฮ่าฮ่าเพียงแค่ตอนนี้!) เมื่อคุณกบฏต่อพระเจ้าและลองด้วยตัวเองโดยไม่คาดหวังว่าจะให้การอุปถัมภ์คุณ

คุณมีและประมาณค่าสำหรับและ 2 คุณสามารถค้นหาวิธีการเดิมพันที่ปลอดภัยยิ่งขึ้นX¯S2μσ2

คุณสามารถลองคำนวณผลรวมข้างต้นด้วยและในตำแหน่งของและ : แต่นั่นคือ ไม่เหมือนกับผลรวมดั้งเดิมX¯S2μσ2

i=110(XiX¯)2S2/10=i=110(XiX¯S/10)2,

"ทำไมจะไม่ล่ะ?" คำในสี่เหลี่ยมจัตุรัสของผลรวมทั้งสองนั้นแตกต่างกันมาก ยกตัวอย่างเช่นไม่น่าเป็นไปได้ แต่การสังเกตของคุณทั้งหมดจะมีขนาดใหญ่กว่าซึ่งในกรณีนี้ซึ่งมีความหมายว่าแต่ตามลำดับเพราะ0 μ(Xiμ)>0i=110(Xiμ)>0i=110(XiX¯)=0i=110Xi10X¯=10X¯10X¯=0

แย่กว่านั้นคุณสามารถพิสูจน์ได้อย่างง่ายดาย (ฮาฮาฮาฮา; ขวา!) ที่มีความไม่เท่าเทียมอย่างเข้มงวดเมื่อการสังเกตอย่างน้อยสองครั้งแตกต่างกัน (ซึ่งไม่ใช่เรื่องผิดปกติ)i=110(XiX¯)2i=110(Xiμ)2

"แต่เดี๋ยวก่อน! มีอีกมาก!" ไม่มีการแจกแจงแบบปกติมาตรฐาน ไม่มี การกระจายแบบไคสแควร์ที่มีอิสระในระดับหนึ่ง ไม่มีการกระจายแบบไคสแควร์ด้วย อิสรภาพ 10 องศา ไม่มีการแจกแจงแบบปกติมาตรฐาน

XiX¯S/10
(XiX¯)2S2/10
i=110(XiX¯)2S2/10
X¯μS/10

"มันทั้งหมดเพื่ออะไร?"

ไม่มีทาง. ตอนนี้ความมหัศจรรย์มาแล้ว! โปรดทราบว่า หรือเทียบเท่า

i=110(XiX¯)2σ2=i=110[Xiμ+μX¯]2σ2=i=110[(Xiμ)(X¯μ)]2σ2=i=110(Xiμ)22(Xiμ)(X¯μ)+(X¯μ)2σ2=i=110(Xiμ)2(X¯μ)2σ2=i=110(Xiμ)2σ2i=110(X¯μ)2σ2=i=110(Xiμ)2σ210(X¯μ)2σ2=i=110(Xiμ)2σ2(X¯μ)2σ2/10
i=110(Xiμ)2σ2=i=110(XiX¯)2σ2+(X¯μ)2σ2/10.
ตอนนี้เรากลับไปที่ใบหน้าที่รู้จักกัน

เทอมแรกมีการแจกแจงแบบ Chi-squared ที่มีอิสระ 10 องศาและเทอมสุดท้ายจะมีการแจกแจงแบบ Chi-squared ที่มีระดับความอิสระหนึ่งระดับ (!)

เราแยก Chi-square ด้วย 10 แหล่งที่มาของความแปรปรวนอย่างเท่าเทียมกันในสองส่วนทั้งบวก: ส่วนที่หนึ่งคือ Chi-square ที่มีแหล่งที่มาของความแปรปรวนและอีกหนึ่งที่เราสามารถพิสูจน์ได้ (ก้าวกระโดดของความเชื่อ? ) ที่จะเป็น Chi-square ด้วย 9 (= 10-1) แหล่งที่มาของความแปรปรวนอย่างเท่าเทียมกันอย่างอิสระโดยที่ทั้งสองส่วนเป็นอิสระจากกัน

นี่เป็นข่าวดีอยู่แล้วตั้งแต่ตอนนี้เรามีการเผยแพร่

อนิจจามันใช้ซึ่งเราไม่สามารถเข้าถึงได้ (โปรดจำไว้ว่าพระเจ้ากำลังสร้างความสนุกสนานให้กับตัวเองในการเฝ้าดูการต่อสู้ของเรา)σ2

ดี ดังนั้น ดังนั้น ซึ่งเป็นการแจกแจงที่ไม่ใช่มาตรฐานปกติ แต่ความหนาแน่นสามารถมาจาก ความหนาแน่นของมาตรฐานทั่วไปและ Chi-squared กับองศาอิสระ

S2=1101i=110(XiX¯)2,
i=110(XiX¯)2σ2=i=110(XiX¯)2σ2=(101)S2σ2χ(101)2
X¯μS/10=X¯μσ/10Sσ=X¯μσ/10S2σ2=X¯μσ/10(101)S2σ2(101)=N(0,1)χ(101)2(101),
(101)

ผู้ชายที่ฉลาดหลักแหลมคนหนึ่งทำคณิตศาสตร์ [^ 1] ในช่วงต้นศตวรรษที่ 20 และด้วยเหตุนี้เขาจึงทำให้หัวหน้าของเขาเป็นผู้นำระดับโลกในอุตสาหกรรมเบียร์สเตาต์ ฉันกำลังพูดคุยเกี่ยวกับวิลเลียมซีลี Gosset (aka นักศึกษา; ใช่ว่านักศึกษาจากกระจาย) และเซนต์เจมส์ประตูโรงเบียร์ (aka โรงเบียร์กินเน ) ที่ฉันศรัทธาt

[^ 1]: @whuber บอกในความคิดเห็นด้านล่างว่า Gosset ไม่ได้ทำคณิตศาสตร์ แต่คาดเดาแทน! ฉันไม่รู้จริง ๆ ว่าเพลงใดที่น่าแปลกใจมากกว่าในตอนนั้น

นั่นคือเพื่อนที่รักของฉันคือที่มาของการแจกแจงมีองศาอิสระอัตราส่วนของมาตรฐานปกติและรากกำลังสองของไค - สแควร์อิสระหารด้วยองศาอิสระซึ่งคาดเดาได้จากกระแสน้ำที่ไม่อาจคาดการณ์ได้อธิบายถึงพฤติกรรมที่คาดหวังของข้อผิดพลาดในการประมาณที่คุณได้รับเมื่อใช้ค่าเฉลี่ยตัวอย่างเพื่อประเมินและการใช้เพื่อประเมินความแปรปรวนของXt(101)X¯μS2X¯

ไปแล้ว ด้วยรายละเอียดทางเทคนิคจำนวนมากที่น่าสะพรึงกลัวกวาดไปด้านหลังพรม แต่ไม่ได้ขึ้นอยู่กับการแทรกแซงของพระเจ้าเพียงอย่างเดียวที่จะวางเดิมพันทั้งหมด


1
ขอบคุณสำหรับความพยายามเช่นนี้! ฉันขอสารภาพว่าฉันพบคำอธิบายของคุณน้อยกว่าที่น่าเชื่อ ดูเหมือนว่าจะเป็นผู้ก่อตั้งที่จุดเชื่อมต่อที่สำคัญนี้: "แหล่งที่มาของการมีส่วนร่วม" แต่ละแห่งที่มีพฤติกรรมเดียวกันสามารถเรียกว่าระดับความมีอิสระ หากคุณได้รวมค่าตัวแปรปกติอิสระค่าแทนค่าตัวแปรchi-squared อิสระค่าคุณจะพบกับ - ตัวแปรปกติหนึ่งค่า ยังไงก็ตาม "องศาอิสระ" ก็ถูกกลืนหายไปหมด เห็นได้ชัดว่ามีบางสิ่งที่พิเศษเกี่ยวกับไคสแควร์ที่คุณยังไม่ได้อธิบาย BTW, Gosset ไม่ได้ทำคณิตศาสตร์: เขาเดา! 1010
whuber

ขอบคุณมากสำหรับการประเมินของคุณ @whuber! มันน่าประหลาดใจที่มีจำนวนตัวพิมพ์เกิดขึ้นเมื่อคุณลืมสิ่งที่คุณเขียน เกี่ยวกับการประเมินของคุณฉันตั้งใจจะแสดงให้เห็นอีกวิธีหนึ่งในการคิด - คณิตศาสตร์น้อยลงในบางแง่มุม นอกจากนี้ฉันไม่เข้าใจอย่างเต็มที่สิ่งที่คุณหมายถึงถ้าคุณได้รวม 10 ตัวแปรปกติอิสระมากกว่า 10 ตัวแปรไคสแควร์อิสระคุณจะท้ายด้วย - หนึ่งตัวแปรปกติ - ซึ่งฉันเดาว่าจะถือจุดสำคัญของคุณ . ฉันจะพยายามทำอย่างละเอียดเกี่ยวกับมันหวังว่าจะปรับปรุงการโพสต์
Marcelo Ventura

2

คำอธิบายง่ายขององศาอิสระคือว่าพวกเขาเป็นตัวแทน จำนวนชิ้นที่เป็นอิสระของข้อมูลที่มีอยู่ในข้อมูลสำหรับการประเมินพารามิเตอร์ (เช่นปริมาณที่ไม่รู้จัก) ที่น่าสนใจ

เป็นตัวอย่างในรูปแบบการถดถอยเชิงเส้นอย่างง่ายของรูปแบบ:

Yi=β0+β1Xi+ϵi,i=1,,n

ที่ 's แทนเงื่อนไขข้อผิดพลาดอิสระกระจายตามปกติที่มีค่าเฉลี่ย 0 และส่วนเบี่ยงเบนมาตรฐานเราจะใช้ 1 ระดับของเสรีภาพในการประมาณตัด 1 และระดับของเสรีภาพในการประมาณลาด\เนื่องจากเราเริ่มต้นด้วยการสังเกตและใช้เวลาอิสระถึง 2 องศา (เช่นข้อมูลสองชิ้นอิสระ) เราจึงเหลือองศาอิสระ (เช่นชิ้นอิสระ) สำหรับการประเมินข้อผิดพลาด ส่วนเบี่ยงเบนมาตรฐาน\ϵiσβ0β1nn2n2σ


ขอบคุณมากสำหรับการแก้ไขคำตอบของฉัน @COOLSerdash!
Isabella Ghement

2

คุณสามารถเห็นระดับความอิสระตามจำนวนการสังเกตลบด้วยจำนวนความสัมพันธ์ที่จำเป็นระหว่างการสังเกตเหล่านี้ โดยกันตัวอย่างถ้าคุณมีตัวอย่างของการสังเกตการกระจายปกติอิสระX_1,ตัวแปรสุ่มโดยที่x_i การศึกษาระดับปริญญาของเสรีภาพที่นี่เป็นเพราะพวกเขาเป็นหนึ่งในความสัมพันธ์ที่จำเป็นระหว่างการสังเกตวิทยานิพนธ์x_i)nX1,,Xni=1n(XiX¯n)2Xn12X¯n=1ni=1nXin1(X¯n=1ni=1nXi)

สำหรับข้อมูลเพิ่มเติมดูที่นี่


0

สำหรับฉันคำอธิบายแรกที่ฉันเข้าใจคือ:

หากคุณรู้คุณค่าทางสถิติเช่นค่าเฉลี่ยหรือความแปรปรวนจำนวนของข้อมูลที่คุณต้องรู้ก่อนที่คุณจะรู้ค่าของตัวแปรทุกตัว

นี่เป็นเช่นเดียวกับ aL3xa กล่าว แต่โดยไม่ต้องให้จุดข้อมูลใด ๆ มีบทบาทพิเศษและใกล้เคียงกับกรณีที่สามที่ได้รับคำตอบ ด้วยวิธีนี้ตัวอย่างเดียวกันจะเป็น:

หากคุณทราบค่าเฉลี่ยของข้อมูลคุณจำเป็นต้องทราบค่าสำหรับจุดข้อมูลทั้งหมดยกเว้นจุดเดียวเพื่อทราบค่าของจุดข้อมูลทั้งหมด


ตัวแปร -> การสังเกต
Richard Hardy

0

คิดแบบนี้ ความแปรปรวนเป็นสารเติมแต่งเมื่อเป็นอิสระ ตัวอย่างเช่นสมมติว่าเราโยนปาเป้าไปที่กระดานและเราวัดความเบี่ยงเบนมาตรฐานของการกระจัดของและจากจุดศูนย์กลางที่แน่นอนของกระดาน จากนั้นV_แต่ถ้าเราหาสแควร์รูทของสูตรเราจะได้สูตรระยะทางสำหรับพิกัดมุมฉาก . ตอนนี้สิ่งที่เราต้องแสดงก็คือค่าเบี่ยงเบนมาตรฐานเป็นตัวชี้วัดของการกระจัดออกจากศูนย์กลางของกระดานปาเป้า ตั้งแต่เรามีวิธีพูดคุยพร้อม df โปรดทราบว่าเมื่อxyVx,y=Vx+VyVx=SDx2Vx,ySDx,y=SDx2+SDy2SDx=i=1n(xix¯)2n1n=1จากนั้นและอัตราส่วน{0} กล่าวอีกนัยหนึ่งไม่มีความเบี่ยงเบนใด ๆ ที่จะเกิดขึ้นระหว่าง -dart และ -dart ครั้งแรกที่เรามีการเบี่ยงเบนสำหรับและมีเพียงหนึ่งในนั้นที่ซ้ำกัน ที่ซ้ำกันส่วนเบี่ยงเบนคือระยะทางที่ยกกำลังสองระหว่างหรือและเพราะเป็นจุดกึ่งกลางระหว่างหรือค่าเฉลี่ยของและx_2โดยทั่วไปสำหรับระยะทางเราจะลบ 1 เนื่องจากขึ้นอยู่กับทั้งหมดx1x¯=0 xn=2x1x2 ˉ x =x1+x2i=1n(xix¯)2n100xn=2x1x2 ˉ x x1x2n ˉ x nn-1x¯=x1+x22x¯x1x2nx¯nของระยะทางเหล่านั้น ตอนนี้แสดงถึงระดับความเป็นอิสระเพราะมันทำให้ปกติของผลลัพธ์ที่ไม่ซ้ำกันเพื่อทำให้ระยะทางที่คาดหวัง เมื่อแบ่งออกเป็นผลรวมของระยะทางสี่เหลี่ยมจัตุรัสเหล่านั้นn1

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.