สัญชาตญาณเบื้องหลังฟังก์ชันความหนาแน่นของการแจกแจงแบบ t


12

ฉันกำลังศึกษาเกี่ยวกับการแจกแจงค่า t ของนักเรียนและฉันเริ่มสงสัยว่าจะได้รับฟังก์ชันความหนาแน่นของการแจกแจงแบบ t (จากวิกิพีเดีย, http://en.wikipedia.org/wiki/Student%27s_t-distribution ) ได้อย่างไร:

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

โดยที่คือองศาอิสระและคือฟังก์ชันแกมม่า สัญชาตญาณของฟังก์ชั่นนี้คืออะไร? ฉันหมายถึงถ้าฉันดูฟังก์ชันความน่าจะเป็นแบบกระจายมวลแบบทวินามมันก็สมเหตุสมผลสำหรับฉัน แต่ฟังก์ชั่นความหนาแน่นของการแจกแจงแบบ t ทำให้ฉันไม่เข้าใจเลย ... มันไม่ง่ายเลยตั้งแต่แรกพบ หรือสัญชาตญาณเพียงว่ามันมีรูปทรงระฆังและมันตอบสนองความต้องการของเรา?vΓ

ขอบคุณสำหรับความช่วยเหลือใด ๆ :)


3
การกระจายนี้มีการตีความทางเรขาคณิตที่ง่าย (และสวย) ถึงแม้ว่านักศึกษา (1908) ได้รับรูปแบบของไฟล์ PDF นี้เป็นครั้งแรกผ่านการเดาที่ชาญฉลาด (สนับสนุนโดยการจำลอง Monte-Carlo) แต่ฟิชเชอร์ (c. 1920) ได้รับการโต้แย้งทางเรขาคณิตเป็นครั้งแรก สาระสำคัญก็คืออธิบายการกระจายตัวของอัตราส่วนของความสูงของ (จุดกระจายแบบสม่ำเสมอ) บน - ขอบเขตและรัศมี (ระยะห่างจากแกน): กล่าวอีกนัยหนึ่งแทนเจนต์ของละติจูด บัญชีผู้ใช้หนึ่งของการนี้จะมีให้ ณevolvedmicrobe.com/Literature/GeometricTDistribution.pdf fν+1
whuber

คำตอบ:


9

หากคุณมีตัวแปรสุ่มปกติมาตรฐานและตัวแปรสุ่มไคสแควร์อิสระพร้อม df ดังนั้นQ νZQν

T=Z/Q/ν

มีการแจกแจงแบบด้วย df (ฉันไม่แน่ใจว่าแจกจ่ายเป็นอะไร แต่มันไม่ใช่ )ν Z / Q ttνZ/Qt

การสืบทอดที่แท้จริงเป็นผลลัพธ์ที่ได้มาตรฐานอย่างเป็นธรรม Alecos ไม่ได้สองวิธีที่นี่

เท่าที่สัญชาตญาณไปฉันไม่มีสัญชาตญาณเฉพาะสำหรับรูปแบบการทำงานที่เฉพาะเจาะจง แต่บางความรู้สึกทั่วไปของรูปร่างสามารถรับได้โดยพิจารณาว่าการกระจาย (อิสระโดย ) ไคอิสระในส่วนที่ถูกต้อง ลาด:ν

ป้อนคำอธิบายรูปภาพที่นี่

โหมดอยู่ต่ำกว่า 1 เล็กน้อย (แต่ใกล้ถึง 1 เมื่อ df เพิ่มขึ้น) โดยมีโอกาสที่ค่าจะสูงกว่าและต่ำกว่า 1 การแปรผันในหมายความว่าความแปรปรวนของจะมากกว่า ของZค่าของสูงกว่า 1 จะนำไปสู่ค่า -value ที่ใกล้กับ 0 มากกว่าในขณะที่ค่าที่ต่ำกว่า 1 จะส่งผลให้ค่าค่าที่มากกว่า 0 คือ tZQ/νtZ tZtZQ/νtZtZ

ทั้งหมดนี้หมายความว่าค่าจะเป็น (i) ตัวแปรมากขึ้น (ii) ยอดแหลมมากขึ้นและ (iii) หนักกว่า tailed กว่าปกติ เมื่อ df เพิ่มขึ้นกระจุกตัวอยู่ที่ประมาณ 1 และจากนั้นจะเข้าใกล้ปกติมากขึ้นt tQ/νt

ป้อนคำอธิบายรูปภาพที่นี่

('ยอดแหลมที่ค่อนข้างมากกว่า' ส่งผลให้ยอดเขาที่แหลมกว่าเล็กน้อยเทียบกับการแพร่กระจาย แต่ความแปรปรวนที่ใหญ่กว่าจะดึงจุดศูนย์กลางลงซึ่งหมายความว่าจุดสูงสุดนั้นต่ำลงเล็กน้อยเมื่อลดระดับ df)

นั่นคือสัญชาตญาณว่าทำไมดูเป็นอย่างนั้นt


1
คำอธิบายของฉันค่อนข้างเลอะเทอะ แน่นอนว่ามันคือสแควร์รูทของตัวแปรสุ่มแบบกระจายของไคสแควร์หารด้วยองศาอิสระ
นักวิเคราะห์

@Analyst ฉันทำแบบเดียวกันมากกว่าหนึ่งครั้ง
Glen_b -Reinstate Monica

9

คำตอบของ Glen เป็นคำตอบที่ถูกต้อง แต่จากมุมมองแบบเบย์มันก็มีประโยชน์เช่นกันถ้าคิดว่าการแจกแจงแบบ t เป็นการผสมผสานแบบต่อเนื่องของการแจกแจงแบบปกติที่มีความแปรปรวนต่างกัน คุณสามารถหาที่มาที่นี่:

นักเรียนเป็นส่วนผสมของ Gaussian

ฉันรู้สึกว่าวิธีนี้ช่วยปรีชาของคุณเพราะมันชัดเจนว่าการแจกแจงแบบทีเกิดขึ้นเมื่อคุณไม่รู้ความแปรปรวนที่แน่นอนของประชากรของคุณ


2
ฉันสร้างแอนิเมชันของการแจกแจงทีเป็นส่วนผสมของการแจกแจงแบบปกติที่นี่: sumsar.net/blog/2013/12/t-as-a-mixture-of-normals
Rasmus Bååth
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.