สรุป
คุณได้ค้นพบส่วนหนึ่งของการก่อสร้างใหม่ที่อธิบายไว้ในทฤษฎีลิมิตขั้นกลางสำหรับตัวอย่างมีเดียซึ่งแสดงการวิเคราะห์ค่ามัธยฐานของตัวอย่าง (การวิเคราะห์เห็นได้ชัดว่ามีผลบังคับใช้โดยอนุโลมกับจำนวนใด ๆ ไม่ใช่แค่ค่ามัธยฐาน) ดังนั้นจึงไม่น่าแปลกใจที่พารามิเตอร์เบต้าขนาดใหญ่ (ตรงกับตัวอย่างขนาดใหญ่) การแจกแจงแบบปกติเกิดขึ้นภายใต้การแปลงที่อธิบายไว้ในคำถาม สิ่งที่น่าสนใจคือใกล้เคียงกับการแจกแจงปกติถึงแม้จะเป็นพารามิเตอร์เบต้า ขนาดเล็ก นั่นสมควรคำอธิบาย
ฉันจะร่างการวิเคราะห์ด้านล่าง เพื่อให้โพสต์นี้มีความยาวที่เหมาะสมมันเกี่ยวข้องกับการโบกมือด้วยมือที่มีการชี้นำหลายอย่าง: ฉันตั้งเป้าที่จะชี้เฉพาะความคิดหลัก ๆ เท่านั้น ให้ฉันสรุปผลลัพธ์ที่นี่:
เมื่อใกล้กับβทุกอย่างจะสมมาตร นี่ทำให้การแจกแจงที่ถูกแปลงแล้วดูเป็นปกติαβ
ฟังก์ชั่นในรูปแบบดูค่อนข้างปกติในสถานที่แรกแม้สำหรับค่าเล็ก ๆ ของαและβ(ให้ทั้งเกิน1และอัตราของพวกเขาคือไม่มากเกินไป ใกล้กับ0หรือ1)Φα−1(x)(1−Φ(x))β−1αβ101
Normality ที่ชัดเจนของการแจกแจงแบบเปลี่ยนรูปนั้นเกิดจากความจริงที่ว่าความหนาแน่นของมันประกอบด้วยความหนาแน่นปกติคูณด้วยฟังก์ชันใน (2)
เมื่อและβเพิ่มขึ้นการออกเดินทางจาก Normality สามารถวัดได้ในเทอมที่เหลือในซีรี่ส์ Taylor สำหรับความหนาแน่นของบันทึก คำสั่งของnลดลงตามสัดส่วนของαβnอำนาจของ αและβ ซึ่งหมายความว่าในที่สุดสำหรับขนาดใหญ่พอสมควร αและ β , เงื่อนไขของการใช้พลังงาน n = 3หรือสูงกว่าได้กลายเป็นที่ค่อนข้างเล็กเหลือเพียงกำลังสอง: ที่แม่นยำความหนาแน่นเข้าสู่ระบบของการกระจายปกติ(n−2)/2αβαβn=3
เรียกรวมกันว่าพฤติกรรมเหล่านี้เป็นอย่างดีอธิบายว่าทำไมแม้สำหรับขนาดเล็กและเบต้า quantiles ที่ไม่รุนแรงของ IID ปกติตัวอย่างดูประมาณปกติαβ
การวิเคราะห์
เพราะมันจะมีประโยชน์ที่จะพูดคุยให้เป็นใด ๆฟังก์ชั่นการกระจายถึงแม้ว่าเรามีในใจF = ΦFF=Φ
ฟังก์ชันความหนาแน่นของตัวแปรBeta ( α , β )คือโดยนิยามตามสัดส่วนg(y)(α,β)
yα−1(1−y)β−1dy.
ปล่อยให้เป็นความน่าจะเป็นการแปลงอินทิกรัลของxและการเขียนfสำหรับอนุพันธ์ของF , มันจะเกิดขึ้นทันทีที่xมีความหนาแน่นตามสัดส่วนy=F(x)xfFx
G(x;α,β)=F(x)α−1(1−F(x))β−1f(x)dx.
เพราะนี่คือการแปลงแบบโมโนโทนิของการกระจายแบบแรงเดียว (เบต้า) ยกเว้นว่าค่อนข้างแปลกการกระจายแบบเปลี่ยนรูปจะเป็นแบบ unimodal เช่นกัน เพื่อศึกษาว่ามันใกล้เคียงกับ Normal มากแค่ไหนลองตรวจสอบลอการิทึมของความหนาแน่นF
logG(x;α,β)=(α−1)logF(x)+(β−1)log(1−F(x))+logf(x)+C(1)
โดยที่คือค่าคงที่ที่ไม่เกี่ยวข้องของการทำให้เป็นมาตรฐานC
ขยายส่วนประกอบของในซีรี่ส์ Taylor เพื่อสั่งสามค่า x 0 (ซึ่งจะอยู่ใกล้กับโหมด) ตัวอย่างเช่นเราอาจเขียนส่วนขยายของบันทึกFเป็นlogG(x;α,β)x0logF
logF(x)=cF0+cF1(x−x0)+cF2(x−x0)2+cF3h3
สำหรับบางด้วย| h | ≤ | x -h. ใช้สัญกรณ์คล้ายกันสำหรับการเข้าสู่ระบบ( 1 - F )และเข้าสู่ระบบฉ |h|≤|x−x0|log(1−F)logf
เงื่อนไขเชิงเส้น
คำเชิงเส้นในจะกลายเป็น(1)
g1(α,β)=(α−1)cF1+(β−1)c1−F1+cf1.
เมื่อเป็นโหมดของG (x0การแสดงออกนี้เป็นศูนย์ โปรดทราบว่าเนื่องจากสัมประสิทธิ์เป็นฟังก์ชันต่อเนื่องของ x 0เนื่องจาก αและ βมีการเปลี่ยนแปลงโหมด x 0จะแตกต่างกันอย่างต่อเนื่องเช่นกัน นอกจากนี้เมื่อ αและ βมีขนาดใหญ่พอที่คฉ 1ระยะกลายเป็นค่อนข้างเล็กน้อย ถ้าเราตั้งเป้าหมายที่จะศึกษาขีด จำกัด เป็น α → ∞และ β → ∞ซึ่ง α : βอยู่ในสัดส่วนคงที่ γG(;α,β)x0αβx0αβcf1α→∞β→∞ α:βγเราอาจดังนั้นทันทีและสำหรับทั้งหมดเลือกจุดฐานที่x0
γcF1+c1−F1=0.
กรณีที่ดีคือที่ที่α = βตลอดและFสมมาตรเกี่ยวกับ0 ในกรณีที่ว่าก็เป็นที่ชัดเจนx 0 = F ( 0 ) = 1 / 2γ=1α=βF0x0=F(0)=1/2
เราประสบความสำเร็จในวิธีการโดย (a) ในขีด จำกัด คำสั่งที่หนึ่งในชุดเทย์เลอร์หายตัวไปและ (b) ในกรณีพิเศษที่เพิ่งอธิบาย
เงื่อนไขกำลังสอง
เหล่านี้คือผลรวม
g2(α,β)=(α−1)cF2+(β−1)c1−F2+cf2.
Comparing to a Normal distribution, whose quadratic term is −(1/2)(x−x0)2/σ2, we may estimate that −1/(2g2(α,β)) is approximately the variance of G. Let us standardize G by rescaling x by its square root. we don't really need the details; it suffices to understand that this rescaling is going to multiply the coefficient of (x−x0)n in the Taylor expansion by (−1/(2g2(α,β)))n/2.
Remainder term
Here's the punchline: the term of order n in the Taylor expansion is, according to our notation,
gn(α,β)=(α−1)cFn+(β−1)c1−Fn+cfn.
After standardization, it becomes
g′n(α,β)=gn(α,β)(−2g2(α,β))n/2).
Both of the gi are affine combination of α and β. By raising the denominator to the n/2 power, the net behavior is of order −(n−2)/2 in each of α and β. As these parameters grow large, then, each term in the Taylor expansion after the second decreases to zero asymptotically. In particular, the third-order remainder term becomes arbitrarily small.
The case when F is normal
The vanishing of the remainder term is particularly fast when F is standard Normal, because in this case f(x) is purely quadratic: it contributes nothing to the remainder terms. Consequently, the deviation of G from normality depends solely on the deviation between Fα−1(1−F)β−1 and normality.
This deviation is fairly small even for small α and β. To illustrate, consider the case α=β. G is symmetric, whence the order-3 term vanishes altogether. The remainder is of order 4 in x−x0=x.
Here is a plot showing how the standardized fourth order term changes with small values of α>1:
The value starts out at 0 for α=β=1, because then the distribution obviously is Normal (Φ−1 applied to a uniform distribution, which is what Beta(1,1) is, gives a standard Normal distribution). Although it increases rapidly, it tops off at less than 0.008--which is practically indistinguishable from zero. After that the asymptotic reciprocal decay kicks in, making the distribution ever closer to Normal as α increases beyond 2.