ความเป็นมาของการแปลงสภาพให้เป็นมาตรฐานสำหรับ GLM


15

วิธีการคือ normalizing เปลี่ยนสำหรับครอบครัวชี้แจง มา? A ( ) = d uV 1 / 3 ( μ )A()=duV1/3(μ)

โดยเฉพาะอย่างยิ่ง : ฉันพยายามติดตามภาพร่างการขยายตัวของเทย์เลอร์ในหน้า 3 เลื่อน 1 ที่นี่แต่มีคำถามหลายข้อ ด้วยXXจากตระกูลชี้แจงการแปลงh ( X )h(X)และκ ฉันκiแสดงถึงฉันทีเอชith cumulant สไลด์ยืนยันว่า: κ 3 ( h ( ˉ X ) ) h ( μ ) 3 κ 3 ( ˉ X )N 2 +3h(μ)2h(μ)σ4N +O(N-3),

κ3(h(X¯))h(μ)3κ3(X¯)N2+3h(μ)2h′′(μ)σ4N+O(N3),
และยังคงหาh ( X )h(X)อย่างเดียวซึ่งค่าดังกล่าวข้างต้นประเมินเป็น 0
  1. คำถามแรกของฉันเกี่ยวกับเลขคณิต: การขยายตัวของเทย์เลอร์ของฉันมีค่าสัมประสิทธิ์ที่แตกต่างกันและฉันไม่สามารถพิสูจน์ได้ว่าพวกเขามีเงื่อนไขลดลง

    ตั้งแต่  h ( x )h ( μ ) + h ( μ ) ( x - μ ) + h ( x )2 (x-μ)2เรามี:h( ˉ X )-h(u)h ( u ) ) ( ˉ X - μ ) + h ( x )2 ( ˉ X -μ)2E(เอช( ˉ X )-เอช(U))3h ( μ ) 3 E ( ˉ X - μ ) 3 + 32h(μ)2h(μ)E(ˉXμ)4+34h(μ)h(μ)2E(ˉXμ)5+18h(μ)3E(ˉXμ)6.

    Since h(x)h(X¯)h(u)E(h(X¯)h(u))3h(μ)+h(μ)(xμ)+h′′(x)2(xμ)2, we have:h(u))(X¯μ)+h′′(x)2(X¯μ)2h(μ)3E(X¯μ)3+32h(μ)2h′′(μ)E(X¯μ)4+34h(μ)h′′(μ)2E(X¯μ)5+18h′′(μ)3E(X¯μ)6.

    ฉันสามารถทำสิ่งที่คล้ายกันโดยแทนที่ช่วงเวลากลางด้วยสิ่งที่เทียบเท่าของพวกเขา แต่มันก็ยังไม่เพิ่มขึ้น

  2. คำถามที่สอง: ทำไมการวิเคราะห์เริ่มต้นด้วยˉXX¯แทนXXปริมาณที่เราสนใจจริง ๆ


คุณดูเหมือนจะมีuuหลายต่อหลายครั้งที่คุณหมายถึงμμ
Glen_b -Reinstate โมนิกา

คำตอบ:


2

สไลด์ที่คุณลิงก์ไปนั้นค่อนข้างสับสนออกจากขั้นตอนและพิมพ์ผิดเล็กน้อย แต่ท้ายที่สุดแล้วมันก็ถูกต้อง มันจะช่วยตอบคำถาม 2 ก่อนจากนั้น 1 และในที่สุดก็จะได้การเปลี่ยนแปลงสมมาตรdA ( u ) = u - 1[ V ( θ ) ] 1 / 3 dθA(u)=u1[V(θ)]1/3dθ

คำถามที่ 2. เรากำลังวิเคราะห์ขณะที่มันมีค่าเฉลี่ยของกลุ่มตัวอย่างที่มีขนาดของตัวแปรสุ่ม IIDx_n นี่เป็นปริมาณที่สำคัญเพราะการสุ่มตัวอย่างการกระจายตัวแบบเดียวกันและการหาค่าเฉลี่ยเกิดขึ้นตลอดเวลาในวิทยาศาสตร์ เราต้องการทราบว่าใกล้เคียงกับค่าเฉลี่ยจริงอย่างไร เซ็นทรัล จำกัด ทฤษฎีบทบอกว่ามันจะมาบรรจบกันที่จะเป็นแต่เราอยากจะรู้ว่าความแปรปรวนและความเบ้ของ{X}ˉ X NX1, . . ,XN ˉ X μμN→การ ˉ XX¯NX1,...,XNX¯μμNX¯

คำถามที่ 1. การประมาณซีรี่ส์ของ Taylor ของคุณไม่ถูกต้อง แต่เราต้องระมัดระวังเกี่ยวกับการติดตามกับและ ofเพื่อให้ได้ข้อสรุปเช่นเดียวกับสไลด์ เราจะเริ่มต้นด้วยคำจำกัดความของและช่วงเวลากลางของและได้รับสูตรสำหรับ :ˉ X XฉันN ˉ X Xฉันκ3(h( ˉ X ))X¯XiNX¯Xiκ3( h ( X)¯) )

ˉ X =1NNi=1XiX¯=1NNi=1Xi

E[Xi]=μE[Xi]=μ

V(Xi)=E[(Xiμ)2]=σ2V(Xi)=E[(Xiμ)2]=σ2

κ3(Xi)=E[(Xiμ)3]κ3(Xi)=E[(Xiμ)3]

ตอนนี้ช่วงเวลาสำคัญของ :ˉXX¯

E[ˉX]=1NNi=1E[Xi]=1N(Nμ)=μE[X¯]=1NNi=1E[Xi]=1N(Nμ)=μ

V(ˉX)=E[(ˉXμ)2]=E[((1NNi=1Xi)μ)2]=E[(1NNi=1(Xiμ))2]=1N2(NE[(Xiμ)2]+N(N1)E[Xiμ]E[Xjμ])=1Nσ2V(X¯)=E[(X¯μ)2]=E[((1Ni=1NXi)μ)2]=E[(1Ni=1N(Xiμ))2]=1N2(NE[(Xiμ)2]+N(N1)E[Xiμ]E[Xjμ])=1Nσ2

ขั้นตอนสุดท้ายต่อเนื่องจากและ 2 สิ่งนี้อาจไม่ได้มาจากที่ง่ายที่สุดแต่มันเป็นกระบวนการเดียวกันที่เราต้องทำเพื่อหาและที่เราแยกย่อยผลรวมของผลรวมและนับจำนวนเทอมด้วยพลังของตัวแปรที่แตกต่างกัน ในกรณีดังกล่าวข้างต้นมีแง่ที่เป็นของแบบฟอร์มและแง่ของรูปแบบMU)E[Xiμ]=0E[Xiμ]=0E[(Xiμ)2]=σ2E[(Xiμ)2]=σ2V(ˉX)V(X¯)κ3(ˉX)κ3(X¯)κ3(h(ˉX))κ3(h(X¯))NN(Xiμ)2(Xiμ)2N(N1)N(N1)(Xiμ)(Xjμ)(Xiμ)(Xjμ)

κ3(ˉX)=E[(ˉXμ)3)]=E[((1NNi=1Xi)μ)3]=E[(1NNi=1(Xiμ))3]=1N3(NE[(Xiμ)3]+3N(N1)E[(Xiμ)E[(Xjμ)2]+N(N1)(N2)E[(Xiμ)]E[(Xjμ)]E[(Xkμ)]=1N2E[(Xiμ)3]=κ3(Xi)N2κ3(X¯)=E[(X¯μ)3)]=E[((1Ni=1NXi)μ)3]=E[(1Ni=1N(Xiμ))3]=1N3(NE[(Xiμ)3]+3N(N1)E[(Xiμ)E[(Xjμ)2]+N(N1)(N2)E[(Xiμ)]E[(Xjμ)]E[(Xkμ)]=1N2E[(Xiμ)3]=κ3(Xi)N2

ต่อไปเราจะขยายในซีรี่ส์ Taylor ตามที่คุณมี:h(ˉX)h(X¯)

h(ˉX)=h(μ)+h(μ)(ˉXμ)+12h(μ)(ˉXμ)2+13h(μ)(ˉXμ)3+...h(X¯)=h(μ)+h(μ)(X¯μ)+12h′′(μ)(X¯μ)2+13h′′′(μ)(X¯μ)3+...

E[h(ˉX)]=h(μ)+h(μ)E[ˉXμ]+12h(μ)E[(ˉXμ)2]+13h(μ)E[(ˉXμ)3]+...=h(μ)+12h(μ)σ2N+13h(μ)κ3(Xi)N2+...E[h(X¯)]=h(μ)+h(μ)E[X¯μ]+12h′′(μ)E[(X¯μ)2]+13h′′′(μ)E[(X¯μ)3]+...=h(μ)+12h′′(μ)σ2N+13h′′′(μ)κ3(Xi)N2+...

ด้วยความพยายามบางอย่างมากกว่าที่คุณสามารถพิสูจน์ได้ว่าส่วนที่เหลือของข้อตกลงที่มี3}) ในที่สุดเนื่องจาก , (ซึ่งไม่เหมือนกับ ) เราทำการคำนวณที่คล้ายกันอีกครั้ง:O(N3)O(N3)κ3(h(ˉX))=E[(h(ˉX)E[h(ˉX)])3]κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]E[(h(ˉX)h(μ))3]E[(h(X¯)h(μ))3]

κ3(h(ˉX))=E[(h(ˉX)E[h(ˉX)])3]=E[(h(μ)+h(μ)(ˉXμ)+12h(μ)(ˉXμ)2+O((ˉXμ)3)h(μ)12h(μ)σ2NO(N2))3]κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]=E[(h(μ)+h(μ)(X¯μ)+12h′′(μ)(X¯μ)2+O((X¯μ)3)h(μ)12h′′(μ)σ2NO(N2))3]

เราสนใจเฉพาะเงื่อนไขที่ทำให้เกิดคำสั่งและมีงานพิเศษที่คุณสามารถแสดงให้เห็นว่าคุณไม่ต้องการคำว่า " "หรือ" "ก่อนที่จะถ่ายอำนาจที่สามขณะที่พวกเขาเท่านั้นที่จะส่งผลในแง่ของการสั่งซื้อ3}) ดังนั้นทำให้ง่ายขึ้นเราได้รับO(N2)O(N2)O((ˉXμ)3)O((X¯μ)3)O(N2)O(N2)O(N3)O(N3)

κ3(h(ˉX))=E[(h(μ)(ˉXμ)+12h(μ)(ˉXμ)212h(μ)σ2N))3]=E[h(μ)3(ˉXμ)3+18h(μ)3(ˉXμ)618h(μ)3σ6N3+32h(μ)2h(μ)(ˉXμ)4+34h(μ)h(μ)(ˉXμ)532h(μ)2h(μ)(ˉXμ)2σ2N+O(N3)]κ3(h(X¯))=E[(h(μ)(X¯μ)+12h′′(μ)(X¯μ)212h′′(μ)σ2N))3]=E[h(μ)3(X¯μ)3+18h′′(μ)3(X¯μ)618h′′(μ)3σ6N3+32h(μ)2h′′(μ)(X¯μ)4+34h(μ)h′′(μ)(X¯μ)532h(μ)2h′′(μ)(X¯μ)2σ2N+O(N3)]

ฉันทิ้งคำศัพท์บางคำที่เห็นได้ชัดว่าในผลิตภัณฑ์นี้ คุณจะต้องโน้มน้าวตัวเองว่าเงื่อนไขและมีเช่นกัน อย่างไรก็ตามO(N3)O(N3)E[(ˉXμ)5]E[(X¯μ)5]E[(ˉXμ)6]E[(X¯μ)6]O(N3)O(N3)

E[(ˉXμ)4]=E[1N4(Ni=1(ˉXμ))4]=1N4(NE[(Xiμ)4]+3N(N1)E[(Xiμ)2]E[(Xjμ)2]+0)=3N2σ4+O(N3)E[(X¯μ)4]=E[1N4(i=1N(X¯μ))4]=1N4(NE[(Xiμ)4]+3N(N1)E[(Xiμ)2]E[(Xjμ)2]+0)=3N2σ4+O(N3)

จากนั้นกระจายความคาดหวังในสมการของเราสำหรับเรามีκ3(h(ˉX))κ3(h(X¯))

κ3(h(ˉX))=h(μ)3E[(ˉXμ)3]+32h(μ)2h(μ)E[(ˉXμ)4]32h(μ)2h(μ)E[(ˉXμ)2]σ2N+O(N3)=h(μ)3κ3(Xi)N2+92h(μ)2h(μ)σ4N232h(μ)2h(μ)σ4N2+O(N3)=h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2+O(N3)κ3(h(X¯))=h(μ)3E[(X¯μ)3]+32h(μ)2h′′(μ)E[(X¯μ)4]32h(μ)2h′′(μ)E[(X¯μ)2]σ2N+O(N3)=h(μ)3κ3(Xi)N2+92h(μ)2h′′(μ)σ4N232h(μ)2h′′(μ)σ4N2+O(N3)=h(μ)3κ3(Xi)N2+3h(μ)2h′′(μ)σ4N2+O(N3)

นี้สรุปมาของ{X})) ตอนนี้ที่สุดท้ายที่เราจะได้รับมา symmetrizing แปลงdκ3(h(ˉX))κ3(h(X¯))A(u)=u1[V(θ)]1/3dθA(u)=u1[V(θ)]1/3dθ

สำหรับการแปลงนี้เป็นสิ่งสำคัญที่มาจากการแจกแจงแบบครอบครัวแบบเอกซ์โพเนนเชียลและโดยเฉพาะอย่างยิ่งครอบครัวแบบเอ็กซ์โปเนนเชียลตามธรรมชาติ (หรือถูกแปลงเป็นการกระจายแบบนี้), ในรูปแบบXiXifXi(x;θ)=h(x)exp(θxb(θ))fXi(x;θ)=h(x)exp(θxb(θ))

ในกรณีนี้ cumulants ของการกระจายที่จะได้รับจากtheta) ดังนั้น ,และtheta) เราสามารถเขียนพารามิเตอร์เป็นหน้าที่ของเพียงการผกผันของเขียนMU) แล้วก็κk=b(k)(θ)κk=b(k)(θ)μ=b(θ)μ=b(θ)σ2=V(θ)=b(θ)σ2=V(θ)=b′′(θ)κ3=b(θ)κ3=b′′′(θ)θθμμbbθ(μ)=(b)1(μ)θ(μ)=(b)1(μ)

θ(μ)=1b((b)1(μ))=1b(θ))=1σ2θ(μ)=1b′′((b)1(μ))=1b′′(θ))=1σ2

ต่อไปเราสามารถเขียนความแปรปรวนเป็นฟังก์ชันของและเรียกใช้ฟังก์ชันนี้ :μμˉVV¯

ˉV(μ)=V(θ(μ))=b(θ(μ))V¯(μ)=V(θ(μ))=b′′(θ(μ))

แล้วก็

ddμˉV(μ)=V(θ(μ))θ(μ)=b(θ)1σ2=κ3σ2ddμV¯(μ)=V(θ(μ))θ(μ)=b′′′(θ)1σ2=κ3σ2

ดังนั้นเป็นหน้าที่ของ ,MU)μμκ3(μ)=ˉV(μ)ˉV(μ)κ3(μ)=V¯(μ)V¯(μ)

ตอนนี้สำหรับการแปลงสมมาตรเราต้องการลดความเบ้ของโดยทำให้เพื่อให้คือ3}) ดังนั้นเราต้องการh(ˉX)h(X¯)h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2=0h(μ)3κ3(Xi)N2+3h(μ)2h′′(μ)σ4N2=0h(ˉX)h(X¯)O(N3)O(N3)

h(μ)3κ3(Xi)+3h(μ)2h(μ)σ4=0h(μ)3κ3(Xi)+3h(μ)2h′′(μ)σ4=0

การแทนที่นิพจน์ของเราสำหรับและเป็นฟังก์ชันของเรามี:σ2σ2κ3κ3μμ

h(μ)3ˉV(μ)ˉV(μ)+3h(μ)2h(μ)ˉV(μ)2=0h(μ)3V¯(μ)V¯(μ)+3h(μ)2h′′(μ)V¯(μ)2=0

ดังนั้นนำไปสู่0h(μ)3ˉV(μ)+3h(μ)2h(μ)ˉV(μ)=0h(μ)3V¯(μ)+3h(μ)2h′′(μ)V¯(μ)=0ddμ(h(μ)3ˉV(μ))=0ddμ(h(μ)3V¯(μ))=0

ทางออกหนึ่งสำหรับสมการเชิงอนุพันธ์นี้คือ:

h(μ)3ˉV(μ)=1h(μ)3V¯(μ)=1 ,

h(μ)=1[ˉV(μ)]1/3h(μ)=1[V¯(μ)]1/3

ดังนั้นสำหรับค่าคงที่ใด ๆ . สิ่งนี้ทำให้เรามีการเปลี่ยนแปลงสมมาตรโดยที่คือความแปรปรวนเป็น ฟังก์ชันของค่าเฉลี่ยในครอบครัวเลขชี้กำลังแบบธรรมชาติh(μ)=μc1[ˉV(θ)]1/3dθh(μ)=μc1[V¯(θ)]1/3dθccA(u)=u1[V(θ)]1/3dθA(u)=u1[V(θ)]1/3dθVV


1

1. เหตุใดฉันจึงไม่สามารถรับผลลัพธ์เดียวกันโดยประมาณในช่วงเวลาที่ไม่ใช่ศูนย์กลางแล้วคำนวณช่วงเวลากลางโดยใช้ช่วงเวลาที่ไม่เป็นศูนย์กลางประมาณ?EˉXkEX¯kE(ˉXEˉX)kE(X¯EX¯)k

เนื่องจากคุณเปลี่ยนการสืบทอดมาโดยพลการและปล่อยเทอมตกค้างซึ่งมีความสำคัญ หากคุณไม่คุ้นเคยกับสัญลักษณ์ O ขนาดใหญ่และผลลัพธ์ที่เกี่ยวข้องการอ้างอิงที่ดีคือ [Casella & Lehmann]

h(ˉX)h(u)h(u)(ˉXμ)+h(x)2(ˉXμ)2+O[(ˉXμ)3]

h(X¯)h(u)h(u)(X¯μ)+h′′(x)2(X¯μ)2+O[(X¯μ)3]

E[h(ˉX)h(u)]h(u)E(ˉXμ)+h(x)2E(ˉXμ)2+(?)

แต่แม้ว่าคุณจะไม่ทิ้งสิ่งตกค้างด้วยการพิสูจน์ว่าคุณกำลังทำ (ซึ่งไม่ถูกกฎหมาย ... ) ขั้นตอนต่อไปนี้: กำลังบอกว่าN\E(h(ˉX)h(u))3h(μ)3\E(ˉXμ)3+32h(μ)2h(μ)\E(ˉXμ)4+34h(μ)h(μ)2\E(ˉXμ)5+18h(μ)3\E(ˉXμ)6.(1)

[h(x)h(x0)]3dx=[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3dx=(1)

หากนี่ยังไม่ชัดเจนเราจะเห็นพีชคณิตของการขยายอินทิกรัลและไปตาม

[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3(2)

ให้ , ,A=h(x0)(xx0)B=12h(x0)(xx0)2C=O((xx0)3) (2)=[A+B+C]3 [A3+3A2B+3AB2+B3]=[A+B]3=(1)

ความผิดพลาดของคุณคือการละทิ้งสิ่งตกค้างก่อนการขยายซึ่งเป็นความผิดพลาด "คลาสสิค" ในสัญกรณ์ O ขนาดใหญ่และต่อมากลายเป็นคำวิจารณ์ของการใช้สัญกรณ์ O ขนาดใหญ่

2. ทำไมการวิเคราะห์เริ่มต้นด้วยแทนปริมาณที่เราสนใจจริง ๆˉXX

เนื่องจากเราต้องการวิเคราะห์โดยใช้สถิติที่เพียงพอของแบบจำลองเลขชี้กำลังที่เราแนะนำ ถ้าคุณมีตัวอย่างขนาด 1 แล้วไม่มีความแตกต่างไม่ว่าคุณจะวิเคราะห์ด้วยหรือX_1ˉX=1nni=1XiX1

นี่เป็นบทเรียนที่ดีในสัญกรณ์ O ที่ยิ่งใหญ่แม้ว่ามันจะไม่เกี่ยวข้องกับ GLM ...

ข้อมูลอ้างอิง [Casella & Lehmann] Lehmann, Erich Leo และ George Casella ทฤษฎีการประมาณแต้ม Springer Science & Business Media, 2006

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.