สัญชาตญาณที่อยู่เบื้องหลังการนิยามความสมบูรณ์ในสถิติเป็นสิ่งที่เป็นไปไม่ได้ที่จะสร้างตัวประมาณที่ไม่มีอคติเท่ากับจากอะไร?


21

ในสถิติคลาสสิคมีคำจำกัดความว่าสถิติของชุดข้อมูลถูกกำหนดให้สมบูรณ์สำหรับพารามิเตอร์มันเป็นไปไม่ได้ที่จะสร้างตัวประมาณค่าที่ไม่เอนเอียงเป็นจากมันโดยไม่ตั้งใจ นั่นคือวิธีเดียวที่จะมีสำหรับทั้งหมดคือการมีเป็นเกือบแน่นอนTy1,,ynθ0Eh(T(y))=0θh0

มีปรีชาเบื้องหลังนี้ไหม ดูเหมือนว่าจะเป็นวิธีที่ใช้ในการกำหนดสิ่งนี้ฉันรู้ว่าสิ่งนี้ได้รับการถามมาก่อน แต่สงสัยว่ามีสัญชาตญาณที่เข้าใจได้ง่ายซึ่งจะทำให้นักเรียนเกริ่นนำมีเวลาย่อยวัสดุได้ง่ายขึ้น


2
นั่นเป็นคำถามที่ดีมากฉันต้องขุดมันเอง ปรากฎว่าเหตุผลที่มันเป็นคำจำกัดความทางกลและไม่ได้มีความหมายโดยสัญชาตญาณกับผู้ฝึกมาตรฐานเช่นฉันคือมันถูกใช้เพื่อพิสูจน์การมีส่วนร่วมขั้นพื้นฐานในสถิติทางคณิตศาสตร์เป็นหลัก โดยเฉพาะอย่างยิ่งการค้นหาสั้น ๆ ของฉันพบว่าทฤษฎีบทLehmann-Schefféและทฤษฎีบทของ Basuต้องการความสมบูรณ์ของสถิติเพื่อที่จะถือ นี่คือผลงานของกลางปี ​​1950 ฉันไม่สามารถให้คำอธิบายที่เข้าใจง่ายแก่คุณได้ - แต่ถ้าคุณต้องการสร้างสิ่งหนึ่งอาจจะเป็นหลักฐานที่พิสูจน์ได้
Jeremias K

คำตอบ:


18

ฉันจะพยายามเพิ่มคำตอบอื่น ๆ ประการแรกความสมบูรณ์เป็นเงื่อนไขทางเทคนิคซึ่งส่วนใหญ่เป็นธรรมโดยทฤษฎีบทที่ใช้มัน ดังนั้นให้เราเริ่มต้นด้วยแนวคิดและทฤษฎีที่เกี่ยวข้องที่เกิดขึ้น

ให้แทนเวกเตอร์ของข้อมูล iid ซึ่งเราจำลองว่ามีการแจกแจงโดยที่พารามิเตอร์ควบคุมข้อมูลคือ ไม่ทราบ เป็นเพียงพอถ้าเงื่อนไขการจำหน่ายของไม่ขึ้นอยู่กับพารามิเตอร์\ เป็นอุปกรณ์เสริมหากการกระจายของไม่ได้ขึ้นอยู่กับ (ภายในตระกูล ) เป็นตัวประมาณค่าแบบไม่เอนเอียงของศูนย์หากการคาดหวังเป็นศูนย์โดยไม่คำนึงถึงX=(X1,X2,,Xn)f(x;θ),θΘθT=T(X)X | T θ V = V ( X ) V θ F ( x ; θ ) U = U ( X ) θ S = S ( XXTθV=V(X)Vθf(x;θ)U=U(X)θ\เป็นสถิติที่สมบูรณ์หากตัวประมาณค่าที่เป็นกลางใด ๆ ของศูนย์ที่ขึ้นอยู่กับคือศูนย์เหมือนกันนั่นคือถ้าจากนั้น ae (สำหรับทั้งหมด )S=S(X)S E g ( S ) = 0 ( สำหรับทุก  θ ) g ( S ) = 0 θSEg(S)=0(for all θ)g(S)=0θ

ตอนนี้สมมติว่าคุณมีสองตัวประมาณเป็นกลางแตกต่างกันของบนพื้นฐานของความพอเพียงสถิติ ,(T) นั่นคือในสัญลักษณ์ และ (สำหรับทั้งหมด) จากนั้นเป็นตัวประมาณศูนย์ที่ไม่เอนเอียงซึ่งไม่ได้เป็นศูนย์เหมือนกันซึ่งพิสูจน์ว่าไม่สมบูรณ์ ดังนั้นความสมบูรณ์ของสถิติที่เพียงพอทำให้เรามีตัวประมาณค่าที่ไม่ลำเอียงเพียงหนึ่งเดียวของจากθTg1(T),g2(T)

Eg1(T)=θ,Eg2(T)=θ
P(g1(T)g2(T))>0θg1(T)g2(T)TTθT. ที่มีอยู่แล้วใกล้กับทฤษฎีบท Lehmann – Scheffé

ให้เราดูตัวอย่าง สมมติว่านี้มีเครื่องแบบ IID ในช่วงเวลา1) เราสามารถแสดงให้เห็นว่า (เป็นสถิติการสั่งซื้อ) คู่เพียงพอ แต่มันไม่สมบูรณ์เพราะความแตกต่างเป็นสิ่งเสริมเราสามารถคำนวณความคาดหวังของมันปล่อยให้มันเป็น (ซึ่งเป็นฟังก์ชันของเท่านั้น) และจากนั้นX1,,Xn(θ,θ+1)X(1)<X(2)<<X(n)(X(1),X(n))X(n)X(1)cnX(n)X(1)cจะเป็นตัวประมาณค่าศูนย์ที่ไม่เป็นศูนย์เหมือนกัน ดังนั้นสถิติที่เพียงพอของเราในกรณีนี้ไม่สมบูรณ์และเพียงพอ และเราสามารถเห็นความหมาย: มีฟังก์ชั่นของสถิติที่เพียงพอซึ่งไม่ได้ให้ข้อมูลเกี่ยวกับ (ในบริบทของแบบจำลอง) สิ่งนี้ไม่สามารถเกิดขึ้นได้ด้วยสถิติที่สมบูรณ์เพียงพอ มันอยู่ในความหมายที่ให้ข้อมูลมากที่สุดในการที่ไม่มีฟังก์ชั่นของมันจะผิดปกติ ในทางกลับกันหากมีฟังก์ชั่นของสถิติที่เพียงพอเพียงเล็กน้อยที่มีค่าศูนย์ที่คาดหวังซึ่งอาจถูกมองว่าเป็นคำที่มีเสียง , เงื่อนไขของสัญญาณรบกวน / เสียงในโมเดลมีค่าศูนย์ที่คาดหวัง ดังนั้นเราจึงสามารถพูดได้ว่าสถิติที่ไม่สมบูรณ์นั้นมีสัญญาณรบกวนบ้างθ

ดูอีกครั้งในช่วงในตัวอย่างนี้ ตั้งแต่การกระจายของมันไม่ได้ขึ้นอยู่กับก็ไม่ได้ด้วยตัวเองเพียงอย่างเดียวมีข้อมูลใด ๆ เกี่ยวกับ\แต่เมื่อรวมกับสถิติที่เพียงพอแล้ว อย่างไร? ดูกรณีที่สังเกตนั้นในบริบทของแบบจำลอง (ที่รู้กันว่าเป็นจริง) เรามีความรู้สมบูรณ์แบบของ ! กล่าวคือเราสามารถพูดด้วยความมั่นใจว่า(1)} คุณสามารถตรวจสอบว่ามีค่าอื่นสำหรับนำไปสู่หรือR=X(n)X(1)θθ R = 1 θ θ = X ( 1 ) θ X ( 1 ) X ( n ) R = 0.1 θθR=1θθ=X(1)θX(1)X(n)เป็นการสังเกตการณ์ที่เป็นไปไม่ได้ภายใต้โมเดลที่สมมติขึ้น ในทางกลับกันถ้าเราสังเกตดังนั้นช่วงของค่าที่เป็นไปได้สำหรับนั้นค่อนข้างใหญ่ (แบบฝึกหัด ... ) R=0.1θ

ในแง่นี้สถิติเสริมประกอบด้วยข้อมูลบางอย่างเกี่ยวกับความแม่นยำที่เราสามารถประมาณตามข้อมูลและรุ่นนี้ ในตัวอย่างนี้และอื่น ๆ สถิติเสริม "เข้ามาแทนที่บทบาทของขนาดตัวอย่าง" โดยปกติช่วงความเชื่อมั่นและความต้องการของขนาดตัวอย่างแต่ในตัวอย่างนี้เราสามารถสร้างช่วงความเชื่อมั่นแบบมีเงื่อนไขซึ่งคำนวณโดยใช้เท่านั้นไม่ใช่ (แบบฝึกหัด) นี่เป็นแนวคิดของฟิชเชอร์การอนุมานควรเป็นเงื่อนไข สถิติเสริมบางอย่างRθRnR nRn

ทีนี้ทฤษฎีบทของบาซึ: ถ้าสมบูรณ์เพียงพอมันก็เป็นอิสระจากสถิติเสริมใด ๆ นั่นคือการอนุมานจากสถิติที่สมบูรณ์เพียงพอนั้นง่ายกว่าซึ่งเราไม่จำเป็นต้องพิจารณาการอนุมานแบบมีเงื่อนไข การปรับสภาพในสถิติที่เป็นอิสระจากไม่ได้เปลี่ยนแปลงอะไรแน่นอนTT

จากนั้นเป็นตัวอย่างสุดท้ายที่ให้สัญชาตญาณมากขึ้น เปลี่ยนตัวอย่างการแจกแจงแบบสม่ำเสมอของเราเป็นการแจกแจงแบบสม่ำเสมอในช่วงเวลา (ด้วย ) ในกรณีนี้สถิตินั้นสมบูรณ์และเพียงพอ มีอะไรเปลี่ยนแปลง เราจะเห็นว่าความสมบูรณ์เป็นคุณสมบัติของแบบจำลองจริงๆ ในกรณีก่อนหน้านี้เรามีพื้นที่พารามิเตอร์ที่ จำกัด ข้อ จำกัด นี้ทำลายความสมบูรณ์โดยการแนะนำความสัมพันธ์กับสถิติการสั่งซื้อ การลบข้อ จำกัด นี้ทำให้เราสมบูรณ์! ดังนั้นในแง่หนึ่งการขาดความสมบูรณ์หมายความว่าพื้นที่พารามิเตอร์ไม่ใหญ่พอและด้วยการขยายมันเราสามารถหวังที่จะกู้คืนความสมบูรณ์ (และการอนุมานง่ายกว่า)(θ1,θ2)θ1<θ2(X(1),X(n))

ตัวอย่างอื่น ๆ ที่ขาดความสมบูรณ์เกิดจากข้อ จำกัด ในพื้นที่พารามิเตอร์

  • เห็นคำตอบของฉันไปที่: ข้อมูลประเภทใดที่เป็นข้อมูลของชาวประมง?

  • ให้เป็น iid (โมเดลจำลองตำแหน่ง) จากนั้นสถิติการสั่งซื้อในเพียงพอ แต่ไม่สมบูรณ์ แต่ตอนนี้ดูภาพขนาดใหญ่แบบนี้ไปแบบไม่อิงพารามิเตอร์อย่างเต็มที่ยังคง IID แต่จากบางส่วนกระจายไม่ระบุรายละเอียดอย่างสมบูรณ์Fจากนั้นสถิติคำสั่งซื้อก็เพียงพอและครบถ้วน X1,,XnCauchy(θ,σ)F

  • สำหรับตระกูลเลขชี้กำลังที่มีพื้นที่พารามิเตอร์ canonical (นั่นคือมีขนาดใหญ่ที่สุดเท่าที่จะเป็นไปได้) สถิติที่เพียงพอเพียงเล็กน้อยก็เสร็จสมบูรณ์เช่นกัน แต่ในหลายกรณีการแนะนำข้อ จำกัด เกี่ยวกับพื้นที่พารามิเตอร์เช่นเดียวกับตระกูลเอ็กซ์โปแนนเชียลแบบโค้งจะทำลายความสมบูรณ์

กระดาษที่เกี่ยวข้องมากคือการตีความความสมบูรณ์และทฤษฎีบทของบาซู


7

สัญชาตญาณบางอย่างอาจมาจากทฤษฎีที่ดีที่สุด (ความแปรปรวนขั้นต่ำ) ตัวประมาณที่ไม่เอนเอียง

หากแล้วเป็นประมาณการที่เป็นกลางที่ดีที่สุดของ IFFเป็น uncorrelated กับประมาณเป็นกลางทั้งหมดของศูนย์W τ ( θ ) WEθW=τ(θ)Wτ(θ)W

หลักฐาน : ให้เป็นตัวประมาณที่ไม่เอนเอียงโดยไม่เกี่ยวข้องกับตัวประมาณที่ไม่เอนเอียงทั้งหมดของศูนย์ Letจะประมาณการอีกเช่นที่theta) เขียน(W'-W) โดยสมมติฐาน(W'-W) ดังนั้นสำหรับการใด ๆWW E θ W = E θ W = τ ( θ ) W = W + ( W - W ) V a r θ W = V a r θ W + V a r θ ( W - W ) W V a r θ W V aWWEθW=EθW=τ(θ)W=W+(WW)VarθW=VarθW+Varθ(WW)WVarθWVarθW

ทีนี้สมมติว่าเป็นตัวประมาณที่ดีที่สุด ให้มีความบางประมาณอื่น ๆกับ 0 ยังเป็นที่เป็นกลางสำหรับtheta) เรามี ถ้ามีเช่นเราจะได้รับสำหรับU) อาจไม่ใช่ตัวประมาณที่ดีที่สุดที่เป็นกลาง QEDWUEθU=0ϕa:=W+aUτ(θ)

Varθϕa:=VarθW+2aCovθ(W,U)+a2VarθU.
θ0ΘCovθ0(W,U)<0Varθϕa<VarθWa(0,2Covθ0(W,U)/Varθ0U)W

โดยสังหรณ์ใจผลลัพธ์บอกว่าถ้าตัวประมาณค่าเหมาะสมที่สุดจะต้องไม่สามารถปรับปรุงได้โดยเพียงแค่เพิ่มเสียงรบกวนเข้าไปในความหมายของการรวมเข้ากับตัวประมาณที่เป็นศูนย์โดยเฉลี่ย (เป็นตัวประมาณค่าศูนย์ที่เป็นกลาง) )

น่าเสียดายที่มันเป็นเรื่องยากที่จะจำแนกลักษณะของตัวประมาณค่าที่ไม่เอนเอียงทั้งหมดของศูนย์ สถานการณ์จะกลายเป็นง่ายมากถ้าตัวเองเป็นศูนย์ประมาณการเท่านั้นเป็นกลางของศูนย์ใด ๆ สถิติตอบสนอง 0 ความสมบูรณ์อธิบายสถานการณ์ดังกล่าวWCovθ(W,0)=0

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.