ปัญหาความสามารถในการประมาณค่าพารามิเตอร์


13

ให้และเป็นตัวแปรสุ่มสี่ตัวซึ่งโดยที่เป็นพารามิเตอร์ที่ไม่รู้จัก นอกจากนี้สมมติว่า ,แล้วอันไหนที่เป็นจริงY1,Y2,Y3Y4E(Y1)=θ1θ3;  E(Y2)=θ1+θ2θ3;  E(Y3)=θ1θ3;  E(Y4)=θ1θ2θ3θ1,θ2,θ3Var(Yi)=σ2i=1,2,3,4.

A.สามารถประมาณได้θ1,θ2,θ3

B.สามารถประมาณได้θ1+θ3

ซีมีที่นับถือและที่ดีที่สุดคือการประมาณการเป็นกลางเชิงเส้นของ\θ1θ312(Y1+Y3)θ1θ3

D.สามารถประมาณได้θ2

คำตอบคือ C ซึ่งดูแปลกสำหรับฉัน (เพราะฉันได้ D)

ทำไมฉันถึงได้ D? ตั้งแต่อีE(Y2Y4)=2θ2

ทำไมฉันไม่เข้าใจว่า C อาจเป็นคำตอบ? ตกลงฉันสามารถดูเป็นประมาณการที่เป็นกลางจากและความแปรปรวนน้อยกว่า{2} θ1-θ3Y1+Y3Y1+Y2+Y3+Y44θ1θ3Y1+Y32

กรุณาบอกฉันว่าฉันทำผิดอยู่ที่ไหน

โพสต์ด้วยที่นี่: /math/2568894/a-problem-on-estimability-of-parameters


1
ใส่ในself-studyแท็กหรือบางคนจะเข้ามาและปิดคำถามของคุณ
Carl

@Carl เสร็จแล้ว แต่ทำไม
Stat_prob_001

พวกเขามีกฎสำหรับเว็บไซต์ไม่ใช่กฎของฉันกฎของไซต์
Carl

คือ ? Y1Y3
Carl

1
@Carl คุณสามารถคิดในลักษณะนี้: ที่ε 1เป็น RV ที่มีค่าเฉลี่ย0และความแปรปรวนσ 2 และY 3 = θ 1 - θ 3 + ϵ 3โดยที่ϵ 3คือ rv ที่มีค่าเฉลี่ย0และความแปรปรวนσ 2Y1=θ1θ3+ϵ1ϵ10σ2Y3=θ1θ3+ϵ3ϵ30σ2
Stat_prob_001

คำตอบ:


8

คำตอบนี้เน้นการตรวจสอบความสามารถในการประเมิน คุณสมบัติความแปรปรวนขั้นต่ำเป็นของการพิจารณารองของฉัน

เริ่มต้นด้วยสรุปข้อมูลในรูปแบบเมทริกซ์ของตัวแบบเชิงเส้นดังนี้ ที่E(ε)=0,Var(ε)=σ2I(เพื่อหารือเกี่ยวกับความสามารถในการประมาณค่า, ข้อสันนิษฐานทรงกลมนั้นไม่จำเป็น แต่เพื่อหารือเกี่ยวกับสมบัติ Gauss-Markov เราต้องสมมติความกลมกลืนของε)

(1)Y:=[Y1Y2Y3Y4]=[101111101111][θ1θ2θ3]+[ε1ε2ε3ε4]:=Xβ+ε,
E(ε)=0,Var(ε)=σ2Iε

หากการออกแบบเมทริกซ์คือยศเต็มแล้วพารามิเตอร์เดิมβยอมรับที่ไม่ซ้ำกันอย่างน้อยสี่เหลี่ยมประเมินβ = ( X ' X ) - 1 X ' Y ดังนั้นใด ๆ พารามิเตอร์φกำหนดเป็นฟังก์ชันเชิงเส้นφ ( β )ของβคือนับถือในแง่ที่ว่ามันสามารถประมาณได้อย่างไม่น่าสงสัยโดยข้อมูลผ่านอย่างน้อยสี่เหลี่ยมประเมินβเป็นφ = P ' βXββ^=(XX)1XYϕϕ(β)ββ^ϕ^=pβ^

ความบอบบางเกิดขึ้นเมื่อไม่ได้อยู่ในอันดับเต็ม เพื่อให้มีการสนทนาอย่างถี่ถ้วนเราจะแก้ไขข้อสังเกตและข้อกำหนดก่อนด้านล่าง (ฉันทำตามแบบแผนของแนวทางที่ปราศจากการประสานงานกับโมเดลเชิงเส้นส่วนที่ 4.8 คำศัพท์บางคำดูเหมือนมีเทคนิคที่ไม่จำเป็น) นอกจากนี้การอภิปรายนำไปใช้กับรุ่นทั่วไปตรงY = X β + εกับX R n × kและβ R kXY=Xβ+εXRn×kβRk

  1. นานาถดถอยเป็นคอลเลกชันของเวกเตอร์เฉลี่ยเป็นแตกต่างกันมากกว่าR k : M = { X β : β R k }βRk
    M={Xβ:βRk}.
  2. ทำงานพารา เป็นเชิงเส้นการทำงานของβ , φ ( β ) = P ' β = P 1 β 1 + + P k β kϕ=ϕ(β)β
    ϕ(β)=pβ=p1β1++pkβk.

ดังที่ได้กล่าวไว้ข้างต้นเมื่อไม่ใช่ฟังก์ชันการทำงานแบบพารามิเตอร์ทุกตัวที่ประมาณได้ϕ ( β ) แต่เดี๋ยวก่อนคำจำกัดความของคำที่ประเมินได้ทางเทคนิคคืออะไร? ดูเหมือนยากที่จะให้คำจำกัดความที่ชัดเจนโดยไม่รบกวนพีชคณิตเชิงเส้นเล็กน้อย คำจำกัดความหนึ่งซึ่งฉันคิดว่าเป็นสิ่งที่ใช้งานง่ายที่สุดมีดังต่อไปนี้ (จากแหล่งอ้างอิงเดียวกัน):rank(X)<kϕ(β)

นิยาม 1.พาราทำงานเป็นนับถือถ้ามันจะถูกกำหนดโดยไม่ซ้ำกันโดย X βในแง่ที่ว่า φ ( β 1 ) = φ ( β 2 )เมื่อใดก็ตามที่ β 1 , β 2R k Satisfy X เบต้า1 = X β 2ϕ(β)Xβϕ(β1)=ϕ(β2)β1,β2RkXβ1=Xβ2

การตีความ. คำจำกัดความข้างต้นกำหนดว่าการทำแผนที่จากการถดถอยไปยังพื้นที่พารามิเตอร์ของϕจะต้องเป็นแบบหนึ่งต่อหนึ่งซึ่งรับประกันได้เมื่ออันดับ( X ) = k (เช่นเมื่อXเป็นแบบตัวต่อตัว) เมื่ออันดับ( X ) < kเรารู้ว่ามีอยู่β 1β 2เช่นนั้นX β 1 = X β 2Mϕrank(X)=kXrank(X)<kβ1β2Xβ1=Xβ2. คำนิยามที่นับถือดังกล่าวข้างต้นในกฎระเบียบผลจากผู้ที่ขาดโครงสร้าง functionals ตัวแปรที่ส่งผลให้ค่าที่แตกต่างของตัวเองแม้จะมีค่าเดียวกันในซึ่งไม่ได้ให้ความรู้สึกเป็นธรรมชาติ ในทางตรงกันข้ามฟังก์ชันพาราเมตริกที่ประมาณได้ϕ ( )จะอนุญาตให้เคสϕ ( β 1 ) = ϕ ( β 2 )กับβ 1β 2ตราบเท่าที่เงื่อนไขX β 1 = X β 2สำเร็จMϕ()ϕ(β1)=ϕ(β2)β1β2Xβ1=Xβ2

มีเงื่อนไขอื่น ๆ ที่เทียบเท่าเพื่อตรวจสอบความสามารถในการประมาณค่าของฟังก์ชั่นพารามิเตอร์ที่กำหนดในการอ้างอิงเดียวกันข้อเสนอ 8.4

หลังจากการแนะนำพื้นฐานอย่างละเอียดแล้วเราจะกลับมาที่คำถามของคุณ

A. ตัวเองไม่นับถือสำหรับเหตุผลที่ยศ( X ) < 3ซึ่งเป็นรายละเอียดX β 1 = X β 2กับβ 1β 2 แม้ว่าคำจำกัดความข้างต้นจะได้รับสำหรับฟังก์ชันสเกลาร์βrank(X)<3Xβ1=Xβ2β1β2

B. ไม่สามารถประเมินได้ หากต้องการปัญญาให้พิจารณาβ 1 = ( 0 , 1 , 0 ) และβ 2 = ( 1 , 1 , 1 ) ซึ่งให้X β 1 = X β 2แต่ϕ 1ϕ1(β)=θ1+θ3=(1,0,1)ββ1=(0,1,0)β2=(1,1,1)Xβ1=Xβ2 2ϕ1(β1)=0+0=0ϕ1(β2)=1+1=2

C. สามารถประมาณได้ เพราะX β 1 = X β 2หมายถึงเล็กน้อยθ ( 1 ) 1 - θ ( 1 ) 3 = θ ( 2 ) 1 - θ ( 2 ) 3 , คือ, ϕϕ2(β)=θ1θ3=(1,0,1)βXβ1=Xβ2θ1(1)θ3(1)=θ1(2)θ3(2) )ϕ2(β1)=ϕ2(β2)

ดีเป็นยังนับถือ ที่มาจากX β 1 = X β 2ถึงϕ 3 ( β 1 ) = ϕ 3 ( β 2 )ก็เล็กน้อยϕ3(β)=θ2=(0,1,0)βXβ1=Xβ2ϕ3(β1)=ϕ3(β2)

หลังจากที่ประมาณค่าได้มีการตรวจสอบมีทฤษฎีบท (โจทย์ 8.16 อ้างอิงเดียวกัน) อ้างว่า Gauss-มาร์คอฟทรัพย์สินของ ) ตามทฤษฎีบทนั้นส่วนที่สองของตัวเลือก C ไม่ถูกต้อง การประมาณแบบไม่เอนเอียงเชิงเส้นที่ดีที่สุดคือˉ Y = ( Y 1 + Y 2 + Y 3 + Y 4 ) / 4ตามทฤษฎีบทด้านล่างϕ(β)Y¯=(Y1+Y2+Y3+Y4)/4

ทฤษฎีบท. ให้เป็นนับถือพาราทำงานแล้วประมาณการที่เป็นกลางที่ดีที่สุดเชิงเส้น (aka, Gauss-มาร์คอฟกะ) คือ φ ( β )สำหรับการแก้ปัญหาใด ๆ βกับสมการปกติ X ' X β = X ' Yϕ(β)=pβϕ(β^)β^XXβ^=XY

หลักฐานจะเป็นดังนี้:

พิสูจน์ แสดงให้เห็นว่าตรงไปตรงมาคำนวณว่าสมการปกติ ซึ่งหลังจากเข้าใจง่าย เป็น [ φ ( β ) θ 2 / 2 - φ

[404020404]β^=[111101011111]Y,
เช่นφ( β )= ˉ Y
[ϕ(β^)θ^2/2ϕ(β^)]=[Y¯(Y2Y4)/4Y¯],
ϕ(β^)=Y¯

ดังนั้นตัวเลือก D เป็นคำตอบที่ถูกต้องเท่านั้น


ภาคผนวก: การเชื่อมต่อของความสามารถในการประเมินและการระบุตัวตน

เมื่อตอนที่ผมอยู่ที่โรงเรียนเป็นเวลาสั้น ๆ ที่อาจารย์บอกว่าประมาณค่าพารามิเตอร์ของการทำงานสอดคล้องกับรูปแบบการ identifiability ฉันเอาการเรียกร้องนี้เพื่อรับแล้ว อย่างไรก็ตามการเทียบเคียงต้องถูกสะกดออกมาอย่างชัดเจนยิ่งขึ้นϕ

ตามแบบจำลองทางสถิติของ AC Davison's p.144

นิยาม 2.รูปแบบตัวแปรซึ่งในแต่ละพารามิเตอร์สร้างการกระจายที่แตกต่างกันจะเรียกว่าสามารถระบุตัวตนθ

สำหรับโมเดลเชิงเส้นโดยไม่คำนึงถึงเงื่อนไขความกลมกลืนVar ( ε ) = σ 2 Iมันสามารถถูกปรับรูปแบบเป็น E [ Y ] = X β ,(1)Var(ε)=σ2I

(2)E[Y]=Xβ,βRk.

มันเป็นเช่นรูปแบบง่ายๆที่เราระบุไว้เพียงรูปแบบครั้งแรกของการตอบสนองเวกเตอร์Yเมื่ออันดับ( X ) = k , โมเดล( 2 )สามารถระบุได้ตั้งแต่β 1β 2หมายถึงX β 1X β 2 (คำว่า "การกระจาย" ในคำจำกัดความดั้งเดิมลดธรรมชาติเป็น "หมายถึง" ภายใต้โมเดล( 2 ) .)Yrank(X)=k(2)β1β2Xβ1Xβ2(2)

ทีนี้สมมติว่าและฟังก์ชันพารามิเตอร์ที่กำหนดϕ ( β ) = p βเราจะกระทบยอดคำจำกัดความที่ 1และคำจำกัดความที่ 2 ได้อย่างไร?rank(X)<kϕ(β)=pβ

เราสามารถแสดงให้เห็นว่า ("การพิสูจน์" เป็นเรื่องไม่สำคัญ) การประมาณค่าของเทียบเท่ากับแบบจำลอง( 2 )สามารถระบุได้เมื่อมันถูกกำหนดด้วยพารามิเตอร์ϕ = ϕ ( β) ) = p β (เมทริกซ์การออกแบบXมีแนวโน้มที่จะเปลี่ยนแปลงตามลำดับ) ในการพิสูจน์สมมติว่าϕ ( β )สามารถประมาณได้ดังนั้นX β 1 = X β 2หมายถึงp β 1ϕ(β)(2)ϕ=ϕ(β)=pβXϕ(β)Xβ1=Xβ2โดยความหมายนี้เป็น φ 1 = φ 2รุ่นด้วยเหตุนี้ ( 3 )สามารถระบุตัวตนเมื่อการจัดทำดัชนีที่มีφ ตรงกันข้ามรูปแบบสมมติ ( 3 )เพื่อให้สามารถระบุตัวตนว่า X เบต้า1 = X β 2หมายถึง φ 1 = φ 2ซึ่งเป็นนิด φ 1 ( β ) = φ 2 ( β )pβ1=pβ2ϕ1=ϕ2(3)ϕ(3)Xβ1=Xβ2ϕ1=ϕ2ϕ1(β)=ϕ2(β)

โดยสังหรณ์ใจเมื่อถูกจัดอันดับให้ลดลงโมเดลที่มีβคือพารามิเตอร์ที่ซ้ำซ้อน (มีพารามิเตอร์มากเกินไป) ดังนั้นจึงเป็น reparametrization ที่ไม่ใช่มิติที่ต่ำกว่าซ้ำซ้อน (ซึ่งอาจประกอบด้วยชุดของฟังก์ชันเชิงเส้น) เป็นไปได้ การเป็นตัวแทนใหม่ดังกล่าวจะเกิดขึ้นเมื่อใด กุญแจสำคัญคือความสามารถในการประมาณค่าXβ

เพื่อแสดงข้อความข้างต้นลองพิจารณาตัวอย่างของคุณอีกครั้ง เราได้ตรวจสอบฟังก์ชั่นพาราเมทริกและϕ 3 ( β ) = θ 2สามารถประมาณได้ ดังนั้นเราสามารถเขียนแบบจำลองใหม่( 1 )ในแง่ของพารามิเตอร์ reparametrized ( ϕ 2 , ϕ 3 ) ดังนี้ E [ Y ] = [ 1 0 1 1 1 1ϕ2(β)=θ1θ3ϕ3(β)=θ2(1)(ϕ2,ϕ3)

E[Y]=[10111011][ϕ2ϕ3]=X~γ.

X~γ


หากคุณต้องการหลักฐานสำหรับส่วนที่สองของตัวเลือก C ฉันจะเสริมคำตอบของฉัน
Zhanxiong

2
14(Y1+Y2+Y3+Y4)

2
(Y1+Y2+Y3+Y4)/4

6

ใช้คำจำกัดความ

Yi

คำนิยาม

tλ(Y)=i=14λiYi
λ=(λi)

θ1θ3θ1θ3

θ1θ3=E[tλ(Y)]=i=14λiE[Yi]=λ1(θ1θ3)+λ2(θ1+θ2θ3)+λ3(θ1θ3)+λ4(θ1θ2θ3)=(λ1+λ2+λ3+λ4)(θ1θ3)+(λ2λ4)θ2.

θi

(1)λ2λ4=0 and λ1+λ2+λ3+λ4=1.

tλ

Var(tλ)=i=14λi2Var(Yi)+ij4λiλjCov(Yi,Yj).

Yi

Var(Yi)=σ2,

(2)Var(tλ)=σ2(λ12+λ22+λ32+λ42).

(2)(1)

วิธีการแก้

(1)λiu=λ1λ3v=λ1+λ3λ1λ3λ2λ4(2)

σ2(λ12+λ22+λ32+λ42)=σ24(2u2+(2v1)2+1).

(u,v)σ20u2(2v1)2u=2v1=0

λ=(λ1,λ2,λ3,λ4)=(1/4,1/4,1/4,1/4).

ตัวเลือก (C) เป็นเท็จเพราะไม่ได้ให้ตัวประมาณค่าแบบเชิงเส้นที่เป็นกลางที่สุด ตัวเลือก (D) แม้ว่ามันจะไม่ได้ให้ข้อมูลที่ครบถ้วน แต่ก็ถูกต้องเพราะ

θ2=E[t(0,1/2,0,1/2)(Y)]

คือความคาดหวังของตัวประมาณเชิงเส้น

{θ2,θ1θ3}θ1,θ3,θ1+θ3

ดังนั้น(D) เป็นคำตอบที่ถูกต้องไม่เหมือนใคร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.