ข้อผิดพลาดมาตรฐานของการประมาณความน่าจะเป็นสูงสุดหมายถึงอะไร


21

ฉันเป็นนักสถิติศึกษาด้วยตนเองและพยายามอย่างยิ่งโดยเฉพาะกับภาษา

ในหนังสือที่ฉันกำลังใช้มีปัญหาดังต่อไปนี้:

ตัวแปรสุ่มจะได้รับเป็น -distributed กับ 0 (แน่นอนคุณอาจจะใช้การกระจายใด ๆ ขึ้นอยู่กับพารามิเตอร์หนึ่งเพื่อประโยชน์ของคำถามนี้.) จากนั้นกลุ่มตัวอย่างในห้าของค่า , , , ,จะได้รับXPareto(α,60)α>014216322

ส่วนที่หนึ่ง: "การใช้วิธีการที่มีโอกาสสูงสุดหาการประมาณของโดยอิงจาก [ตัวอย่าง]" นี่ไม่มีปัญหา คำตอบคือ4.6931α^αα^4.6931

แต่จากนั้น: "ให้ค่าประมาณสำหรับข้อผิดพลาดมาตรฐานของ "α^

สิ่งนี้มีความหมายอย่างไร? เนื่องจากเป็นเพียงจำนวนจริงคงที่ฉันไม่เห็นว่ามันจะมีข้อผิดพลาดมาตรฐานได้อย่างไร ฉันต้องพิจารณาค่าเบี่ยงเบนมาตรฐานของหรือไม่α^Pareto(α^,60)

หากคุณคิดว่าคำถามไม่ชัดเจนข้อมูลนี้จะช่วยฉันเช่นกัน


อะไร60ย่อมาจาก?
Alecos Papadopoulos

คุณมีสูตรสำหรับα ? ที่จะช่วยให้คุณประเมินข้อผิดพลาดมาตรฐานได้ α^
soakley

1
@Glen_b แต่ถ้าเป็นขีด จำกัด ล่างจะเป็นไปได้อย่างไรว่าค่าทั้งหมดของตัวอย่างที่รับรู้มีขนาดเล็กลง?
Alecos Papadopoulos

1
@Alcos นั่นเป็นจุดที่ยอดเยี่ยม ความคิดเห็นของฉันไม่สมเหตุสมผล ฉันลบมัน
Glen_b -Reinstate Monica

1
@Alecos: คือการกระจายที่มีความหนาแน่นของF ( x ) = α λ αPareto(α,λ) 1 f(x)=αλα(λ+x)α+1
สเตฟาน

คำตอบ:


17

คำตอบอื่น ๆ ที่ครอบคลุมถึงการได้มาของข้อผิดพลาดมาตรฐานฉันแค่ต้องการช่วยให้คุณมีสัญกรณ์:

ความสับสนของคุณเกิดจากความจริงที่ว่าในสถิติเราใช้สัญลักษณ์เดียวกันทั้งหมดเพื่อแสดง Estimator (ซึ่งเป็นฟังก์ชั่น) และการประมาณการที่เฉพาะเจาะจง

ดังนั้นα = H ( X )และα ( X = x ) = 4.6931สำหรับx = { 14 ,α^=h(X)α^(X=x)=4.6931 } ดังนั้น α ( X )เป็นหน้าที่ของตัวแปรสุ่มและตัวแปรสุ่มตัวเองที่แน่นอนมีความแปรปรวน x={14,21,6,32,2}α^(X)

ในการประมาณค่า ML ในหลายกรณีสิ่งที่เราสามารถคำนวณเป็นasymptoticข้อผิดพลาดมาตรฐานเพราะการกระจายแน่นอนตัวอย่างของประมาณการไม่เป็นที่รู้จัก (ไม่สามารถจะได้มา)

αไม่ได้มีการกระจาย asymptotic เพราะมันลู่ไปเป็นจำนวนจริง (จำนวนที่แท้จริงในเกือบทุกกรณีของการประมาณค่า ML) แต่ปริมาณα^ลู่กับตัวแปรสุ่มปกติ (โดยการประยุกต์ใช้ทฤษฎีขีด จำกัด กลาง)n(α^α)

จุดที่สองของความสับสนสัญลักษณ์ : ที่สุดหากไม่ได้ทุกข้อความจะเขียน ( "วาร์" = แปรปรวน asymptotic ") ในขณะที่สิ่งที่พวกเขาหมายถึงคือวาร์( Avar(α^)เช่นพวกเขาอ้างถึงความแปรปรวนเชิงปริมาณAvar(n(α^α))ไม่ใช่ α ... สำหรับกรณีที่มีการกระจาย Pareto พื้นฐานที่เรามีn(α^α)α^

Avar[n(α^α)]=α2

และเพื่อให้

Avar(α^)=α2/n

( แต่สิ่งที่คุณจะพบเขียนเป็น ) Avar(α^)=α2

ตอนนี้ในสิ่งที่รู้สึกประมาณการαมี "ความแปรปรวน asymptotic" ตั้งแต่ที่กล่าวว่า asymptotically มันลู่ไปอย่างต่อเนื่องหรือไม่ ในความหมายโดยประมาณและสำหรับตัวอย่างที่มีขนาดใหญ่ แต่ จำกัด คือที่ไหนสักแห่งในระหว่างตัวอย่าง "เล็ก" ซึ่ง Estimator เป็นตัวแปรสุ่มที่มีการแจกแจงที่ไม่รู้จัก (ปกติ) และตัวอย่าง "อนันต์" ซึ่งตัวประมาณเป็นค่าคงที่มี "ดินแดนตัวอย่างขนาดใหญ่ แต่มีขอบเขต จำกัด " อยู่ที่ไหน เครื่องมือประมาณการยังไม่กลายเป็นค่าคงที่และการกระจายและความแปรปรวนของมันมาในทางอ้อมโดยการใช้ทฤษฎีการ จำกัด ศูนย์กลางเพื่อให้ได้การกระจายเชิงซีมโทติคอย่างเหมาะสมของปริมาณZ = α^(ซึ่งเกิดจากปกติที่จะ CLT) และจากนั้นก็หันไปรอบ ๆ และการเขียน α = 1Z=n(α^α)(ในขณะที่การขั้นตอนหนึ่งที่กลับมาและรักษาnเป็น จำกัด ) ซึ่งแสดงให้เห็นว่าอัลฟ่าเป็นฟังก์ชั่นเลียนแบบปกติตัวแปรสุ่มZและเพื่อกระจายตามปกติตัวเอง (เสมอโดยประมาณ)α^=1nZ+αnα^Z


+1 สำหรับความแตกต่างระหว่างαและα^- สัญกรณ์อย่างแน่นอนสามารถที่ไม่สอดคล้องกัน n(α^α)
Nate Pope

21

- ประมาณการโอกาสสูงสุด - เป็นหน้าที่ของตัวอย่างที่สุ่มและอื่น ๆ นอกจากนี้ยังเป็นแบบสุ่ม (ไม่คงที่) การประมาณการของข้อผิดพลาดมาตรฐานของ αอาจจะได้รับจากข้อมูลฟิชเชอร์α^α^

I(θ)=E[2L(θ|Y=y)θ2|θ]

ที่ไหนเป็นพารามิเตอร์และL ( θ | Y = Y )เป็นฟังก์ชั่นการเข้าสู่ระบบน่าจะเป็นของθเงื่อนไขในตัวอย่างที่สุ่มY สัญชาตญาณข้อมูลฟิชเชอร์แสดงให้เห็นความสูงชันของความโค้งของพื้นผิวเข้าสู่ระบบความน่าจะเป็นรอบ MLE และเพื่อให้ปริมาณของ 'ข้อมูล' ที่Yให้ประมาณθθL(θ|Y=y)θyyθ

สำหรับการกระจายกับสำนึกเดียวY = Y , เข้าสู่ระบบความน่าจะเป็นที่Y 0เป็นที่รู้จักกัน:Pareto(α,y0)Y=yy0

เสียบเข้ากับคำจำกัดความของข้อมูล Fisher, I(α)=1

L(α|y,y0)=logα+αlogy0(α+1)logyL(α|y,y0)=1α+logy0logyL(α|y,y0)=1α2
สำหรับตัวอย่าง{Y1,ปี2, . . ,Yn}โอกาสประมาณการสูงสุด αมีการกระจาย asymptotically เช่นα n →การ~ N (α, 1
I(α)=1α2
{y1,y2,...,yn}α^
α^nN(α,1nI(α))=N(α,α2n), 
nαα^
SE(α^)α^2/n4.69312/52.1

1
For your second to last line, α^nN(α,1nI(α)), it doesn't appear the notation is correct. If n, then n can't appear on the right side. Instead, you want α^˙N(α,1nI(α))
user321627
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.