อะไรคือความสัมพันธ์ระหว่างตัวประมาณและตัวประมาณ?
อะไรคือความสัมพันธ์ระหว่างตัวประมาณและตัวประมาณ?
คำตอบ:
EL Lehmann ในทฤษฎีการประมาณแต้มแบบคลาสสิกของเขาตอบคำถามนี้ใน pp 1-2
ขณะนี้การสังเกตได้รับการตั้งสมมติฐานว่าเป็นค่าที่ใช้โดยตัวแปรสุ่มซึ่งสันนิษฐานว่าเป็นไปตามการแจกแจงความน่าจะเป็นร่วม, , เป็นของคลาสที่รู้จักกันบางส่วน ...
... ขอให้เราชำนาญในการประมาณค่า ... สมมติว่าเป็นฟังก์ชันที่มีคุณค่าจริง ๆ ที่นิยามไว้ในคลาสที่มีการแจกแจงและเราต้องการทราบค่าของ [ไม่ว่าการกระจายตัวจริงจะเป็นอะไรใน ผลกระทบ ] น่าเสียดายที่และดังนั้นจึงไม่รู้จักอย่างไรก็ตามข้อมูลที่สามารถใช้ในการขอรับการประมาณการของค่าที่หนึ่งหวังจะใกล้เคียงกับtheta)กรัมθ θ กรัม( θ ) กรัม( θ ) กรัม( θ )
ในคำพูด: ตัวประมาณค่าเป็นขั้นตอนทางคณิตศาสตร์ที่แน่นอนซึ่งมีตัวเลข ( ค่าประมาณ ) สำหรับชุดข้อมูลที่เป็นไปได้ใด ๆ ที่ปัญหาเฉพาะสามารถสร้างขึ้นได้ หมายเลขนั้นมีไว้เพื่อแสดงคุณสมบัติตัวเลขที่แน่นอน ( ) ของกระบวนการสร้างข้อมูล เราอาจเรียกสิ่งนี้ว่า
ตัวประมาณไม่ได้เป็นตัวแปรสุ่ม: มันเป็นเพียงฟังก์ชันทางคณิตศาสตร์ อย่างไรก็ตามการประมาณที่สร้างขึ้นนั้นขึ้นอยู่กับข้อมูลซึ่งตัวมันเองถูกจำลองเป็นตัวแปรสุ่ม สิ่งนี้ทำให้การประมาณค่า (คิดว่าขึ้นอยู่กับข้อมูล) เป็นตัวแปรสุ่มและการประมาณค่าเฉพาะสำหรับชุดข้อมูลเฉพาะจะกลายเป็นการรับรู้ของตัวแปรสุ่มนั้น
หนึ่งใน (ธรรมดา) สามัญสูตรสองน้อยที่สุดข้อมูลที่ประกอบด้วยคู่สั่งซื้อy_i) ได้รับการกำหนดโดยการทดลอง (พวกเขาสามารถเป็นปริมาณของยาเสพติดยาเป็นต้น) แต่ละ (การตอบสนองกับยาเสพติดเป็นต้น) จะถือว่ามาจากการกระจายความน่าจะเป็นที่เป็นปกติ แต่มีไม่รู้จักเฉลี่ยและทั่วไปแปรปรวน 2 นอกจากนี้มันจะสันนิษฐานว่าหมายถึงการที่เกี่ยวข้องกับผ่านสูตรx_i พารามิเตอร์ทั้งสามนี้ - , β 0และx ฉันY ฉันμ ฉันσ 2 x ฉันμ ฉัน = β 0 + β 1 x ฉัน σ β 1 ปีผมx ฉัน ( σ , เบต้า0 , β 1 ) β 0 β 1 cos ( σ + β 2 0 - β 1 ) x = 2--determine การกระจายพื้นฐานของสำหรับค่าใด ๆx_iดังนั้นใด ๆคุณสมบัติของการกระจายที่สามารถจะคิดว่าเป็นฟังก์ชั่นของbeta_1) ตัวอย่างของคุณสมบัติดังกล่าวคือจุดตัด , ความชัน , ค่าของ , หรือแม้แต่ค่าเฉลี่ยที่ค่าซึ่ง (ตามสูตรนี้ ) จะต้อง\
ในบริบท OLS นี้ไม่ใช่ตัวอย่างของการประมาณค่าจะเป็นขั้นตอนการคาดเดาค่าของถ้าถูกกำหนดให้เท่ากับ 2 นี่ไม่ใช่ตัวประมาณเนื่องจากค่าของนี้เป็นแบบสุ่ม (ในลักษณะที่แยกจากกันโดยสิ้นเชิง ความสุ่มของข้อมูล): มันไม่ใช่คุณสมบัติ (ตัวเลขแน่นอน) ของการแจกแจงแม้ว่ามันจะเกี่ยวข้องกับการแจกแจงนั้น (อย่างที่เราเพิ่งเห็นแม้ว่าความคาดหวังของสำหรับเท่ากับสามารถประมาณได้)x y y x = 2 β 0 + 2 β 1
ในสูตรของเลห์มันน์เกือบทุกสูตรสามารถเป็นตัวประมาณค่าของเกือบทุกคุณสมบัติ ไม่มีการเชื่อมโยงทางคณิตศาสตร์โดยธรรมชาติระหว่างตัวประมาณและตัวประมาณ อย่างไรก็ตามเราสามารถประเมินล่วงหน้าโอกาสที่ผู้ประเมินจะใกล้เคียงกับปริมาณที่ตั้งใจจะประเมิน วิธีการทำเช่นนี้และวิธีการใช้ประโยชน์จากพวกเขาเป็นหัวข้อของทฤษฎีการประมาณ
ในระยะสั้น:ตัวประมาณเป็นฟังก์ชันและการประมาณเป็นค่าที่สรุปตัวอย่างที่สังเกตได้
ประมาณการเป็นฟังก์ชั่นที่แมตัวอย่างที่สุ่มประมาณการพารามิเตอร์:
โปรดทราบว่าประมาณการของnตัวแปรสุ่มX1,X2, . . ,Xnเป็นตัวแปรสุ่มΘ ตัวอย่างเช่นตัวประมาณคือค่าเฉลี่ยตัวอย่าง: ¯ X =1
ตัวอย่างเช่นการประมาณการของกลุ่มตัวอย่างที่สังเกตx1,x2, . . ,xnเป็นค่าเฉลี่ยตัวอย่าง: μ = ¯ x =1
มันอาจจะเป็นประโยชน์ในการแสดงคำตอบของ whuber ในบริบทของตัวแบบการถดถอยเชิงเส้น สมมติว่าคุณมีข้อมูล bivariate และคุณใช้ Ordinary Least Squares เพื่อสร้างโมเดลต่อไปนี้:
Y = 6X + 1
ณ จุดนี้คุณสามารถใช้ค่าของ X ใด ๆ เสียบเข้ากับรูปแบบและคาดการณ์ผลที่วายในแง่นี้คุณอาจคิดว่าของแต่ละองค์ประกอบของรูปแบบทั่วไปของรูปแบบ ( mx + B ) รวมประมาณ ข้อมูลตัวอย่าง (ซึ่งคุณน่าจะเสียบเข้ากับโมเดลทั่วไปเพื่อคำนวณค่าเฉพาะสำหรับmและBด้านบน) ให้พื้นฐานที่คุณสามารถหาค่าประมาณสำหรับmและBตามลำดับ
สอดคล้องกับคะแนนของ @ whuber ในเธรดของเราด้านล่างค่าใด ๆ ของYตัวประมาณค่าแบบใดชุดหนึ่งที่คุณสร้างขึ้นคือในบริบทของการถดถอยเชิงเส้นซึ่งคิดว่าเป็นค่าที่ทำนายไว้
(แก้ไข - สองสามครั้ง - เพื่อแสดงความคิดเห็นด้านล่าง)
สมมติว่าคุณได้รับข้อมูลบางส่วนและคุณมีตัวแปรที่สังเกตได้บางอย่างที่เรียกว่า theta ตอนนี้ข้อมูลของคุณอาจมาจากการกระจายของข้อมูลสำหรับการกระจายนี้มีค่าที่สอดคล้องกันของทีต้าที่คุณอนุมานซึ่งเป็นตัวแปรสุ่ม คุณสามารถใช้ MAP หรือค่าเฉลี่ยสำหรับการคำนวณค่าประมาณของตัวแปรสุ่มนี้ทุกครั้งที่การกระจายข้อมูลของคุณเปลี่ยนแปลง ดังนั้นตัวแปรสุ่มทีต้าจึงเป็นที่รู้จักกันในชื่อการประมาณค่าซึ่งเป็นค่าเดียวของตัวแปรที่ไม่ได้รับการตรวจสอบสำหรับข้อมูลบางประเภท
ในขณะที่ตัวประมาณคือข้อมูลของคุณซึ่งเป็นตัวแปรสุ่ม สำหรับประเภทที่แตกต่างกันของการกระจายคุณมีประเภทที่แตกต่างกันของข้อมูลและทำให้คุณมีการประเมินที่แตกต่างกันและทำให้นี้ตัวแปรสุ่มที่สอดคล้องกันจะเรียกว่าประมาณการ