ความแตกต่างระหว่างตัวประมาณและสถิติคืออะไร?


30

ฉันได้เรียนรู้ว่าสถิติเป็นคุณลักษณะที่คุณสามารถหาได้จากกลุ่มตัวอย่างจากการทดลองขนาดที่มีขนาดเดียวกันจำนวนมากการคำนวณคุณลักษณะนี้สำหรับพวกเขาทั้งหมดและพล็อตไฟล์ pdf เราได้การกระจายของแอตทริบิวต์ที่เกี่ยวข้องหรือการกระจายของสถิติที่เกี่ยวข้อง

ฉันยังได้ยินด้วยว่าสถิติถูกสร้างขึ้นเพื่อเป็นตัวประมาณสองแนวคิดนี้แตกต่างกันอย่างไร


2
ขอบคุณสำหรับคำตอบทั้งหมด ... แนวคิดนี้ชัดเจนยิ่งขึ้นสำหรับฉันตอนนี้ ..
gutto

คำตอบ:


17

คำนิยาม

จากวิกิพีเดีย:

สถิติ [ ... ] เป็นมาตรการเดียวของแอตทริบิวต์ของกลุ่มตัวอย่างบางส่วน (เช่นค่าเฉลี่ยเลขคณิตของมัน)

และ

[A] n ตัวประมาณค่าเป็นกฎสำหรับการคำนวณการประมาณของปริมาณที่กำหนด [ของการแจกแจงต้นแบบ] ตามข้อมูลที่สังเกตได้

ความแตกต่างที่สำคัญคือ:

  • สถิติเป็นหน้าที่ของตัวอย่างที่
  • ประมาณการเป็นหน้าที่ของตัวอย่างที่เกี่ยวข้องกับปริมาณของการกระจายบาง

(สำหรับ "ปริมาณ" หมายถึงอะไรให้ดูหัวข้อด้านล่าง)

สถิติไม่ใช่ตัวประมาณ

ประมาณการเป็นสถิติกับสิ่งที่เพิ่มเข้ามา ในการแปลงสถิติให้เป็นตัวประมาณคุณเพียงแค่ระบุปริมาณเป้าหมายที่คุณต้องการประเมิน สิ่งนี้ทำให้เกิดความสับสนเพราะคุณไม่ได้เพิ่มอะไรเลย "ของจริง" ลงในสถิติ แต่มีบางอย่างที่ตั้งใจ

จะเห็นว่าแตกต่างกันเป็นสิ่งสำคัญที่คุณต้องรู้ว่าคุณไม่สามารถคำนวณคุณสมบัติของประมาณการ (เช่นอคติ , ความแปรปรวนฯลฯ ) สำหรับสถิติเพียง ในการคำนวณอคติคุณต้องค้นหาความแตกต่างระหว่างค่าสถิติที่คุณให้และมูลค่าที่แท้จริง มีเพียงตัวประมาณเท่านั้นที่มี "ค่าจริง" ซึ่งอนุญาตให้คำนวณอคติ สถิติเป็นเพียงฟังก์ชั่นของข้อมูลและมันก็ไม่ถูกหรือผิด

ตัวประมาณที่แตกต่างกันขึ้นอยู่กับสถิติเดียวกัน

คุณสามารถสะกดปริมาณเป้าหมายที่แตกต่างกันสำหรับสถิติเดียวกันส่งผลให้ตัวประมาณต่างกัน ตัวประมาณแต่ละตัวนั้นมีอคติของตัวเองแม้ว่าพวกเขาทั้งหมดจะเป็น (ตาม) ค่าเดียวกัน แต่สถิติเดียวกัน

  • คุณสามารถใช้ค่าเฉลี่ยของกลุ่มตัวอย่างเป็นประมาณการสำหรับค่าเฉลี่ยการจัดจำหน่าย ประมาณการนี้มีศูนย์อคติ
  • นอกจากนี้คุณยังสามารถใช้ค่าเฉลี่ยของกลุ่มตัวอย่างเป็นประมาณการสำหรับแปรปรวนกระจาย เครื่องมือประมาณนี้มีอคติสำหรับการแจกแจงส่วนใหญ่

ดังนั้นการพูดว่า "ค่าเฉลี่ยตัวอย่างไม่มีอคติ" ไม่สมเหตุสมผล ค่าเฉลี่ยตัวอย่างจะไม่เอนเอียงเมื่อคุณใช้เพื่อประเมินค่าเฉลี่ยการกระจาย แต่ในขณะเดียวกันมันก็มีอคติเมื่อใช้เพื่อประเมินความแปรปรวนการกระจาย

ปริมาณของการแจกแจงและปริมาณตัวอย่าง

ปริมาณที่นี่หมายถึงคุณสมบัติบางอย่างของการกระจายซึ่งมักจะไม่ทราบและจะต้องมีการประมาณ นี่ตรงกันข้ามกับสถิติซึ่งเป็นคุณสมบัติของตัวอย่างเช่นค่าเฉลี่ยการกระจายเป็นปริมาณของการแจกแจงของคุณในขณะที่ค่าเฉลี่ยตัวอย่างเป็นสถิติ (ปริมาณตัวอย่างของคุณ)


1
ไม่มีอะไรผิดปกติกับการอ้างอิงเหล่านี้ แต่พวกเขาทำให้ฉันงุนงงว่า "ปริมาณ" หมายความว่าอะไร ตัวอย่างเช่นการเสนอราคาไม่ปรากฏว่ามีความเป็นไปได้ที่ "ปริมาณ" เป็นสถิติอื่นที่อิงจากข้อมูลเดียวกันหรืออาจเป็นสถิติอื่นที่อิงจากชุดข้อมูลที่คล้ายกันแยกต่างหาก (ในกรณีหลังสถิติแรกอาจถูกใช้เป็นตัวทำนายในกรณีก่อนหน้านี้ฉันไม่คิดว่าจะมีชื่อ แต่แน่นอนไม่ใช่ "ตัวประมาณ")
whuber

@whuber ดูการแก้ไข ตอนแรกฉันต้องการที่จะให้คำตอบสั้น ๆ ... :(
ziggystar

สันนิษฐานว่าค่าเฉลี่ยตัวอย่างและค่ามัธยฐานตัวอย่างจะประมาณค่าพื้นฐานที่เหมือนกันถ้าการแจกแจงเป็นค่าที่ค่ามัธยฐาน = ค่า ...
Stumpy Joe Pete

คำติชมของฉันทำให้รู้สึกไม่สบายใจในการแก้ไขของคุณ ฉันแค่บอกว่าในหลาย ๆ ค่ามัธยฐานการกระจาย! = หมายถึงดังนั้นค่ามัธยฐานตัวอย่างและค่าเฉลี่ยตัวอย่างจะไม่รวมกันเป็นค่าเดียวกันในกรณีเช่นนี้ (เช่นอย่าคาดคะเนสิ่งเดียวกัน)
Stumpy Joe Pete

1
@Stumpy ฉันคิดว่าคุณมีความเข้าใจผิดเล็กน้อยที่นี่ มันไม่สำคัญว่าคนมัธยฐานและหมายถึง "มาบรรจบกัน" กับสิ่งเดียวกัน (หรืออะไรก็ตาม) ในการชี้แจงเรื่องนี้ขอผมเป็นคนที่ไร้สาระนิดหน่อย: ถ้าเป็นไปได้ฉันอาจใช้ความแปรปรวนตัวอย่างเพื่อประมาณค่าเฉลี่ย ไม่มีข้อ จำกัด ทางทฤษฎีอย่างแน่นอน - และไม่มี - ที่บอกว่าฉันไม่สามารถทำได้ ขั้นตอนของฉันปฏิบัติตามคำจำกัดความทุกส่วน: ความแปรปรวนตัวอย่างเป็นสถิติอย่างแท้จริงและค่าเฉลี่ยนั้นเป็นสมบัติของการแจกแจงพื้นฐาน สำหรับคำจำกัดความมันไม่เกี่ยวข้องว่านี่เป็นขั้นตอนที่แย่มาก
whuber

15

กระทู้นี้เก่าไปหน่อย แต่ดูเหมือนว่า Wikipedia อาจเปลี่ยนนิยามของมันและถ้ามันถูกต้องมันจะอธิบายให้ฉันชัดเจนยิ่งขึ้น:

"ตัวประมาณค่า" หรือ "การประมาณค่าจุด" คือสถิติ (นั่นคือฟังก์ชันของข้อมูล) ที่ใช้เพื่ออนุมานค่าของพารามิเตอร์ที่ไม่รู้จักในแบบจำลองทางสถิติ

ดังนั้นสถิติหมายถึงข้อมูลเองและการคำนวณด้วยข้อมูลนั้น ในขณะที่ตัวประมาณหมายถึงพารามิเตอร์ในแบบจำลอง

หากฉันเข้าใจอย่างถูกต้องค่าเฉลี่ยก็เป็นสถิติและอาจเป็นตัวประมาณ ค่าเฉลี่ยของตัวอย่างคือสถิติ (ผลรวมของตัวอย่างที่หารด้วยขนาดตัวอย่าง) ค่าเฉลี่ยของกลุ่มตัวอย่างยังเป็นตัวประมาณค่าเฉลี่ยของประชากรโดยสมมติว่ามีการแจกแจงแบบปกติ

ฉันจะถาม @whuber และคนอื่น ๆ ที่รู้เรื่องนี้จริง ๆ ถ้าการอ้างอิงของ Wikipedia นั้นถูกต้องหรือไม่


6
+1 ฉันคิดว่าคุณเข้าใจถูกแล้ว คุณอาจจะสนใจที่จะรู้ว่าเป้าหมายของการประมาณค่าไม่จำเป็นต้องเป็นเฉพาะ "พารามิเตอร์" ของรูปแบบ: มันสามารถใด ๆคุณสมบัติของรูปแบบเช่นฟังก์ชั่นของพารามิเตอร์ของ ตัวอย่างเช่นไม่ใช่พารามิเตอร์สำหรับโมเดลNormal ( μ , σ 2 )แต่สามารถประมาณได้ μ2(μ,σ2)
whuber

5

เนื่องจากคำตอบอื่น ๆ ที่บอกว่าพวกเขาเหมือนกันไม่มีการอ้างอิงที่มีสิทธิ์ฉันขอให้คุณอ้างอิงสองคำจากคู่มืออนุมานเชิงสถิติโดย Casella และ Berger:

คำนิยาม 5.2.1ให้เป็นตัวอย่างแบบสุ่มขนาดnจากประชากรและให้T ( x 1 , , x n )เป็นฟังก์ชันมูลค่าจริงหรือเวกเตอร์ที่มีค่าโดเมนซึ่งมีพื้นที่ตัวอย่าง ของ ( X 1 , ... , X n ) จากนั้นตัวแปรสุ่มหรือเวกเตอร์แบบสุ่มY = T ( X 1 , , X n )ถูกเรียกX1,...,XnnT(x1,...,xn)(X1,...,Xn)Y=T(X1,...,Xn)สถิติ การกระจายความน่าจะเป็นสถิติจะเรียกว่าการกระจายตัวอย่างของ YYY

และ

นิยาม 7.1.1 จุดประมาณการเป็นฟังก์ชั่นใด ๆของตัวอย่าง; นั่นคือสถิติใด ๆ ที่เป็นตัวประมาณค่าจุดW(X1,...,Xn)

ฉันไม่ได้พูดในที่นี้ว่านี่เป็นคำตอบที่แน่นอนสำหรับคำถามเนื่องจากฉันเห็นด้วยกับสองคำตอบ upvoted ที่สุดที่แนะนำว่ามีความแตกต่างเพียงแค่ให้การอ้างอิงที่บอกว่าตรงข้ามเพื่อเน้นว่านี่ไม่ใช่ กรณีที่ชัดเจน


4

"6" เป็นตัวอย่างของตัวประมาณ พูดว่าคำถามของคุณคือ "ความชันของฟังก์ชันแม็พเชิงเส้นที่ดีที่สุด x กับ y คืออะไร" คำตอบของคุณอาจเป็น "6" หรืออาจเป็นY ทั้งสองเป็นตัวประมาณ จะเลือกแบบไหนดีกว่าให้คุณตัดสินใจ (X'X)-1X'Y

TA ที่ดีจริง ๆ เคยอธิบายแนวคิดของตัวประมาณให้ฉันแบบนั้น

โดยพื้นฐานแล้วตัวประมาณเป็นสิ่งที่คุณใช้กับข้อมูลเพื่อให้ได้ปริมาณที่คุณไม่ทราบมูลค่า คุณรู้คุณค่าของสถิติ - มันเป็นฟังก์ชั่นของข้อมูลที่ไม่มี "ดีที่สุด" หรือ "ดีที่สุด" เกี่ยวกับมัน ไม่มีค่าเฉลี่ย "ดีที่สุด" มีเพียงค่าเฉลี่ย

สมมติว่าคุณมีชุดข้อมูลตามจำนวนแพะที่เป็นเจ้าของต่อคนและความสุขของแต่ละคน คุณสนใจว่าความสุขของผู้คนเปลี่ยนไปอย่างไรกับจำนวนแพะที่พวกเขาเป็นเจ้าของ เครื่องมือประมาณการสามารถช่วยคุณประเมินความสัมพันธ์นั้นจากข้อมูลของคุณ สถิติเป็นเพียงฟังก์ชั่นของข้อมูลที่คุณมี ตัวอย่างเช่นความแปรปรวนของความเป็นเจ้าของแพะอาจเท่ากับ 7 Te forula สำหรับการคำนวณความแปรปรวนจะเหมือนกันระหว่างแพะและเครื่องปิ้งขนมปังหรือไม่ว่าคุณจะสนใจในความสุขหรือนิสัยชอบที่จะเป็นมะเร็ง ในแง่นั้นตัวประมาณที่สมเหตุสมผลทั้งหมดคือสถิติ


3

คำถามที่น่าสนใจ อย่างไรก็ตามเครื่องมือประมาณการและสถิติไม่จำเป็นต้องเป็นสิ่งที่แตกต่างกัน พวกเขาเป็นแนวคิดที่แตกต่าง

สถิติเป็นฟังก์ชั่น (ในแง่กว้าง) ซึ่งข้อมูลเป็น (สถิติ) ข้อมูล ผลกระทบคือคุณจะได้รับผลลัพธ์ซึ่งมักจะเป็นตัวเลขจากสถิตินี้ ในเทอมที่เป็นนามธรรมสถิติอาจให้ผลมากกว่าหนึ่งหมายเลข สถิติขึ้นอยู่กับข้อมูล แต่ขั้นตอนนั้นถูกกำหนดไว้แล้ว ดังนั้นสถิติอาจเป็น: "รวมจำนวนทั้งหมดและหารด้วยจำนวน" หรือในแง่ที่กว้างขึ้น "นำข้อมูล gdp และจัดทำรายงานไว้"
ในแง่สถิติเราแน่นอนว่ากำลังพูดถึงฟังก์ชันทางคณิตศาสตร์เป็นสถิติ

ความสำคัญของสิ่งนี้คือถ้าคุณรู้คุณสมบัติของข้อมูลที่คุณป้อน (ตัวอย่างเช่นมันเป็นตัวแปรสุ่ม) คุณสามารถคำนวณคุณสมบัติของสถิติได้โดยไม่ต้องใส่ข้อมูลเชิงประจักษ์

เครื่องมือประมาณการคือตัวประมาณเนื่องจากคุณต้องการ: เพื่อประเมินคุณสมบัติ ตามที่ปรากฎสถิติบางอย่างเป็นตัวประมาณที่ดี
ตัวอย่างเช่นถ้าคุณดึงจุดข้อมูลออกจากกลุ่มของตัวแปร iid ดังนั้นค่าเฉลี่ยเลขคณิต - สถิติที่อิงกับข้อมูลที่คุณดึงอาจเป็นตัวประมาณที่ดีสำหรับค่าที่คาดหวังของการแจกแจงนั้น แต่แล้วสิ่งใดก็ตามที่ทำให้เกิดการประมาณค่าก็คือตัวประมาณ

ในทางปฏิบัติตัวประมาณที่คุณใช้จะเป็นสถิติ แต่มีสถิติที่ไม่ใช่ตัวประมาณ ตัวอย่างเช่นการทดสอบสถิติแม้ว่าจะมีใครสามารถโต้แย้งเกี่ยวกับความหมายของคำสั่งนี้และทำให้เรื่องแย่ลงสถิติการทดสอบอาจไม่เพียง แต่รวมถึงตัวประมาณ แม้ว่าในทางความคิดแล้วสิ่งนี้ไม่จำเป็นต้องเป็นอย่างนั้น

และแน่นอนคุณสามารถมีตัวประมาณที่ไม่ใช่สถิติแม้ว่าพวกเขาอาจจะไม่ค่อยเก่งในการประมาณ


1
2nnn+1

ใช่ฉันจะยืนยันว่า "การเลือกค่า" เป็นสถิติที่กำหนดขึ้นและทุกอย่างที่เกี่ยวข้องกับการดัดแปลงตัวอย่างที่คุณเลือก จากนั้นอีกครั้งตั้งแต่ "ขั้นตอน" ถ้าคุณจะ - กำหนดฉันอาจอนุญาตให้องค์ประกอบสุ่มเช่นนี้ในคำจำกัดความของสถิติ ... ตัวอย่างเช่นหมายเลข "6" ในคำตอบด้านล่าง โปรดทราบว่าผมไม่ได้บอกว่าประมาณไม่ใช่สถิติที่มีความจำเป็นที่ไม่ดี
IMA

1
ฉันคิดว่าบางทีคุณอาจสร้างความแตกต่างที่มากเกินไปซึ่งไม่จำเป็นและในที่สุดก็ทำให้งานนิทรรศการของคุณซับซ้อน ตัวอย่างเช่น "1/2" เป็นตัวประมาณค่าที่ยอดเยี่ยมของพารามิเตอร์ของตัวแปร Bernoulli (มันเป็น minimax สำหรับการสูญเสียกำลังสอง) ดังนั้นมันจะน่าละอายที่จะแยกมันออกเพราะมันเป็นอิสระจากข้อมูล (นั่นจะคล้ายกับการตัดกำลังสองออกมาเป็นตัวอย่างของรูปสี่เหลี่ยมในเรขาคณิตแบบยุคลิด: คุณสามารถทำเช่นนั้นได้ แต่มันจะเพิ่มความยาวของความยาวสองเท่าของข้อความส่วนใหญ่ที่เกี่ยวกับคุณสมบัติของรูปสี่เหลี่ยม) ในทำนองเดียวกัน
whuber

ฉันไม่คิดว่าเรากำลังพูดถึงสิ่งเดียวกัน ฉันจะกำจัดสิ่งใด หากครึ่งหนึ่งเป็นตัวประมาณที่ดีก็เป็นกรณีที่เกิดขึ้น ฉันไม่คิดว่าตัวประมาณค่าที่เป็นไปได้ส่วนใหญ่ที่ไม่ได้อยู่ในรูปแบบสถิตินั้นยอดเยี่ยมมาก สำหรับตัวแปร Bernoulli "1/2" นั้นดี แต่ค่อนข้าง - นักประมาณการณ์อีกสองสามคนจากชั้นเรียน "จำนวนจริง" ไม่ดีมากคุณจะไม่เห็นด้วยไหม ในเรื่องของสถิติแบบสุ่มยังขึ้นอยู่กับข้อมูล - ฉันไม่ได้ออกกฎเพราะฉันจะบอกว่าคุณจะต้องมีขั้นตอนที่กำหนดไว้ แต่ฉันยอมรับว่าฉันควรเพิ่มข้างต้น
IMA

2

ฉันคิดว่ามีความเข้าใจที่ดีขึ้นเกี่ยวกับตัวอย่างที่ช่วยได้

[อัปเดต: ตัวอย่างเป็นแนวคิดที่กว้างมากฉันกำลังพูดถึง "ตัวอย่างแบบสุ่ม" ฉันไม่รู้ว่าตัวประมาณเหมาะสมหรือไม่เมื่อตัวอย่างไม่สุ่ม ]

จากวิกิพีเดีย :

ตัวอย่างแบบสุ่มถูกกำหนดให้เป็นตัวอย่างที่สมาชิกแต่ละคนของประชากรมีโอกาสรู้ที่ไม่เป็นศูนย์ซึ่งเป็นส่วนหนึ่งของตัวอย่าง

nnnnnตัวอย่าง

เราแทนตัวอย่างในตัวประมาณค่าของตัวอย่าง เราได้รับค่าของตัวประมาณนี่คือการวัดที่เฉพาะเจาะจง และมาตรการเฉพาะนี้คือสถิติ

(ตรวจสอบลิงค์นี้สำหรับคำจำกัดความของตัวประมาณประโยคสุดท้ายแสดงให้เห็นว่าทำไมเราถึงสับสนอยู่เสมอ)


1

เป้าหมายของการเขียนชิ้นนี้:

สิ่งที่ฉันต้องการทำที่นี่คือเพื่อให้คุณมีความคล้ายคลึงและความแตกต่างระหว่างสองแนวคิดที่เกี่ยวข้องอย่างใกล้ชิดที่เรียกว่า "สถิติ" และ "ตัวประมาณ" อย่างไรก็ตามฉันไม่ต้องการผ่านความแตกต่างระหว่างพารามิเตอร์และสถิติซึ่งฉันถือว่าชัดเจนเพียงพอสำหรับทุกคนที่กำลังดิ้นรนกับความแตกต่างระหว่างสถิติและตัวประมาณ หากไม่ใช่กรณีของคุณคุณต้องศึกษาบทความก่อนหน้านี้ก่อนแล้วจึงเริ่มศึกษาบทความนี้

ความสัมพันธ์:

โดยพื้นฐานแล้วฟังก์ชั่นมูลค่าที่แท้จริงของตัวแปรสุ่มที่สังเกตได้ในตัวอย่างจะเรียกว่าสถิติ มีสถิติบางอย่างที่หากพวกเขาได้รับการออกแบบมาอย่างดีและมีคุณสมบัติที่ดี (เช่นความสอดคล้อง, ... ) พวกเขาสามารถใช้ในการประมาณค่าพารามิเตอร์ของการกระจายตัวพื้นฐานของประชากร ดังนั้นสถิติจึงเป็นชุดที่มีขนาดใหญ่และตัวประมาณเป็นส่วนย่อยภายในชุดของสถิติ ดังนั้นตัวประมาณทุกตัวเป็นสถิติ แต่ไม่ใช่ตัวประมาณการทุกตัว

ความคล้ายคลึงกัน:

การพูดของความคล้ายคลึงกันดังที่กล่าวไว้ก่อนหน้านี้ทั้งสองฟังก์ชั่นของตัวแปรสุ่ม นอกจากนี้ทั้งสองมีการแจกแจงที่เรียกว่า "การกระจายการสุ่มตัวอย่าง"

แตกต่าง:

เมื่อพูดถึงความแตกต่างพวกเขาต่างกันในแง่ของเป้าหมายและภารกิจ เป้าหมายและภาระงานของสถิติสามารถสรุปข้อมูลในตัวอย่าง (โดยใช้สถิติที่เพียงพอ) และบางครั้งทำการทดสอบสมมติฐาน ฯลฯ ในทางกลับกันเป้าหมายหลักและภารกิจของตัวประมาณชื่อหมายถึงการประมาณ พารามิเตอร์ของประชากรที่กำลังศึกษา เป็นสิ่งสำคัญที่ต้องกล่าวถึงว่ามีตัวประมาณค่าที่หลากหลายซึ่งแต่ละตัวมีตรรกะการคำนวณของตัวเองอยู่เบื้องหลังเช่น MOMEs MLEs ตัวประมาณ OLS และอื่น ๆ ความแตกต่างระหว่างแนวคิดทั้งสองนี้เกี่ยวข้องกับคุณสมบัติที่ต้องการ ในขณะที่หนึ่งในคุณสมบัติที่ต้องการมากที่สุดของสถิติคือ "ความพอเพียง" คุณสมบัติที่ต้องการของตัวประมาณค่าเป็นสิ่งที่ต้องการ "ความสอดคล้อง", "ความเป็นกลาง", "ความแม่นยำ" ฯลฯ

ข้อควรระวัง:

ดังนั้นคุณต้องระมัดระวังเกี่ยวกับการใช้คำศัพท์อย่างถูกต้องเมื่อจัดการกับสถิติและตัวประมาณ ตัวอย่างเช่นมันไม่สมเหตุสมผลเลยที่จะพูดถึงความเอนเอียงของสถิติเพียงอย่างเดียวซึ่งไม่ได้เป็นตัวประมาณเพราะไม่มีพารามิเตอร์ที่เกี่ยวข้องในบริบทดังกล่าวเพื่อให้เราสามารถคำนวณความลำเอียงและ พูดถึงมัน. ดังนั้นคุณต้องระมัดระวังเกี่ยวกับคำศัพท์!

บรรทัดล่าง:

เพื่อสรุปฟังก์ชั่นใด ๆ ของตัวแปรสุ่มที่สังเกตได้ในตัวอย่างคือสถิติ หากสถิติมีความสามารถในการประมาณค่าพารามิเตอร์ของประชากรเราจะเรียกมันว่าตัวประมาณ (ของพารามิเตอร์ที่น่าสนใจ) อย่างไรก็ตามมีสถิติบางอย่างที่ไม่ได้ออกแบบมาเพื่อประมาณค่าพารามิเตอร์ดังนั้นสถิติเหล่านี้ไม่ใช่ตัวประมาณและที่นี่เราเรียกพวกเขาว่า "สถิติเท่านั้น"

สิ่งที่ฉันเสนอข้างต้นคือวิธีที่ฉันมองและคิดเกี่ยวกับแนวคิดทั้งสองนี้และฉันพยายามอย่างดีที่สุดที่จะนำเสนอด้วยคำพูดง่ายๆ ฉันหวังว่ามันจะช่วย!


0

คำตอบใหม่สำหรับคำถามเก่า:

นิยาม 1. สถิติเป็นฟังก์ชันที่แผนที่แต่ละตัวอย่างเป็นจำนวนจริง

ตัวประมาณทุกตัวเป็นสถิติ

แต่เรามักจะเรียกเฉพาะสถิติที่ใช้เพื่อสร้างการประมาณ ("คาดเดา") พารามิเตอร์บางตัวเป็นตัวประมาณ

ตัวอย่างเช่นค่าสถิติและค่าเฉลี่ยตัวอย่างคือสถิติทั้งสอง ค่าเฉลี่ยตัวอย่างยังเป็นตัวประมาณ (เพราะเรามักใช้เพื่อประมาณค่าเฉลี่ยประชากรจริง)

ในทางตรงกันข้ามเราไม่ค่อย / ไม่เคยเรียกตัวประมาณค่า t-statistic เพราะเราไม่ค่อย / ไม่เคยใช้มันเพื่อประเมินพารามิเตอร์ใด ๆ

PQ

ตัวอย่าง_

θ

θ

นี่เป็นวิธีหนึ่งที่เป็นไปได้ เรากลิ้งตาย 3 ครั้ง

s=(x1,x2,x3)x1x2x3 ที่สาม

s1=(5,4,1)s2=(4,1,6)s3=(6,3,2)

PQPQs=(x1,x2,x3)

P(s)=x1LN(x2+x3),
Q(s)=x1+x2+x33.

P

Qθ

Pθ


1
คำตอบนี้มุ่งไปในทิศทางที่ดี "คำจำกัดความ 2" ดูเหมือนจะไม่เป็นคำจำกัดความที่ถูกต้องเนื่องจากมีการเวียน (มันกำหนด "ตัวประมาณ" ในแง่ของ "การประมาณ" โดยไม่ต้องอธิบายหลัง) เพื่อให้มีประสิทธิภาพคุณต้องอธิบายว่า "การประมาณค่าพารามิเตอร์" นั้นมีรายละเอียดและความชัดเจนเพียงพอที่ผู้คนสามารถกำหนดวิธีการวัดเชิงปริมาณว่าตัวประมาณทำงานได้ดีเพียงใด
whuber

θθ5

2
น่าเสียดายที่ฉันพยายามแนะนำสิ่งที่สำคัญดูเหมือนจะหายไปในการทำให้เข้าใจง่ายเนื่องจากคำจำกัดความที่สองของคุณไม่ได้แยกความแตกต่างของตัวประมาณจากสถิติอื่น ๆ เลย
whuber

@whuber: ถูกต้อง อย่างเป็นทางการตัวประมาณเป็นเพียงสถิติ แต่เรามักจะใช้คำว่า "ตัวประมาณค่า" เพื่ออ้างถึงสถิติหากสถิตินั้นถูกใช้เพื่อประมาณค่าพารามิเตอร์ที่น่าสนใจ ฉันได้แก้ไขคำตอบของฉันเพื่อชี้แจงประเด็นนี้
Kenny LJ

-3

ในการทดสอบสมมติฐาน :

สถิติทดสอบนั้นเกี่ยวกับการทดสอบสมมติฐาน สถิติทดสอบเป็นตัวแปรสุ่มที่กำหนด / ภายใต้สมมติฐานว่าง ตอนนี้บางคนอาจเรียกค่า / การวัดของสถิติการทดสอบที่ได้รับมาจากตัวอย่าง

ด้วยสองสิ่งนี้คุณจะได้รับ p-value ซึ่งเป็นการวัดที่ช่วยในการปฏิเสธหรือไม่ปฏิเสธสมมติฐานว่าง โดยสรุปแล้วสถิติคือการประมาณว่า / ใกล้สมมติฐานของคุณมากแค่ไหน

ลิงค์นี้อาจมีประโยชน์


2
คุณดูเหมือนจะตอบคำถามที่แตกต่างมีบางสิ่งที่เกี่ยวข้องกับการทดสอบสมมติฐานมากกว่าการประมาณ คำจำกัดความของ "สถิติ" ของคุณนั้นถูก จำกัด ในขอบเขตมากกว่าคำจำกัดความมาตรฐานคือ: สถิตินำไปใช้กับการตัดสินใจทุกรูปแบบไม่ใช่เฉพาะในกรณีที่ จำกัด มากในการทดสอบสมมติฐานและสมมติฐานว่าง นอกจากนี้การทดสอบสมมติฐานไม่เหมือนกับตัวประมาณค่าและสถิติส่วนใหญ่ไม่ได้ใช้เป็นตัวประมาณค่าของความใกล้เคียงกับสมมติฐานบางตัว
whuber

ฉันจะไม่พูดว่ามันเป็นคำถามที่แตกต่าง มันให้ภาพเกี่ยวกับสิ่งที่อยู่ในบริบทของการทดสอบสมมติฐานอย่างน้อย!
dfhgfh

2
เนื่องจากคำตอบนี้มุ่งเน้นไปที่คำถามที่ จำกัด และเฉพาะรุ่นและใช้คำสำคัญ "ตัวประมาณ" และ "สถิติ" ในรูปแบบที่แปลกใหม่โดยไม่แจ้งให้ผู้อ่านทราบถึงข้อเท็จจริงนั้นฉันกังวลว่าอาจทำให้ผู้อื่นเข้าใจผิดหรือสับสน
whuber

ฉันคิดว่าการทดสอบสมมติฐานนั้นไกลเกินกว่าที่จะเป็นสถิติที่ จำกัด และมีความเชี่ยวชาญ
dfhgfh
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.