แนวคิดของ 'การพิสูจน์ทางสถิติ'


10

เมื่อข่าวพูดถึงสิ่งที่ 'พิสูจน์ทางสถิติ' พวกเขาใช้แนวคิดทางสถิติที่ถูกต้องกำหนดอย่างถูกต้องใช้มันผิดหรือแค่ใช้รูปแบบโอออกซีซอน

ฉันจินตนาการว่า 'การพิสูจน์ทางสถิติ' ไม่ใช่สิ่งที่ดำเนินการเพื่อพิสูจน์สมมติฐานหรือการพิสูจน์ทางคณิตศาสตร์ แต่เป็นการทดสอบทางสถิติมากกว่า


10
ไม่มีการพิสูจน์ในสถิติยกเว้นการพิสูจน์ในสถิติทางคณิตศาสตร์ควรเป็นไปตามมาตรฐานทางคณิตศาสตร์ อย่างไรก็ตามหลักฐานดังกล่าวไม่เกี่ยวข้องกับคำถามของคุณ ในแง่ของตัวอย่างของคุณไม่มีใครยกเว้นคนงี่เง่าหรืออารมณ์ขันอ้างว่าครอบครัวชาวอเมริกันแต่ละคนมีลูก 2.4 คน โดยส่วนใหญ่แล้วข้อเรียกร้องคือโดยเฉลี่ยแล้วครอบครัวมีลูก 2.4 คน ที่สามารถตรวจสอบได้โดยการสำรวจตัวอย่างหรือการสำรวจสำมะโนประชากรอื่น ๆ แต่เมื่อตัวเลขอาจเปลี่ยนแปลงหรือเปลี่ยนแปลงอย่างเป็นระบบผลลัพธ์ที่แตกต่างไม่ได้หมายความว่าผลลัพธ์แรกนั้นไม่ถูกต้อง ผลลัพธ์เดียวกันไม่ได้หมายความว่าผลลัพธ์แรกถูกต้อง
Nick Cox

คำตอบ:


16

สิ่งที่ผู้คนกำลังพูดถึงคือผู้ที่คาดเดาและแตกต่างกันไปตามการถ่ายทอด บางทีสิ่งที่พบบ่อยที่สุดคือพวกเขากำลังให้ข้อมูลสรุปการวิจัยหนึ่งประโยคที่ต้องใช้หลายหน้า

อย่างไรก็ตามย่อหน้าสุดท้ายของคุณผิดพลาด ในทางสถิติแต่ละครอบครัวไม่มีลูก 2.4 คน เฉลี่ยเป็นเด็ก 2.4 นี่เป็นไปได้ทั้งหมด หากคุณสุ่มตัวอย่างครอบครัวอเมริกัน (หากทำได้ แต่เป็นไปได้) คุณจะได้รับการประมาณค่าเฉลี่ย อย่างไรก็ตามถ้าคุณทำการสำรวจสำมะโนประชากรของครอบครัวถ้าการสำรวจสำมะโนประชากรมีทุกครอบครัวจริง ๆ (ไม่ใช่) หรือถ้าคนที่ได้รับมาเป็นตัวแทนของคนที่ไม่ได้รับ จากนั้นคุณจะได้พิสูจน์ความจริง

อย่างไรก็ตามการสำรวจสำมะโนประชากรไม่เพียง แต่ทำให้คนคิดถึง แต่คนที่คิดถึงก็แตกต่างกันไปในหลาย ๆ ด้านจากคนที่ได้รับ สำนักสำรวจสำมะโนประชากรจึงพยายามหาวิธีที่แตกต่างกัน; ดังนั้นให้ประเมินจำนวนเด็กต่อครอบครัวอีกครั้ง

แต่มีหลายสิ่งที่คุณสามารถพิสูจน์ได้ ถ้าคุณต้องการที่จะรู้ว่าจำนวนปีเฉลี่ยที่อาจารย์แต่ละคนในแผนกของคุณสอนอยู่คุณสามารถได้รับข้อมูลที่แม่นยำและมีค่าเฉลี่ยที่แน่นอน

ย่อหน้าสุดท้ายของคุณก็เป็นปัญหาเช่นกันเมื่อทำการทดสอบทางสถิติเพื่อพิสูจน์สมมติฐานอย่างแม่นยำ พวกเขาทำเสร็จแล้ว (ในกรอบบ่อย ๆ ) เพื่อปฏิเสธสมมติฐานว่างในระดับความสำคัญที่กำหนด


แก้ไขคำถามของฉัน
Quora Feans

5

ฉันคิดว่า - เช่นเดียวกับหลายสิ่งหลายอย่าง - มันเป็นการรวมกันของความเข้าใจผิดทางวัฒนธรรมที่แพร่หลายและความพยายามของนักข่าวในการจดชวเลขอย่างหนักซึ่งกลายเป็นความเข้าใจผิดบางครั้ง

" โทรศัพท์มือถือทำให้เกิดมะเร็ง! " ขายโฆษณามากกว่าคำอธิบายเกี่ยวกับการตรวจสอบลิงก์ที่เป็นไปได้

แน่นอนว่าข้อสรุปจากการอนุมานเชิงสถิตินั้นไม่ได้เป็นข้อพิสูจน์ในแง่ของความรู้สึกใด ๆ มันขึ้นอยู่กับสมมติฐานและแม้กระทั่งข้อสรุป (อย่างดีที่สุด) นั้นเป็นความน่าจะเป็น (อย่างที่เราได้รับพูดด้วยการอนุมานแบบเบย์) แล้วด้วยการอนุมานแบบบ่อยครั้งคุณต้องเพิ่มข้อผิดพลาดตามปกติของการตีความค่า p null เป็นจริง นั่นคือโดยไม่ต้องพิจารณาปัญหาเช่นสิ่งพิมพ์หรืออคติการรายงาน

คุณจะเห็นข้อผิดพลาดที่คล้ายกันเพียงเท่ากับวิทยาศาสตร์การรายงานมากขึ้นโดยทั่วไปและก็เช่นเดียวกับที่น่าผิดหวัง

ฉันไม่ชอบวลีที่ 'พิสูจน์ทางสถิติ' ด้วยตัวเองเพราะฉันคิดว่ามันให้ความรู้สึกที่ผิด ในขณะที่สถิติทำได้ดีเป็นเครื่องมือที่มีประสิทธิภาพจริง ๆ แล้วสิ่งที่สถิติบอกให้เรารู้นั้นน่าประหลาดใจเล็กน้อยและการอภิปรายที่เหมาะสมเกี่ยวกับความหมายของสิ่งที่เรียนรู้และคุณสมบัติที่แนบมากับข้อสรุปนั้นมักไม่เหมาะสมต่อ hype และ punchiness ของหัวข้อหรือ วรรคสองสามที่รีบเร่งบีบซุบซิบเซเลบตามปกติ

อันที่จริงแม้ในวารสารทางวิชาการที่คุณสมบัติเหล่านี้ดูเหมือนจะสำคัญพวกเขาก็มักจะถูกทิ้งไว้ข้างนอกและมีการประกาศสูตรบางอย่าง (ซึ่งแตกต่างจากพื้นที่การวิจัยไปยังพื้นที่การวิจัย) ซึ่งถือได้ว่าเป็น 'เจิม'

ฉันคิดว่ามีห้องพักสำหรับอธิบายเหตุผลอย่างรอบคอบจากผลลัพธ์ของการอนุมาน (ไม่ว่าจะเป็นการประมาณจุดและช่วงเวลาการทดสอบสมมติฐานการคำนวณเชิงทฤษฎีการตัดสินใจหรือแม้แต่การสำรวจเชิงโครงสร้างของการเปรียบเทียบเชิงภาพเล็กน้อย) ถึงข้อสรุปที่นำไปสู่ การให้เหตุผลนั้นเป็นที่ที่หัวใจที่แท้จริงของเรื่องอยู่ (รวมถึงตำแหน่งที่ว่างในการให้เหตุผลจะถูกวางไว้, พวกเขาชัดเจน) และเราไม่ค่อยเห็นว่ามันถูกวางไว้

นอกจากนั้นเราสามารถส่งเสียงเตือนอย่างต่อเนื่อง


(+1) คุณช่วยตรวจสอบเอกสารในอนาคตของฉันได้ไหม
Matt Krause

2
คุณอาจไม่ชอบมัน มากกว่าหนึ่งครั้งรายงานของผู้ตัดสินของฉันได้จบลงอย่างมีความยาวมากกว่ารายงานต้นฉบับอย่างเห็นได้ชัดเพราะฉันอ่านรายละเอียดว่ามีอะไรผิดปกติและจะแก้ไขอย่างไร เป็นปัญหามากที่สุด แต่มักจะน่าสนใจที่สุด นักเรียนของฉันคนหนึ่งรายงานรายละเอียดคล้าย ๆ กันเกี่ยวกับงานของเธอจากหนึ่งในผู้ตัดสินของเธอ มันมีคุณค่ามากและนำไปสู่ผลิตภัณฑ์ขั้นสุดท้ายที่ดีกว่ามาก
Glen_b -Reinstate Monica

-2

ความรู้เชิงประจักษ์นั้นน่าจะเป็นไปได้เสมอ - ไม่ชัดเจนว่าเป็นจริงหรือเท็จ สถิติ "พิสูจน์" เป็นเรื่องของการรวบรวมข้อมูลเพียงพอที่จะลดความน่าจะเป็นที่สมมติฐานผิดไปน้อยกว่าเกณฑ์ที่ยอมรับได้ และเกณฑ์สำหรับ "ความจริง" หรือ "ความถูกต้อง" นั้นแตกต่างจากวินัยทางวิชาการหนึ่งไปอีก นักสังคมวิทยาพอใจกับความน่าจะเป็น 95% ที่จะถูกและบางครั้งก็จ่ายน้อยลง นักฟิสิกส์ควอนตัมต้องการ 99.99999% หรือดีกว่า


2
ยินดีต้อนรับสู่เว็บไซต์ @Kevin Krumwiede ประโยคสุดท้ายของคุณไม่ชัดเจน ดูเหมือนว่าคุณกำลังทำผิดพลาดโดยทั่วไปที่ทำให้ค่า p-value <.05 (เช่น) w / a ความน่าจะเป็น 95% ที่สมมติฐานว่างเป็นเท็จ
gung - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.