มีเอกสารที่อ้างถึงอย่างมากเกี่ยวกับสถิติที่แพร่กระจายการปฏิบัติทางสถิติที่ไม่ดีจริง ๆ หรือไม่?


13

เห็นได้ชัดว่ามีหลายวิธีในการละเมิดวิธีการทางสถิติ คุณรู้จักตัวอย่างของการฝึกฝนทางสถิติที่ไม่ดีซึ่งได้รับการตีพิมพ์เป็นคำแนะนำที่ชัดเจนครั้งแรก (เช่น "คุณควรใช้วิธีการนี้เพื่อ ... ") ในวารสารวิชาการที่มีชื่อเสียงที่ถูกอ้างถึงซ้ำแล้วซ้ำอีก?

ตัวอย่างอาจเป็น 10 เหตุการณ์ต่อกฎของตัวทำนายที่มักถูกเรียกใช้สำหรับโลจิสติกหรือโมเดลการถดถอยของ Cox PH ( LINK )

เพื่อความชัดเจนฉันไม่ได้หมายถึงเอกสารที่อ้างถึงอย่างสูงซึ่งเกิดขึ้นกับการใช้วิธีการทางสถิติที่ไม่ดี


3
คุณกำลังมองหาสิ่งพิมพ์ต้นฉบับในวารสารสถิติ ? ไม่มีจุดสิ้นสุดของการปฏิบัติที่ไม่ดีทางสถิติที่เผยแพร่ในวารสารที่ไม่ใช่สถิติ (และเมื่อผู้ตรวจสอบชี้ให้เห็นว่ามีบางอย่างผิดปกติผู้เขียนมักจะโต้แย้งที่จะทิ้งไว้ใน "เพื่อผูกกระดาษของเราเข้าสู่การวิจัยก่อนหน้า") มันอาจเป็นเรื่องยากที่จะเข้าใจว่าสิ่งพิมพ์ต้นฉบับใด ๆ สำหรับสิ่งต่าง ๆ เช่นการลดทอนผลลัพธ์ต่อเนื่องเนื่องจากความคิดที่ไม่ดีเกิดขึ้น
เตฟาน Kolassa

ฉันหมายถึงคำแนะนำที่ชัดเจนเช่น "ทำสิ่งนี้ ... " ฉันได้แก้ไขคำถามเพื่อชี้แจง ขอบคุณ
DL Dahly

2
คุณมักจะไม่เห็นคำสั่ง "ทำสิ่งนี้" อย่างชัดเจนในวารสารสถิติ คุณเห็นมันในบางส่วนของแอปพลิเคชันโดยเฉพาะอย่างยิ่งเมื่อเขียนโดยคนที่วิจารณ์การฝึกฝนที่เป็นปัญหา (ซึ่งบางครั้งพวกเขาพูดว่า 'ไม่ทำ A ทำ B' - แต่อาจให้คำแนะนำที่น่าสงสัยอย่างเป็นธรรมด้วยตนเอง คุณเป็นคนแบบไหนฉันไม่ได้อ่านวารสารในที่อื่นมากนัก แต่ฉันเคยเห็นเอกสารแบบนี้มาแล้วในอดีต (แม้ว่าฉันจะจำได้ว่าที่ไหน แต่ฉันก็ไม่สามารถพูดได้ว่า รู้ว่ามีคนใดอ้างถึงหรือไม่). ctd
Glen_b

1
ctd ... ในขณะที่ไม่ใช่กระดาษฉันสามารถชี้ไปที่คำแนะนำที่น่าสงสัยในหนังสือเรียนที่ดูเหมือนว่าจะเป็นที่นิยมของคนที่เรียนรู้ที่จะทำสถิติเพื่อการวิจัยในด้านการสมัคร
Glen_b -Reinstate Monica

2
โปรดอธิบายสิ่งที่คุณหมายถึงโดย "สถิติเท็จ" นี่ไม่ใช่แนวคิดมาตรฐานในสถิติซึ่งค่อนข้างเกี่ยวข้องกับการแนะนำขั้นตอนที่เหมาะสมหรือไม่มากสำหรับงานที่ได้รับ ใช่เป็นที่ทราบกันดีว่ากระบวนการบางอย่างนั้นแย่กว่ากระบวนการอื่น ๆ แต่ก็ยากที่จะตีความการใช้งานของพวกเขาว่าเป็น "ความเท็จ" โดย "ความเท็จ" คุณจะหมายถึงการตีความที่ทำให้เข้าใจผิดบางอย่างหรือคำแนะนำในการใช้ขั้นตอนที่ยอมรับไม่ได้หรือคำแนะนำตามข้อผิดพลาดทางคณิตศาสตร์หรือ ... อะไร?
whuber

คำตอบ:


4

RA Fisher "การเตรียมการทดลองภาคสนาม" วารสารกระทรวงเกษตรสหราชอาณาจักร 33: 503–513 1926

α=0.05

... มันสะดวกที่จะลากเส้นในระดับที่เราสามารถพูดได้: "ไม่ว่าจะมีอะไรบางอย่างในการรักษาหรือมีความบังเอิญเกิดขึ้นเช่นไม่เกิดขึ้นมากกว่าหนึ่งครั้งในการทดลองยี่สิบครั้ง"

... ถ้าหนึ่งในยี่สิบดูเหมือนจะไม่ได้ราคาสูงพอเราอาจถ้าเราต้องการวาดเส้นที่หนึ่งในห้าสิบ (จุดร้อยละ 2) หรือหนึ่งในร้อย (จุดร้อยละ 1) โดยส่วนตัวแล้วผู้เขียนชอบที่จะกำหนดมาตรฐานความสำคัญต่ำที่ 5 เปอร์เซ็นต์และไม่สนใจผลลัพธ์ทั้งหมดที่ล้มเหลวในการเข้าถึงระดับนี้ ความจริงทางวิทยาศาสตร์ควรได้รับการพิจารณาว่ามีการจัดตั้งขึ้นเพื่อการทดลองเฉพาะในกรณีที่การทดลองที่ได้รับการออกแบบมาอย่างเหมาะสมนั้นไม่ค่อยมีความสำคัญในระดับนี้


3

ในเศรษฐมิติคุณจะพบตัวอย่างของวิธีการแพร่กระจายโดยนักเศรษฐศาสตร์ที่มีชื่อเสียง (และมีทักษะสูง) ที่ตีพิมพ์ในวารสารที่เหมาะสม ฉันไม่รู้เรื่องทฤษฎี แต่Lalonde (1986)ค่อนข้างโด่งดังในการชี้ให้เห็นว่าวิธีการที่ใช้อยู่ในปัจจุบันไม่ดี: เขาเปรียบเทียบวิธีการทดลองชุดข้อมูลชุดเดียวกันกับการสังเกตการณ์และพบความแตกต่างจำนวนมากในการรักษา (สาเหตุ) การประเมินผล มีวรรณกรรมขนาดใหญ่ที่เผยแพร่วิธีการที่ไม่ใช่การทดลองซึ่งเคยใช้มาแล้วและยังคงใช้กันอยู่ทุกวันนี้

ต่อจากนั้นก็มี (และฉันคิดว่ายังคงมีอยู่) อภิปรายว่าการจับคู่คะแนนความชอบเป็นทางออกที่เป็นไปได้หรือไม่ (ดูตัวอย่างที่นี่ )

นอกจากนี้ยังมีข้อโต้แย้งมากมายเกี่ยวกับการประมาณค่าตัวแปรเครื่องมือ ข้อสรุปของเอกสารต้นฉบับที่อ้างถึงสูงได้รับการโต้แย้ง นี่อาจเป็นตัวอย่างคำถามของคุณที่ใกล้เคียงที่สุด Bound and Jaeger (1996 และเอกสารที่ตามมา) ได้ตั้งคำถามเกี่ยวกับการค้นพบของAngrist and Krueger (1991; 2700 การอ้างอิงตาม Google Scholar) ซึ่งโดยทั่วไปได้สร้างวิธีการตัวแปรเครื่องมือในวรรณคดีเศรษฐศาสตร์ประยุกต์ประยุกต์

นอกจากนี้ยังมีการอภิปรายเกี่ยวกับขนาดใหญ่ appropriatness ของสิ่งที่เรียกว่าลดประมาณการรูปแบบที่จะสร้างเวรกรรมดูตัวอย่างImbens (2010)

อีกเรื่องใหญ่แน่นอนเกี่ยวกับข้อผิดพลาดมาตรฐาน บางทีอาจพบกระดาษที่รู้จักกันดีแพร่กระจายค่า p ในเศรษฐข้อผิดพลาดมาตรฐานนานอนุกรมเวลาได้รับมักจะคาดคะเน (ในการออกแบบที่แตกต่างกันในความแตกต่าง ) เนื่องจากวิธีการที่มีอยู่ไม่ถูกต้องดูที่นี่ อย่างไรก็ตามฉันไม่ทราบถึงต้นฉบับที่อ้างถึงอย่างสูงที่เสนอวิธีการเหล่านี้ในบริบทนั้น แต่ฉันแน่ใจว่าคุณจะพบตัวอย่างบางส่วนในพื้นที่นี้

แหล่งที่มา:

Angrist, Joshua D. , และ Alan B. Keueger "การเข้าโรงเรียนภาคบังคับมีผลกระทบต่อการเรียนและรายได้หรือไม่" วารสารเศรษฐศาสตร์รายไตรมาส 106, 4 (1991): 979-1014

Bertrand, Marianne, Esther Duflo และ Sendhil Mullainathan "เราควรเชื่อมั่นในความแตกต่างในการประมาณการแตกต่างกันมากแค่ไหน" วารสารเศรษฐศาสตร์รายไตรมาสหมายเลข 119 1 (2004): 249-275

ผูกพัน John และ David A. Jaeger ความถูกต้องของฤดูกาลเกิดเป็นเครื่องมือในสมการค่าจ้าง: ความคิดเห็นเกี่ยวกับ Angrist & Krueger ของ "การเข้าร่วมโรงเรียนภาคบังคับมีผลต่อ Scho เลขที่ w5835 สำนักวิจัยเศรษฐกิจแห่งชาติ, 1996

Dehejia, Rajeev "การจับคู่คะแนนความชอบในทางปฏิบัติ: การตอบกลับของ Smith และ Todd" วารสารเศรษฐมิติที่ 125 1-2 (2005): 355-364

Imbens, Guido W. "ดีกว่าไม่มีอะไร: ความคิดเห็นบางอย่างเกี่ยวกับ Deaton (2009) และ Heckman และ Urzua (2009)" วารสารเศรษฐศาสตร์วรรณคดี 48, no. 2 (2010): 399-423

LaLonde, Robert J. "การประเมินการประเมินทางเศรษฐมิติของโปรแกรมการฝึกอบรมด้วยข้อมูลการทดลอง" The American Economic Review (1986): 604-620. *


1

ฉันลอง (แต่ไม่ค่อยแรง):

[Cameron, AC, & Miller, DL (2015) ที่มีประโยชน์มาก คู่มือผู้ประกอบการในการอนุมานกลุ่มที่แข็งแกร่ง วารสารทรัพยากรมนุษย์, 50 (2), 317-372.] // มีการอ้างอิง Google Scholar 1900 รายการ / ให้คำแนะนำเกี่ยวกับการจัดกลุ่มข้อผิดพลาดมาตรฐานในระดับที่เหมาะสม:

"ฉันทามติคือการอนุรักษ์และหลีกเลี่ยงอคติและใช้กลุ่มที่ใหญ่กว่าและรวมมากขึ้นเมื่อเป็นไปได้จนถึงและรวมถึงจุดที่มีความกังวลเกี่ยวกับการมีกลุ่มน้อยเกินไป"

อย่างไรก็ตาม [Abadie, A. , Athey, S. , Imbens, GW, & Wooldridge, J. (2017) คุณควรปรับข้อผิดพลาดมาตรฐานสำหรับการทำคลัสเตอร์เมื่อใด (หมายเลข w24003) สำนักงานวิจัยเศรษฐกิจแห่งชาติ.] แสดงให้เห็นว่า "ในความเป็นจริงแล้วมีอันตรายต่อการรวมกลุ่มในระดับรวมเกินไป" โปรดดูหน้า 1 ในภายหลัง: https://economics.mit.edu/files/13927

บางทีคุณอาจสามารถทำคดีที่หนักหน่วงได้โดยเริ่มจากความเข้าใจผิดที่เน้นโดย Abadie et al (2017)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.