บริบท
กลุ่มนักสังคมศาสตร์และนักสถิติ ( Benjamin et al., 2017 ) ได้แนะนำเมื่อเร็ว ๆ นี้ว่าอัตราการบวกลบ ( = .05) โดยทั่วไปใช้เป็นเกณฑ์ในการกำหนด "นัยสำคัญทางสถิติ" เพื่อปรับเกณฑ์อนุรักษ์ให้มากกว่าเดิม ( = .005) กลุ่มนักวิทยาศาสตร์สังคมศาสตร์และนักสถิติ ( Lakens et al., 2018 ) ได้ทำการแข่งขันโต้เถียงกับการใช้สิ่งนี้หรืออื่น ๆ - เกณฑ์ที่เลือกโดยพลการ ต่อไปนี้เป็นคำพูดจาก Lakens และคณะ (หน้า 16) ที่ช่วยเป็นตัวอย่างของคำถามของฉัน:
เป็นการดีที่ระดับอัลฟาจะถูกกำหนดโดยการเปรียบเทียบค่าใช้จ่ายและผลประโยชน์กับฟังก์ชั่นยูทิลิตี้โดยใช้ทฤษฎีการตัดสินใจ การวิเคราะห์ต้นทุน - ผลประโยชน์ (และระดับอัลฟ่า) แตกต่างกันเมื่อทำการวิเคราะห์ชุดข้อมูลที่มีอยู่ขนาดใหญ่เมื่อเปรียบเทียบกับการรวบรวมข้อมูลจากตัวอย่างที่ยากที่จะได้รับ วิทยาศาสตร์นั้นมีความหลากหลายและขึ้นอยู่กับนักวิทยาศาสตร์ที่จะพิสูจน์ระดับอัลฟาที่พวกเขาตัดสินใจใช้ ... การวิจัยควรได้รับการชี้นำโดยหลักการของวิทยาศาสตร์ที่เข้มงวดไม่ใช่ด้วยการวิเคราะห์พฤติกรรมและขีด จำกัด แบบครอบคลุมโดยพลการ
คำถาม
ฉันสงสัยว่าจะมีความเป็นไปได้อย่างไรในการพิสูจน์ให้เห็นถึงการเลือกอัลฟ่าในแบบที่ "ชี้นำโดยหลักการของวิทยาศาสตร์ที่เข้มงวด" เช่น Lakens และคณะ แนะนำในบริบททางสังคมศาสตร์ส่วนใหญ่ (เช่นนอกกรณีที่เลือกซึ่งมีคุณภาพที่เป็นรูปธรรมมากขึ้นเช่นกำไรเพื่อเพิ่มประสิทธิภาพ)
หลังจากเผยแพร่ Lakens และคณะฉันเริ่มเห็นเครื่องคิดเลขออนไลน์หมุนเวียนเพื่อช่วยให้นักวิจัยทำการตัดสินใจนี้ เมื่อใช้นักวิจัยจะต้องระบุ "อัตราส่วนค่าใช้จ่าย" สำหรับข้อผิดพลาดที่เป็นบวกและผิดพลาดที่เป็นเท็จ แต่เป็นเครื่องคิดเลขนี้นี่แสดงให้เห็นการกำหนดอัตราส่วนค่าใช้จ่ายดังกล่าวสามารถมีส่วนร่วมมากของปริมาณเดาการทำงาน:
ในขณะที่ต้นทุนข้อผิดพลาดบางอย่างง่ายต่อการวัดปริมาณเป็นเงิน (ต้นทุนโดยตรง) ส่วนอื่น ๆ ยากที่จะใส่จำนวน dolar (ต้นทุนทางอ้อม) ... แม้จะมีความท้าทายในการหาจำนวน แต่คุณควรพยายามใส่จำนวนให้
ตัวอย่างเช่นแม้ว่า Lakens et al ขอแนะนำให้ศึกษาตัวอย่างที่เข้าถึงได้ยากในฐานะปัจจัยหนึ่งที่อาจพิจารณาในการปรับค่าอัลฟาดูเหมือนว่ายังมีอีกอย่างหนึ่งที่คาดเดาว่าตัวอย่างที่เข้าถึงได้ยากนั้นเป็นอย่างไรและจะปรับการเลือกอัลฟ่าอย่างไร เป็นอีกตัวอย่างหนึ่งมันเป็นเรื่องยากสำหรับฉันที่จะหาจำนวนค่าใช้จ่ายในการตีพิมพ์ผลบวกปลอมในแง่ของจำนวนเวลา / เงินที่คนอื่น ๆ ในเวลาต่อมามุ่งมั่นที่จะดำเนินการวิจัยตามสมมติฐานที่อนุมานผิด
หากการกำหนดอัตราส่วนต้นทุนนี้ส่วนใหญ่เป็นเรื่องของการคาดเดาที่ดีที่สุดในเชิงอัตวิสัยฉันก็สงสัยว่าการตัดสินใจเหล่านี้จะเกิดขึ้นได้อีก (นอกการเพิ่มประสิทธิภาพบางอย่างเช่นผลกำไร) เป็น "ธรรม" นั่นคือวิธีที่มีอยู่นอกสมมติฐานที่ทำเกี่ยวกับการสุ่มตัวอย่างการแลกเปลี่ยนผลกระทบ ฯลฯ ? ด้วยวิธีนี้การกำหนดอัตราส่วนราคาของข้อผิดพลาดเท็จ - บวก / เท็จลบดูเหมือนว่าจะเป็นสิ่งที่คล้ายกับการเลือกก่อนในการอนุมานแบบเบย์ - การตัดสินใจที่ค่อนข้างเป็นส่วนตัวมีอิทธิพลต่อผลลัพธ์และถกเถียงกัน - - ถึงแม้ว่าฉันไม่แน่ใจว่าเป็นการเปรียบเทียบที่สมเหตุสมผล
สรุป
หากต้องการสอบถามคอนกรีตของฉัน:
- อัตรา false-positive / false-negative และอัตราส่วนค่าใช้จ่ายของพวกเขาจะ "สมเหตุสมผล" อย่างสมเหตุสมผลในบริบททางสังคมศาสตร์ส่วนใหญ่หรือไม่?
- ถ้าเป็นเช่นนั้นหลักการใดที่ generalizable สามารถปฏิบัติตามเพื่อพิสูจน์ตัวเลือกการวิเคราะห์เหล่านี้ (และอาจเป็นตัวอย่างหรือสองตัวอย่างในการกระทำ)
- ถ้าไม่เป็นเช่นนั้นความคล้ายคลึงกันของฉันเกี่ยวกับการกระทำที่อาจเกิดขึ้นในการเลือกอัตราส่วนค่าใช้จ่าย - คล้ายกับการเลือกก่อนหน้านี้ของ Bayesian - สมเหตุสมผลหรือไม่
อ้างอิง
Benjamin, DJ, Berger, J. , Johannesson, M. , Nosek, BA, Wagenmakers, E., ... Johnson, V. (2017, 22 กรกฎาคม) กำหนดนัยสำคัญทางสถิติ ดึงจาก psyarxiv.com/mky9j
Lakens, D. , Adolfi, FG, Albers, CJ, Anvari, F. , แอพ, MA, ... Zwaan, RA (2018, 15 มกราคม) แสดงให้เห็นถึงอัลฟ่าของคุณ สืบค้นจาก psyarxiv.com/9s3y6