นักวิจัย 1 ทำงาน 1,000 การถดถอยนักวิจัย 2 ทำงานเพียง 1 ทั้งสองได้ผลลัพธ์เดียวกัน - พวกเขาควรทำการอนุมานที่แตกต่างกันหรือไม่


12

ลองนึกภาพนักวิจัยกำลังสำรวจชุดข้อมูลและเรียกใช้การถดถอยที่แตกต่างกัน 1,000 รายการและเขาพบว่ามีความสัมพันธ์ที่น่าสนใจหนึ่งอย่างในหมู่พวกเขา

ทีนี้ลองนึกภาพว่านักวิจัยอีกคนที่มีข้อมูลเดียวกัน ทำงานเพียง 1 การถดถอยและมันกลับกลายเป็นว่าเป็นสิ่งเดียวกับที่นักวิจัยคนอื่นเอามา 1,000 การค้นหา นักวิจัย 2 ไม่รู้จักนักวิจัย 1

นักวิจัย 1 ควรอนุมานต่างจากนักวิจัย 2 หรือไม่? ทำไม? ตัวอย่างเช่นนักวิจัย 1 ควรทำการแก้ไขการเปรียบเทียบหลายรายการ แต่นักวิจัย 2 ไม่ควร?

หากนักวิจัย 2 แสดงให้คุณเห็นการถดถอยเดี่ยวของคุณก่อนคุณจะทำการอนุมานอะไร หากหลังจากนักวิจัยคนที่ 1 แสดงผลลัพธ์ให้คุณคุณควรเปลี่ยนการอนุมานของคุณหรือไม่ ถ้าเป็นเช่นนั้นทำไมมันถึงสำคัญ?

ป.ล. 1 : ถ้าพูดถึงนักวิจัยสมมุติที่ทำให้ปัญหาเป็นนามธรรมลองคิดดูสิ: ลองจินตนาการว่าคุณใช้การถดถอยเพียงครั้งเดียวสำหรับกระดาษของคุณโดยใช้วิธีการที่ดีที่สุด จากนั้นนักวิจัยอีกสำรวจ 1000 ถดถอยที่แตกต่างกับข้อมูลเดียวกันจนกระทั่งเขาพบถดถอยเดียวกันแน่นอนคุณขับรถ คุณสองคนควรทำการอนุมานที่แตกต่างกันหรือไม่? หลักฐานนี้เหมือนกันทั้งสองกรณีหรือไม่? คุณควรเปลี่ยนข้อสรุปของคุณถ้าคุณรู้ผลลัพธ์ของนักวิจัยคนอื่น ๆ ? ประชาชนควรประเมินหลักฐานของการศึกษาทั้งสองอย่างไร

ป.ล. 2:โปรดพยายามเจาะจงและให้เหตุผลทางคณิตศาสตร์ / ทฤษฎีถ้าเป็นไปได้!


1
เพื่อเป็นการเปรียบเทียบที่ถูกต้องคุณต้องระบุสมมติฐานว่างและทางเลือกทั้งหมด นักวิจัย 2 สามารถทดสอบสมมติฐานได้ 1 ข้อเท่านั้นในขณะที่นักวิจัย 1 อาจต้องการควบคุมความน่าจะเป็นที่จะไม่เกิดข้อผิดพลาด 1 ประเภทที่ 1 จาก 1,000 ถ้านั่นเป็นการอนุมานพร้อมกันที่คุณต้องการคุณต้องทำการปรับค่า p นักวิจัย 2 มีหนึ่งการทดสอบและไม่จำเป็นต้องปรับ สำหรับนักวิจัย 1 คุณปรับโมเดลที่แตกต่างกันให้สอดคล้องกับข้อมูลเดียวกันหรือหนึ่งโมเดลเหมาะสมกับชุดข้อมูล 1,000 ชุดแต่ละชุดหรือไม่
Michael R. Chernick

1
@MichaelChernick มีเพียงหนึ่งชุดข้อมูล นักวิจัย 1 เหมาะกับโมเดล 1,000 ชุดสำหรับชุดข้อมูลเดียวกันจนกว่าเขาจะพบชุดข้อมูลที่เขาชอบ นักวิจัย 2 ติดตั้งเพียง 1 นักวิจัยทั้งสองใช้ข้อมูลเดียวกัน คุณจะบอกว่านักวิจัยสองคนนี้จะต้องสรุปสิ่งต่าง ๆ ด้วยชุดข้อมูลเดียวกัน นักวิจัย 2 ควรมีความมั่นใจอย่างถูกต้องในการวิเคราะห์ของเขาในขณะที่นักวิจัย 1 ควรขยายช่วงค่า p / ค่าความเชื่อมั่นของเขาเนื่องจากการเปรียบเทียบหลาย ๆ
statslearner

หากคุณทำตามการโต้เถียงของฉันพวกเขาทำในแง่ที่ว่านักวิจัย 2 เท่านั้นกำลังทดสอบสมมติฐานเดียวในขณะที่นักวิจัย 1 กำลังทดสอบสมมติฐาน 1,000 รายการและจำเป็นต้องควบคุมสมมติฐานทั้งหมดที่เขาทดสอบ .. มันเกี่ยวข้องกับสองปัญหาที่แตกต่างกัน สิ่งที่ยังคลุมเครือคือสิ่งที่คุณหมายถึงโดย "การค้นหาความสัมพันธ์ที่น่าสนใจเพียงคนเดียว" บางทีคุณคิดว่าคุณโพสต์สถานการณ์ที่ขัดแย้งกัน ฉันไม่คิดว่าคุณมี
Michael R. Chernick

1
@MichaelChernick มันไม่ได้เป็นความขัดแย้งสำหรับข้อมูลเดียวกันที่แน่นอนกับรูปแบบเดียวกันแน่นอนนำไปสู่ข้อสรุปที่แตกต่างกันสอง? หากคุณอ่านกระดาษสองฉบับแยกกันคุณจะสรุปอะไร
statslearner

1
@MichaelChernick ฉันได้และฉันพบว่าคุณหนักใจที่คิดว่ามันถูกต้อง --- ข้อมูลเดียวกันที่แน่นอนด้วยรูปแบบเดียวกันแน่นอนนำไปสู่ข้อสรุปที่แตกต่างกันสอง ดูความคิดเห็นของฉันในคำตอบ
statslearner

คำตอบ:


3

ที่นี่เอียง "Bayesian" ของฉันในคำถามของคุณ ฉันคิดว่าคุณได้อธิบายสถานการณ์ที่คนสองคนที่มีข้อมูลก่อนหน้าแตกต่างกันควรได้รับคำตอบ / ข้อสรุปที่แตกต่างกันเมื่อได้รับชุดข้อมูลเดียวกัน อีกตัวอย่างหนึ่งทู่ / รุนแรงมากขึ้นคือสมมติว่าเรามี "นักวิจัย 1b" ที่เพิ่งเกิดขึ้นที่จะคาดเดาพารามิเตอร์รูปแบบการถดถอยและข้อสรุปจากสมมติฐานใด ๆ การใช้การถดถอยนั้นไม่ไกลเกินกว่าที่จะคาดเดาได้1000

สิ่งที่ฉันคิดว่าเกิดขึ้น ... เราเรียนรู้อะไรเกี่ยวกับข้อมูลก่อนหน้าของนักวิจัยจากคำถามข้างต้น - นักวิจัย 1 อาจมีค่าคงที่ก่อนหน้าสำหรับรุ่น - นักวิจัย 2 มีความคมชัดก่อนสำหรับรุ่นที่น่าสนใจ (สมมติว่าคือ รูปแบบที่พวกเขาทั้งสองพอดี)P(Mk|I1)=11000P(M1|I2)=1M1

เห็นได้ชัดว่านี่เป็นการทำให้เข้าใจง่าย แต่คุณสามารถดูได้ที่นี่เราได้เพิ่มน้ำหนักให้กับการอนุมานของนักวิจัย 2 โดยไม่มีข้อมูลใด ๆ แต่คุณจะเห็นว่าเมื่อพวกเขาทั้งสองพิจารณาข้อมูลความน่าจะเป็นหลังของนักวิจัย 1 สำหรับจะเพิ่มขึ้น ... (... เรารู้เรื่องนี้เพราะ "ดีกว่า "กว่ารุ่นอื่น ... ) นักวิจัย 2 หลังไม่สามารถมีสมาธิอีกต่อไปมันมีอยู่แล้วเท่ากับ1สิ่งที่เราไม่ทราบว่าเป็นเท่าใดข้อมูลที่ได้รับการสนับสนุนกว่าทางเลือก สิ่งที่เรายังไม่รู้ก็คือรูปแบบที่แตกต่างกันอย่างไรเปลี่ยนแปลงข้อสรุปที่สำคัญของนักวิจัย 1 ตัวอย่างเช่นสมมติว่ามีคนM1P(M1|DI)>>P(M1|I)9991M11000โมเดลมีคำศัพท์ทั่วไปและพารามิเตอร์การถดถอยพารามิเตอร์สำหรับตัวแปรนั้นมากกว่าอย่างมีนัยสำคัญ(เช่นสำหรับทุกรุ่น) จากนั้นก็ไม่มีปัญหาในการสรุปผลในเชิงบวกอย่างมีนัยสำคัญแม้ว่าหลายรุ่นจะพอดี10000pvalue<108

คุณยังไม่ได้บอกว่าชุดข้อมูลมีขนาดใหญ่มากแค่ไหนและมันสำคัญมาก! หากคุณกำลังพูดถึงชุดข้อมูลที่มีการสังเกตครั้งและตัวแปรแปรปรวน / ตัวทำนาย / ตัวแปรอิสระตัวนักวิจัยที่ 1 อาจยังไม่แน่ใจเกี่ยวกับตัวแบบ อย่างไรก็ตามหากนักวิจัย 1 ใช้การสำรวจครั้งสิ่งนี้อาจกำหนดรูปแบบได้อย่างแน่นอน10 2 , 000 , 000100102,000,000

ไม่มีอะไรผิดปกติกับคนสองคนที่เริ่มต้นด้วยข้อมูลที่แตกต่างกันและยังคงมีข้อสรุปที่แตกต่างกันหลังจากเห็นข้อมูลเดียวกัน อย่างไรก็ตาม ... การเห็นข้อมูลเดียวกันจะทำให้พวกเขาเข้าใกล้กันมากขึ้นหาก "พื้นที่ของโมเดล" ทับซ้อนกันและข้อมูลสนับสนุน "ภูมิภาคที่ทับซ้อนกัน" นี้


ดังนั้นส่วนพื้นฐานของการเรียกร้องของคุณก็คือพวกเขาควรอนุมานที่แตกต่างกันเพราะพวกเขามีนักบวชที่แตกต่างกันและไม่ใช่เพราะพวกเขา "สำรวจข้อมูล" เท่าไหร่
statslearner

คุณจะประเมินหลักฐานอย่างไร คุณสนใจไหมว่ามีนักวิจัยโมเดล 1 คนติดตั้งกี่ตัว? ถ้าเป็นเช่นนั้นทำไม
statslearner

ฉันไม่จำเป็นต้องสนใจจำนวนรุ่นที่เหมาะสม แต่โมเดลที่ใช้จะเป็นที่รู้จักในระดับหนึ่งหรือไม่ ตามที่ฉันพูดสั้น ๆ ฉันต้องการทราบว่ามีทางเลือกที่สมเหตุสมผลหรือไม่ ตัวอย่างเช่นหากนักวิจัย 1 ทำการตัดสินใจ "line ball" เกี่ยวกับตัวแปรที่ถูกดร็อป / เพิ่มฉันจะต้องการดูสิ่งที่กล่าวถึง
ความน่าจะเป็นของระบบ

1
ทำไมคุณต้องการที่จะเห็นที่กล่าวถึงว่าจะเปลี่ยนก่อนหน้าของคุณอย่างใด? คุณใช้เขาเป็นตัวแทนให้คุณก่อนหน้านี้หรือไม่? มันไม่ชัดเจนสำหรับฉันในการทำแผนที่ที่คุณทำ ทำไมเหตุผลของนักวิจัยโดยเฉพาะอย่างยิ่งสำหรับการอนุมานของคุณเพราะมันไม่ได้ส่งผลกระทบต่อกระบวนการสร้างข้อมูลเลย?
statslearner

1
เรากำลังพิจารณาชุดข้อมูลที่นี่เพื่อเป็นข้อมูลภายนอกกับนักวิจัยเขาไม่ได้รวบรวมและนักวิจัยทั้งสองใช้ข้อมูลเดียวกัน ดูเหมือนว่าเหตุผลที่ผลการวิจัยไม่สามารถทำซ้ำในด้านจิตวิทยาเป็นเพราะพวกเขาเพียงแค่ใช้เกณฑ์ความสำคัญหลวมเป็นมาตรฐานของหลักฐานที่จะตัดสินสมมติฐานบ้าหลาย ๆ ที่เหมาะสมคน / นักวิทยาศาสตร์จะพบพวกเขาเบื้องต้นไร้สาระ เอากรณีของเรามาที่นี่ถ้าสมมุติฐานที่ทดสอบในตัวอย่างของเรามีบางสิ่งที่ไร้สาระเช่นการวางตัวของพลังงานมันจะสำคัญไหมว่าเราวิ่ง 1 หรือ 1,000 ถดถอย?
statslearner

7

การตีความทางสถิตินั้นมีความชัดเจนน้อยกว่าการรักษาทางคณิตศาสตร์

คณิตศาสตร์เป็นปัญหาที่กำหนดไว้อย่างชัดเจน เช่นกลิ้งลูกเต๋าที่สมบูรณ์แบบหรือวาดลูกบอลจากโกศ

สถิติเป็นคณิตศาสตร์ประยุกต์ที่คณิตศาสตร์เป็นแนวทาง แต่ไม่ใช่วิธีการแก้ปัญหา (แน่นอน)

ในกรณีนี้เป็นที่ชัดเจนว่าสถานการณ์มีบทบาทสำคัญ ถ้าเราทำการถดถอยแล้วคำนวณ (คณิตศาสตร์) ค่า p บางอย่างเพื่อแสดงความแข็งแกร่งแล้วการตีความ (สถิติ) และค่าของค่า p คืออะไร?

  • ในกรณีของการถดถอย 1000 ครั้งที่ดำเนินการโดยนักวิจัย 1ผลที่ได้นั้นอ่อนแอกว่ามากเนื่องจากสถานการณ์ประเภทนี้เกิดขึ้นเมื่อเราไม่มีเงื่อนงำและกำลังสำรวจข้อมูล ค่า p เป็นเพียงข้อบ่งชี้ว่าอาจมีบางอย่าง

    ดังนั้นค่า p จึงมีค่าน้อยกว่าในการถดถอยที่ทำโดยนักวิจัย 1 และถ้านักวิจัย 1 หรือใครก็ตามที่ใช้ผลลัพธ์ของนักวิจัย 1 ต้องการทำอะไรกับการถดถอยดังนั้นค่า p ต้องได้รับการแก้ไข (และหากคุณคิดว่าความแตกต่างระหว่างนักวิจัย 1 และนักวิจัย 2 ไม่เพียงพอเพียงแค่คิดถึงวิธีการมากมายที่นักวิจัย 1 สามารถแก้ไขค่า p สำหรับการเปรียบเทียบหลาย ๆ แบบ)

  • ในกรณีของการถดถอยเดี่ยวที่ดำเนินการโดยนักวิจัย 2ผลที่ได้คือหลักฐานที่แข็งแกร่งมาก แต่นั่นเป็นเพราะการถดถอยนั้นไม่ได้อยู่ในตัวของมันเอง เราต้องรวมถึงเหตุผลที่ว่าทำไมนักวิจัย 2 ได้เพียงหนึ่งเดียวถดถอย อาจเป็นเพราะเขามีเหตุผลที่ดี (เพิ่มเติม) ที่จะเชื่อแล้วว่าการถดถอยเดี่ยวเป็นแบบอย่างที่ดีสำหรับข้อมูล

  • การตั้งค่าการถดถอยที่ดำเนินการโดยนักวิจัย 1 และ 2 นั้นแตกต่างกันมากและไม่บ่อยนักที่คุณจะพบทั้งสองพร้อมกันสำหรับปัญหาเดียวกัน หากเป็นเช่นนั้น

    • นักวิจัย 2 โชคดีมาก

      นี่ไม่ใช่เรื่องแปลกดังนั้นและเราควรแก้ไขให้ถูกต้องเมื่อแปลวรรณกรรมและเราควรปรับปรุงการเผยแพร่ภาพรวมของการวิจัย หากมีนักวิจัยนับพันเช่นนักวิจัย 2 และเราจะเห็นเพียงหนึ่งในนั้นเผยแพร่ความสำเร็จแล้วเพราะเราไม่เห็นความล้มเหลวของนักวิจัย 999 คนอื่นเราอาจเชื่อว่าเราไม่ได้มีกรณีเหมือนนักวิจัย 1

    • นักวิจัย 1 ไม่ฉลาดและทำการค้นหาฟุ่มเฟือยอย่างไม่น่าเชื่อในขณะที่เขาอาจจะรู้ตั้งแต่เริ่มต้นว่ามันควรจะเป็นคนเดียวและเขาสามารถทำการทดสอบที่แข็งแกร่งขึ้น

      สำหรับบุคคลภายนอกที่ฉลาดกว่านักวิจัย 1 (ไม่สนใจเรื่องการถดถอยเพิ่มเติม 999 ครั้งตั้งแต่เริ่มต้น) และอ่านเกี่ยวกับงานพวกเขาอาจให้ความสำคัญกับความสำคัญของผลลัพธ์มากขึ้น แต่ก็ยังไม่เข้มแข็งเท่าที่ควร ผลการวิจัย 2.

      ในขณะที่นักวิจัย 1 อาจอนุรักษ์นิยมเกินไปเมื่อแก้ไขการถดถอยเพิ่มเติมฟุ่มเฟือย 999 เราไม่สามารถเพิกเฉยต่อความจริงที่ว่าการวิจัยทำในสุญญากาศของความรู้และมีแนวโน้มที่จะหานักวิจัยผู้โชคดีประเภท 1 มากกว่าประเภท 2

เรื่องราวที่น่าสนใจที่เกี่ยวข้อง: ในทางดาราศาสตร์เมื่อพวกเขาวางแผนที่จะใช้เครื่องมือที่ดีกว่าในการวัดพื้นหลังของจักรวาลด้วยความแม่นยำที่สูงขึ้นมีนักวิจัยที่แย้งว่าจะปล่อยข้อมูลเพียงครึ่งเดียว เนื่องจากมีเพียงช็อตเดียวในการรวบรวมข้อมูล เมื่อการถดถอยทั้งหมดดำเนินการโดยนักวิจัยหลายสิบคนที่แตกต่างกัน (และเนื่องจากความแตกต่างและความคิดสร้างสรรค์ของนักทฤษฎีอย่างไม่น่าเชื่อจึงมีความเหมาะสมกับทุก ๆ ที่เป็นไปได้สุ่มและชนในข้อมูล) จึงไม่มีความเป็นไปได้ การทดสอบใหม่เพื่อยืนยัน (นั่นคือเว้นแต่คุณจะสามารถสร้างจักรวาลใหม่ทั้งหมด)


1
+1 สำหรับ @MartijnWeterings ตามที่ฉันพูดในความคิดเห็นของฉันปัญหาไม่ได้ถูกวางไว้อย่างดีทางคณิตศาสตร์ ฉันได้รับความประทับใจว่า OP คิดว่ามีความขัดแย้งเพราะเพราะนักวิจัยสองคนจะถูกนำไปสู่ตัวเลือกรูปแบบเดียวกัน แต่ผู้ที่ทำ 1,000 การถดถอยนั้นถูกลงโทษเพราะต้องการเปรียบเทียบหลายประเด็น ฉันไม่เห็นสิ่งนี้เป็นความขัดแย้งเลย (ไม่ชัดเจน แต่ฉันคิดว่า OP ทำ) คุณได้ให้คำตอบที่ถูกต้องและเป็นลายลักษณ์อักษรที่สวยงามมากซึ่งจะอธิบายอย่างสังหรณ์ใจว่าทำไมทั้งสองกรณีจึงแตกต่างกัน ฉันคิดว่า OP ควรให้คำตอบตรวจสอบของคุณ!
Michael R. Chernick

@MichaelChernick ความคิดเห็นของคุณน่าจะเพียงพอสำหรับจัดการกับปัญหา / ปัญหา แต่ฉันพบว่ามีประโยชน์ในการระบุคำตอบด้วย 'สถิติ ' ที่มีรสชาติ การย้ายออกไปจาก'เหตุผลทางคณิตศาสตร์ / ทฤษฎี' ที่จำเป็นและยอมรับว่าคำศัพท์และปัญหาทางสถิติมีการกำหนดไว้อย่างชัดเจนมากกว่าปัญหาทางคณิตศาสตร์ทำให้ความคลุมเครือในคำถามชัดเจนขึ้น
Sextus Empiricus

1
นอกจากนี้ฉันรู้ว่านี่เป็นวิธีปฏิบัติทั่วไป แต่คุณไม่คิดว่าจะหนักใจที่จะบอกว่าผลลัพธ์หนึ่งคือ "หลักฐานที่แข็งแกร่งกว่า" อีกอันหนึ่งเมื่อพวกเขาเป็นแบบจำลองและข้อมูลเดียวกันจากกระบวนการสร้างข้อมูลเดียวกัน สิ่งเดียวที่แตกต่างกันคือบุคคลที่สามดูข้อมูลและสิ่งนี้ไม่ควรมีความสัมพันธ์ใด ๆ กับ DGP หรือความเชื่อเดิมของคุณเกี่ยวกับปัญหา ควรวิเคราะห์การวิจัยของนักวิจัย 2 เสียโดยความไม่รู้ของนักวิจัย 1 หรือไม่?
statslearner

1
@ มาร์ตินการสัมภาษณ์ทำไมความตั้งใจของนักวิจัยจึงสำคัญสำหรับการตีความข้อมูล หากคุณใช้สิ่งนี้เป็นแบบแก้ปัญหาเนื่องจากคนธรรมดาตีความผลลัพธ์ของผู้เชี่ยวชาญนี่เป็นเรื่องปกติ แต่สำหรับนักวิทยาศาสตร์ที่วิเคราะห์ข้อมูลดูเหมือนว่าเจตนาของนักวิจัยไม่ควรมีผลต่อการตีความหลักฐานของคุณ
statslearner

1
ดังนั้นดูเหมือนว่าคุณกำลังใช้พฤติกรรมของนักวิจัยเป็นตัวแทนสำหรับคุณก่อนหน้านี้ หากนักวิจัยวิ่ง 1,000 ถดถอยนั้นจะสอดคล้องกับต่ำก่อนสมมติฐานที่เฉพาะเจาะจงว่า ถ้าเขาวิ่งแค่ 1 นี่จะสอดคล้องกับค่าสูงก่อนหน้าสมมติฐาน หากคุณมีสองกรณีคุณจะไม่ทราบว่าจะใช้อะไรก่อน
statslearner

1

เรื่องสั้น: เราไม่มีข้อมูลเพียงพอที่จะตอบคำถามของคุณเพราะเราไม่รู้อะไรเกี่ยวกับวิธีการที่ใช้หรือข้อมูลที่รวบรวม

คำตอบยาว ... คำถามจริงที่นี่คือว่านักวิจัยแต่ละคนกำลังทำอะไรอยู่:

  • วิทยาศาสตร์ที่เข้มงวด
  • pseudoscience อย่างเข้มงวด
  • การสำรวจข้อมูล
  • การขุดลอกข้อมูลหรือการแฮ็คข้อมูล

วิธีการของพวกเขาจะกำหนดความแข็งแกร่งของการตีความผลลัพธ์ของพวกเขา นี่เป็นเพราะวิธีการบางอย่างเสียงน้อยกว่าวิธีอื่น ๆ

ในวิทยาศาสตร์ที่เข้มงวดเราพัฒนาสมมติฐานระบุตัวแปรรบกวนพัฒนาตัวควบคุมสำหรับตัวแปรที่อยู่นอกสมมติฐานของเราวิธีการทดสอบแผนวางแผนวิธีการวิเคราะห์ของเราดำเนินการทดสอบ / รวบรวมข้อมูลแล้ววิเคราะห์ข้อมูล (โปรดทราบว่ามีการวางแผนวิธีการวิเคราะห์ก่อนการทดสอบ) นี่คือเข้มงวดที่สุดเพราะเราต้องยอมรับข้อมูลและการวิเคราะห์ที่ไม่เห็นด้วยกับสมมติฐาน ไม่สามารถเปลี่ยนวิธีการหลังจากได้รับสิ่งที่น่าสนใจ สมมติฐานใหม่ใด ๆ จากผลการวิจัยจะต้องผ่านกระบวนการเดียวกันอีกครั้ง

ในการเลียนแบบเรามักจะใช้ข้อมูลที่รวบรวมไว้แล้ว สิ่งนี้ยากต่อการใช้งานอย่างมีจริยธรรมเพราะง่ายต่อการเพิ่มอคติให้กับผลลัพธ์ อย่างไรก็ตามยังคงเป็นไปได้ที่จะปฏิบัติตามวิธีการทางวิทยาศาสตร์สำหรับนักวิเคราะห์ด้านจริยธรรม มันอาจเป็นเรื่องยากที่จะตั้งค่าการควบคุมที่เหมาะสมแม้ว่าและที่จะต้องมีการวิจัยและตั้งข้อสังเกต

การสำรวจข้อมูลไม่ได้ขึ้นอยู่กับวิทยาศาสตร์ ไม่มีสมมติฐานเฉพาะ ไม่มีการประเมินเบื้องต้นของปัจจัยรบกวน นอกจากนี้ยังเป็นการยากที่จะย้อนกลับและทำการวิเคราะห์ซ้ำโดยใช้ข้อมูลเดียวกันเนื่องจากผลลัพธ์อาจมีการเสียก่อนโดยความรู้หรือแบบจำลองก่อนหน้านี้และไม่มีข้อมูลใหม่ที่จะใช้สำหรับการตรวจสอบความถูกต้อง แนะนำให้ทำการทดลองทางวิทยาศาสตร์อย่างเข้มงวดเพื่ออธิบายความสัมพันธ์ที่เป็นไปได้จากการวิเคราะห์เชิงสำรวจ

การขุดลอกข้อมูลหรือการแฮ็ค P คือที่ "นักวิเคราะห์" ทำการทดสอบหลายครั้งโดยหวังว่าจะได้คำตอบที่ไม่คาดคิดหรือไม่ทราบหรือจัดการข้อมูลเพื่อให้ได้ผลลัพธ์ ผลลัพธ์อาจเป็นเรื่องบังเอิญง่าย ๆ อาจเป็นผลมาจากตัวแปรที่ทำให้สับสนหรืออาจไม่มีขนาดหรือกำลังส่งผลที่มีความหมาย

มีการแก้ไขสำหรับแต่ละปัญหา แต่การแก้ไขเหล่านั้นจะต้องได้รับการประเมินอย่างรอบคอบ


1
ฉันเชื่อว่าคุณกำลังเพิ่มเสียงที่ไม่จำเป็นให้กับคำถาม สมมติว่าพวกเขาใช้วิธีการที่ดีที่สุด ข้อมูลไม่ได้ถูกรวบรวมโดยหน่วยงานทางสถิติดังนั้นพวกเขาจึงไม่สามารถควบคุมการรวบรวมข้อมูลได้ ความแตกต่างเพียงอย่างเดียวคือเท่าใดนักวิจัยแต่ละคนสำรวจข้อมูล หนึ่งในนั้นสำรวจมาก ๆ อีกหนึ่งสำรวจเพียงครั้งเดียว ทั้งสองรุ่นสุดท้ายได้รับข้อมูลเดียวกัน พวกเขาควรทำการอนุมานที่แตกต่างกันอย่างไร และวิธีการที่จะมีผลต่อการอนุมานของคุณ ?
statslearner

นี่ไม่ใช่เสียงรบกวนพิเศษ คณิตศาสตร์คือคณิตศาสตร์ หากโมเดลเหมือนกันแสดงว่าเหมือนกัน วิธีที่คุณตีความโมเดลนั้นขึ้นอยู่กับตัวแปรอื่น ๆ ทั้งหมดที่ไม่รวมอยู่ในปัญหาของคุณ หากคุณเพิกเฉยต่อบริบทและการออกแบบหรือการทดลองทั้งหมดคำตอบนั้นง่ายทั้งสองแบบจำลองนั้นมีความเท่าเทียมกันทางคณิตศาสตร์และมีความอ่อนแอทางวิทยาศาสตร์
Adam Sampson
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.