ความสัมพันธ์ที่ตีพิมพ์ส่วนใหญ่ในสังคมศาสตร์ไม่น่าไว้วางใจและจะต้องทำอย่างไร [ปิด]


9

แม้จะมีความสำคัญ แต่ smacking ของ "gotcha" ความพยายาม -istic โดยบุคคลที่จะเปิดเผยการปฏิบัติของวารสารล่ามากขึ้นและภัยคุกคาม looms พื้นฐานในร่มเงาของการวิจัยด้านวิทยาศาสตร์สังคม ( แม้ว่าจะมีปัญหาอย่างแน่นอนหลายตัวที่นักวิจัยต้องอยู่ ) เพื่อให้ได้ตรงไปยังจุดที่เป็นไปตามมุมมองหนึ่งที่เราอาจจะไม่สามารถที่จะไว้วางใจค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้มาจากกลุ่มตัวอย่างที่มีขนาดเล็กกว่า 250

หนึ่งจะยากที่จะหาการทดสอบมากขึ้นอาศัยการอนุมานทิศทางและความแข็งแกร่งของการเชื่อมโยงระหว่างกับการวัดในสังคมศาสตร์กว่าค่าสัมประสิทธิ์สหสัมพันธ์ที่เชื่อถือได้ อย่างไรก็ตามจะไม่ถูกกดทับอย่างหนักเพื่อค้นหารายงานที่มีการตรวจสอบโดยเพื่อนโดยอ้างว่ามีความสัมพันธ์ที่ดีระหว่างสองโครงสร้างตามค่าสัมประสิทธิ์สหสัมพันธ์ซึ่งคำนวณจากข้อมูลที่มีน้อยกว่า 250 ราย

จากวิกฤตการจำลองแบบในปัจจุบันที่เผชิญกับสังคมศาสตร์ (ดูลิงค์ที่สองด้านบน) เราจะดูรายงานนี้อย่างไรเกี่ยวกับการรักษาเสถียรภาพของค่าสัมประสิทธิ์สหสัมพันธ์ในตัวอย่างขนาดใหญ่เท่านั้น (อย่างน้อยตามมาตรฐานสาขาสังคมศาสตร์) มันเป็นอีกรอยร้าวในกำแพงของการวิจัยทางสังคมศาสตร์ที่ผ่านการตรวจสอบโดยเพื่อนหรือมันเป็นเรื่องเล็กน้อยที่ได้รับการนำเสนอมากเกินไปหรือไม่?

เนื่องจากไม่มีคำตอบที่ถูกต้องสำหรับคำถามนี้ฉันหวังว่าจะสร้างเธรดที่ทรัพยากรเกี่ยวกับคำถามนี้สามารถใช้ร่วมกันพิจารณาอย่างรอบคอบและถกเถียงกัน (แน่นอนและสุภาพด้วยความเคารพ)


ฉันรับรู้ว่านี่เป็นคำถามที่อิงตามความคิดเห็นและทำตามแนวทางทั่วไปของเว็บไซต์ ความจริงก็คือผู้คนจำนวนมากเข้ามาที่เว็บไซต์นี้เพื่อรับข้อมูลเชิงลึกเกี่ยวกับสถิติรวมถึงความเข้าใจที่ดีขึ้นเกี่ยวกับข้อผิดพลาดที่มีอยู่ในเทคนิคที่พวกเขาต้องการจ้างงาน ความหวังของฉันคือในการวางคำถามกว้าง ๆ นี้ฉันสามารถช่วยในเป้าหมายที่คลุมเครือนี้ได้ เรียนรู้วิธีการคำนวณข้อผิดพลาดมาตรฐานเป็นสิ่งหนึ่ง การเรียนรู้ว่ามันหมายถึงควงมันเมื่อตัดสินใจตามหลักฐานที่คาดคะเนเป็นอีก
Matt Barstead

สิ่งที่เลวร้ายยิ่งกว่าคือวิธีการเลือกเคส "250 คำสั่ง" ฉันเห็นบ่อยขึ้นที่มีคนโพสต์คำอ้อนวอนเพื่อทำแบบสำรวจที่พวกเขาต้องการสำหรับกระดาษหรือวิทยานิพนธ์ในเว็บไซต์โซเชียลมีเดีย เสร็จสมบูรณ์ด้วยหัวข้อของการสำรวจ ไม่รู้ว่าตัวเลือกจะเลือกเองอย่างไร ลาก่อนเพื่อสุ่มตัวอย่างเนื่องจากบทกวีในกลุ่มสังคมของใครบางคนไม่ได้สุ่มมักจะเป็นกลุ่มอุดมการณ์ / การเมือง / เศรษฐกิจที่คล้ายกันและยังเลือกด้วยตนเองตามความสนใจของพวกเขาในหัวข้อ คิวถึง"90% เป็นที่โปรดปรานของ X"เพียงเพราะผู้ที่ไม่แยแสไม่ได้เป็นอาสาสมัคร
vsz

คำตอบ:


7

การเพิ่มช่วงความเชื่อมั่นสำหรับค่าสัมประสิทธิ์สหสัมพันธ์โดยประมาณ ρจะเป็นขั้นตอนแรกเล็ก ๆ (และง่ายมาก) ในทิศทางที่ถูกต้อง ความกว้างของมันทำให้คุณประทับใจในความแม่นยำของความสัมพันธ์ตัวอย่างของคุณและในขณะเดียวกันก็ช่วยให้ผู้เขียนและผู้ชมสามารถทดสอบสมมติฐานที่เป็นประโยชน์ได้ สิ่งที่ทำให้ฉันประหลาดใจเสมอเมื่อพูดคุยกับนักสถิติจากสังคมศาสตร์ว่าค่าสัมประสิทธิ์สหสัมพันธ์แบบสัมบูรณ์ข้างต้นL=0.3(หรือข้อ จำกัด อื่น ๆ ) ได้รับการพิจารณาว่ามีความหมาย ในเวลาเดียวกันพวกเขากำลังทดสอบสมมติฐานการทำงานρ0. นี่เป็นเรื่องละเอียดอ่อน ทำไมค่าสัมประสิทธิ์สหสัมพันธ์ของประชากรน้อยมากจึงถูกพิจารณาว่ามีความหมาย? สมมติฐานการทำงานที่ "ถูกต้อง" จะเป็น|ρ|>L. มีช่วงความมั่นใจสำหรับρ ในมือสมมติฐานนี้สามารถทดสอบได้ง่าย: เพียงตรวจสอบว่าช่วงเวลานั้นอยู่เหนือทั้งหมด L (หรือด้านล่าง -L) และคุณรู้ว่าคุณสามารถอ้างสิทธิ์การเชื่อมโยงทางสถิติที่ "เป็นกอบเป็นกำ" ได้หรือไม่แม้แต่ในประชากร

แน่นอนว่าการเพิ่มช่วงความเชื่อมั่นและการใช้การทดสอบที่มีความหมายจะไม่ช่วยแก้ปัญหามากเกินไป (เช่นการออกแบบการสุ่มตัวอย่างที่ไม่ดีการพิจารณาข้าม confounders เป็นต้น) แต่มันเป็นพื้นฟรี ฉันเดาว่า SPSS ก็สามารถคำนวณได้!


1
อันที่จริงถ้า SPSS สามารถทำได้ ... ในบันทึกที่ร้ายแรงกว่านี้ฉันคิดว่าความคิดในการให้ความสำคัญกับ CIs นั้นสมเหตุสมผลมาก มันจะช่วยในการพยายามวิเคราะห์ด้วยเช่นกัน นอกจากนี้ดูเหมือนว่าสำหรับฉันการรายงาน CIs แทนที่จะเป็นค่า p เป็นสิ่งที่เกิดขึ้นบ่อยครั้งในแนวทางแบบเบย์ ฉันคิดเสมอว่าแบบจำลองแบบเบย์มีแนวโน้มที่จะ "รู้สึก" ซื่อสัตย์มากขึ้นในการที่พวกเขามุ่งเน้นที่การสร้างแบบจำลองการกระจายตัวของการประมาณการมากกว่าการหาการประมาณค่าที่น่าจะเป็นไปได้สูงสุดสำหรับพารามิเตอร์ประชากรที่ได้จากตัวอย่างเดียว
Matt Barstead

4

ในฐานะที่เป็นMichael M ตั้งข้อสังเกตความน่าเชื่อถือของความสัมพันธ์ที่รายงานหรือการประมาณการอื่น ๆ สามารถประเมินได้โดยใช้ช่วงความเชื่อมั่น ในระดับหนึ่งนั่นคือ CIs จะแคบเกินไปหากเลือกรุ่นหลังจากการรวบรวมข้อมูลซึ่งฉันคาดว่าจะเกิดขึ้นประมาณ 95% ของเวลาในสังคมศาสตร์

การรักษาสองเท่า:

  • เรากำลังพูดถึง " วิกฤตการณ์ "ดังนั้นการจำลองแบบที่ล้มเหลวแจ้งให้เราทราบว่าผลกระทบดั้งเดิมอาจเป็นเพียงแค่สัญญาณรบกวนแบบสุ่มเราจำเป็นต้องทำ (และกองทุนและเขียนและส่งและยอมรับ) การจำลองแบบมากขึ้นการศึกษาการทำซ้ำ ๆ สิ่งที่ดี.

  • การเยียวยาที่สองแน่นอน . หากเรามีรายงานที่สัมพันธ์กันหลายประการของข้อมูลที่คล้ายคลึงกันแม้ว่าทุก ๆ รายการจะมีค่าต่ำnจากนั้นเราสามารถรวมข้อมูลและเรียนรู้บางสิ่ง เป็นการดีที่เราจะสามารถตรวจจับได้ ในกระบวนการ.


@ สตีเฟ่นคำถาม: "การจำลองแบบ" หมายถึงอะไร shoul ใช้ข้อมูลเดียวกันหรือข้อมูลที่แตกต่างกันเพื่อทำซ้ำการศึกษาเดิม? มีความแตกต่างระหว่างการจำลองแบบและการทำซ้ำได้หรือไม่?
ทำนาย

ถึงจุดแรกของคุณฉันคิดว่าไม่กี่ปีที่ผ่านมาได้เห็นการเคลื่อนไหวที่แท้จริงในด้านหน้าของการจำลองแบบ บทที่กำลังจะมาให้คำแนะนำบางอย่างสำหรับนักวิจัยอารมณ์ความรู้สึกที่ฉันคิดว่าแปลดีไปยังหมายเลขของฟิลด์ในพฤติกรรมศาสตร์
Matt Barstead

@forecaster: การจำลองแบบควรจะทำกับข้อมูลใหม่ที่เก็บรวบรวมอย่างอิสระมิฉะนั้นคุณจะไม่ได้เรียนรู้อะไรใหม่ ๆ "การทำซ้ำ" ไม่ใช่คำที่ฉันเจอ แน่นอนว่ามีคำถามเสมอว่าสิ่งพิมพ์ต้นฉบับมีรายละเอียดเพียงพอหรือไม่เพื่อให้คนอื่นสามารถวิเคราะห์ซ้ำได้
เตฟาน Kolassa
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.