คุณสามารถอนุมานสาเหตุจากความสัมพันธ์ในตัวอย่างของเกมเผด็จการนี้ได้หรือไม่?


17

ฉันเพิ่งจะได้สอบซึ่งเรานำเสนอด้วยสองตัวแปร ในเกมเผด็จการที่มีเผด็จการจะได้รับ 100 USD และสามารถเลือกได้ว่าจะส่งหรือเก็บรักษาตัวเองเท่าใดมีความสัมพันธ์เชิงบวกระหว่างอายุและจำนวนเงินที่ผู้เข้าร่วมตัดสินใจเก็บไว้

ความคิดของฉันคือคุณไม่สามารถอนุมานสาเหตุจากสิ่งนี้เพราะคุณไม่สามารถอนุมานสาเหตุจากความสัมพันธ์ เพื่อนร่วมชั้นของฉันคิดว่าคุณทำได้เพราะถ้าคุณแยกผู้เข้าร่วมออกเป็นสามกลุ่มคุณจะเห็นว่าพวกเขาต่างกันในเรื่องที่พวกเขารักษาและจำนวนที่พวกเขาแบ่งปันกันและสรุปว่าอายุทำให้พวกเขาเก็บมากขึ้น ใครถูกต้องและทำไม


8
โดยปกติแล้วคุณไม่สามารถอนุมานสาเหตุของความสัมพันธ์ได้เว้นแต่ว่าคุณมีการทดสอบที่ออกแบบมา
user2974951

6
ทุกสิ่งที่เรารู้เกี่ยวกับโลกของเราในฐานะปัจเจกบุคคลเรารู้ผ่านสหสัมพันธ์ ใช่แล้วเราสามารถอนุมานสาเหตุจากความสัมพันธ์ได้เท่าที่สามารถกล่าวได้ว่าเหตุมีอยู่ทั้งหมด แน่นอนว่าการทำถูกต้องนั้นเป็นเรื่องยุ่งยาก
Aleksandr Dubinsky

เกมเผด็จการนี้เกิดขึ้นในแล็บหรือไม่ซึ่งการมอบหมายให้เป็นเผด็จการนั้นเป็นแบบสุ่มหรือไม่?
Dimitriy V. Masterov

ขนาดตัวอย่างคืออะไร
EngrStudent - Reinstate Monica

4
@ DimitriyV.Masterov ส่วนใหญ่มีแนวโน้มเข้าร่วมทุกคน 'ที่ได้รับมอบหมาย' จะเป็นเผด็จการและผู้เล่นที่สองเป็นพืช อย่างไรก็ตามฉันแน่ใจว่าไม่มีใครได้รับการสุ่มให้อายุ
gung - Reinstate Monica

คำตอบ:


10

โดยทั่วไปแล้วคุณไม่ควรสันนิษฐานว่าความสัมพันธ์นั้นมีความหมายถึงความเป็นเวรกรรม - แม้ในกรณีที่ดูเหมือนว่าเป็นเหตุผลเดียวที่เป็นไปได้

พิจารณาว่ามีสิ่งอื่น ๆ ที่มีความสัมพันธ์กับด้านอายุรุ่นของวัฒนธรรมเช่น บางทีทั้งสามกลุ่มนี้จะยังคงเหมือนเดิมแม้จะมีอายุมากขึ้น แต่คนรุ่นต่อไปจะมีแนวโน้มที่ดีขึ้น?

จากที่กล่าวมาทั้งหมดคุณอาจถูกต้องที่คนหนุ่มสาวมีแนวโน้มที่จะรักษาจำนวนที่มากขึ้น แต่เพียงตระหนักว่ามีความเป็นไปได้อื่น ๆ


นอกเหนือจากคำตอบอื่น ๆ การทดสอบปัจจุบันไม่สามารถแยกแยะระหว่างแบบจำลองที่เงินเก็บไว้เป็นหน้าที่ของอายุและเงินที่เก็บไว้เป็นหน้าที่ของปีเกิด โปรดทราบว่าตัวแบบที่สองอาจไม่ใช่แบบเส้นตรงข้ามกันในประวัติศาสตร์และอายุ 20 ปีที่นำมาจากช่วงเวลาทางประวัติศาสตร์ที่แตกต่างกันอาจตัดสินใจที่จะเก็บเงินสดไว้จำนวนมาก
NofP

7

ฉันสามารถอ้างถึงสาเหตุหลายประการจากข้อมูลของคุณ

  1. วัดอายุและจำนวนเงินที่เก็บไว้ ผู้เข้าร่วมที่มีอายุมากกว่าต้องการเก็บเงินมากขึ้น (บางทีพวกเขาฉลาดขึ้นหรือเพ้อฝันน้อยลง แต่นั่นไม่ใช่ประเด็น)

  2. จำนวนเงินที่เก็บไว้ถูกวัดและตามอายุ คนที่เก็บเงินมากขึ้นใช้เวลามากขึ้นในการนับและมีอายุมากกว่าเมื่อวัดอายุ

  3. คนป่วยต้องเก็บเงินมากขึ้นเพราะพวกเขาต้องการเงินสำหรับการรักษาหรือการรักษา (อาจช่วยชีวิต) ความสัมพันธ์ที่แท้จริงคือระหว่างความเจ็บป่วยและเงินที่เก็บไว้ แต่ตัวแปรนี้เป็น "ซ่อนเร้น" และเราจึงข้ามไปสู่ข้อสรุปที่ผิดเพราะอายุและโอกาสในการเจ็บป่วยมีความสัมพันธ์ในกลุ่มประชากรของบุคคลที่เลือกสำหรับการทดลอง

(ละเว้นทฤษฎี 143 ข้อฉันต้องทำให้มันสั้นพอสมควร)

  1. ผู้ทดลองพูดภาษาถิ่นเก่า ๆ ที่คลุมเครือซึ่งคนหนุ่มสาวไม่เข้าใจและเลือกผิดอย่างผิดพลาด

สรุป: คุณถูกต้อง แต่เพื่อนร่วมชั้นของคุณอาจอ้างว่าถูกต้องถึง 147 ครั้ง

อีกความสัมพันธ์ที่มีชื่อเสียงคือระหว่าง IQ ต่ำและเวลาดูทีวีทุกวัน การดูทีวีทำให้เป็นคนโง่หรือคนโง่ดูทีวีมากขึ้นหรือไม่? มันอาจเป็นได้ทั้งคู่


เยาวชนอาจประเมินคุณค่าของพวกเขาน้อยเกินไปแสดงว่าพวกเขายากจนในการเป็นผู้นำ หากพวกเขาไม่เข้าใจคุณค่าทำไมพวกเขาถึงตัดสินใจอย่างมีกลยุทธ์หรือแม้แต่มีเหตุผลกับมัน
EngrStudent - Reinstate Monica

5
ยังไม่ชัดเจนว่าคุณกำลังทำอะไรอยู่กับ "เพื่อนร่วมชั้นอาจเรียกร้องให้แก้ไขได้ถึง 147 เท่า" เพื่อนร่วมชั้นผิด - ข้อมูลนี้ไม่ได้หมายความถึงข้อสรุปที่อายุทำให้ขาดการแบ่งปัน
นิวเคลียร์วัง

@ นิวเคลียร์วังฉันคิดว่าประเด็นก็คือว่าเมื่อคุณมี 150 สมมุติอย่างเท่าเทียมกันอาจไม่มีใครเป็นไปได้ มันไม่เข้มงวดเท่าความพยายามของภาพประกอบ
aaaaa กล่าวว่าคืนสถานะโมนิก้า

2
อีกทฤษฎีหนึ่ง: อคติรอดชีวิต
. GitHub หยุดช่วยน้ำแข็ง

1
อืม .... ทีวีไม่มีสิ่งใดที่จะนำเสนอสิ่งที่ท้าทายเท่ากับเว็บไซต์นี้
คาร์ล

4

การอนุมานสาเหตุจากสหสัมพันธ์โดยทั่วไปเป็นปัญหาเพราะอาจมีสาเหตุอื่นอีกหลายประการที่สัมพันธ์กัน ตัวอย่างเช่นความสัมพันธ์ปลอมจากConfoundersเลือกอคติ (เช่นเลือกผู้เข้าร่วมที่มีรายได้ต่ำกว่าเกณฑ์ที่กำหนด) หรือผลกระทบเชิงสาเหตุอาจไปในทิศทางอื่น (เช่นเทอร์โมมิเตอร์สัมพันธ์กับอุณหภูมิ แต่ไม่ทำให้เกิด มัน). ในแต่ละกรณีเหล่านี้ขั้นตอนของเพื่อนร่วมชั้นของคุณอาจพบผลกระทบเชิงสาเหตุที่ไม่มี

อย่างไรก็ตามหากผู้เข้าร่วมถูกเลือกแบบสุ่มเราสามารถแยก Confounders และอคติการเลือกออก ในกรณีที่ทั้งอายุจะต้องก่อให้เกิดเงินเก็บไว้หรือเงินเก็บไว้ต้องทำให้เกิดอายุ คนหลังจะบอกเป็นนัยว่าการบังคับให้คนเก็บเงินไว้จำนวนหนึ่งจะทำให้อายุของพวกเขาเปลี่ยนแปลงไป ดังนั้นเราสามารถสรุปได้อย่างปลอดภัยว่าอายุทำให้เงินถูกเก็บไว้อายุเป็นสาเหตุที่ทำให้เงินเก็บไว้

หมายเหตุว่าผลกระทบเชิงสาเหตุที่อาจจะ"โดยตรง" หรือ "อ้อม" ผู้คนที่มีอายุต่างกันจะได้รับการศึกษาที่แตกต่างกันมีความมั่งคั่งในจำนวนที่แตกต่างกันและด้วยเหตุผลเหล่านี้อาจเลือกที่จะเก็บเงินจำนวน $ 100 ที่แตกต่างกัน ผลกระทบเชิงสาเหตุผ่านตัวกลางเหล่านี้ยังคงมีผลกระทบเชิงสาเหตุ แต่เป็นทางอ้อม


3
ในย่อหน้าที่สองคุณพูดถึงว่ามันจะต้องเป็นสาเหตุ โปรดทราบว่าอาจเป็นเสียงจากการเลือกแบบสุ่ม (ผู้เข้าร่วมประชุมอาวุโสคนอื่นใช้เงิน [เพราะเหตุใดพวกเขาจึงเก็บไว้]] และผู้เข้าร่วมรุ่นเยาว์คนอื่น ๆ เก็บเงิน [ฉันต้องการเกษียณอายุ / ซื้อบ้าน])
llrs

1
การเลือกแบบสุ่มเพียงพอหรือไม่ ในการออกแบบการทดลองอย่างง่ายเราต้องการสุ่มมอบหมาย "การรักษา" --- ที่นี่อายุ --- สำหรับการตัดสินที่ถูกต้องเกี่ยวกับผลกระทบเชิงสาเหตุ (แน่นอนเราไม่สามารถกำหนดคนต่างวัยได้ดังนั้นการออกแบบการทดลองอย่างง่ายนี้อาจไม่สามารถนำมาใช้ได้)
locobro

1
p(ydo(age))=p(yage)

4
คุณได้ยกเว้นความเป็นไปได้ ความสัมพันธ์ระหว่าง A และ B สามารถอธิบายได้ดังต่อไปนี้: A อาจทำให้ B หรือ B อาจทำให้ A หรือปัจจัยอื่นที่ไม่รู้จักก่อนหน้านี้ C อาจทำให้ทั้ง A และ B
Tim Randall

1
@locobro: นี่คือสิ่งที่สับสนหรือเป็นรูปแบบของการเลือกอคติหรือไม่? เนื่องจากคุณกำลังเลือกคนที่ยังมีชีวิตอยู่ อย่างไรก็ตามการสังเกตที่น่าสนใจที่ฉันไม่ได้คิดดังนั้นการเลือกแบบสุ่มอย่างแท้จริงอาจเป็นไปไม่ได้ที่นี่
ลูคัส

3

ความสัมพันธ์เป็นแนวคิดทางคณิตศาสตร์ เวรกรรมเป็นแนวคิดทางปรัชญา

ในทางกลับกันความสัมพันธ์ปลอมแปลงเป็นส่วนใหญ่ทางเทคนิค (คุณจะไม่พบมันในตำราแบบวัดความน่าจะเป็นตามทฤษฎี) ซึ่งสามารถกำหนดได้ในลักษณะที่สามารถนำไปใช้ได้จริง

ความคิดนี้มีความสัมพันธ์อย่างใกล้ชิดกับแนวคิดเรื่องการทำผิดวิทยาศาสตร์ในที่ที่เป้าหมายไม่เคยพิสูจน์สิ่งต่าง ๆ เพียงเพื่อพิสูจน์หักล้างพวกเขา

สถิติคือคณิตศาสตร์เนื่องจากยาคือชีววิทยา คุณถูกขอให้ตัดสินใจอย่างดีที่สุดด้วยการสนับสนุนความรู้ด้านเทคนิคที่มีอยู่มากมาย แต่ความรู้นี้ไม่เพียงพอที่จะครอบคลุมทั้งโลก ดังนั้นหากคุณกำลังตัดสินใจในฐานะนักสถิติและนำเสนอให้ผู้อื่นคุณต้องปฏิบัติตามมาตรฐานคุณภาพที่แน่นอน นั่นคือคุณกำลังให้คำแนะนำที่ดีและให้คุณค่ากับเงินของพวกเขา นอกจากนี้ยังหมายถึงการคำนึงถึงความไม่สมดุลของความเสี่ยงในการทดสอบทางการแพทย์ค่าใช้จ่ายในการให้ผลลบที่ผิดพลาด (ซึ่งอาจป้องกันไม่ให้ผู้คนได้รับการรักษาตั้งแต่ต้น) อาจสูงกว่าค่าใช้จ่ายในการให้ผลบวกปลอม .

ในทางปฏิบัติมาตรฐานเหล่านี้จะแตกต่างกันไปในแต่ละเขต - บางครั้งก็เป็น RCT แบบ blind-blind สามครั้งบางครั้งก็เป็นตัวแปรเครื่องมือและเทคนิคอื่น ๆ เพื่อควบคุมการย้อนกลับของสาเหตุและสาเหตุทั่วไปที่ซ่อนอยู่บางครั้งก็เป็นสาเหตุของ Granger อย่างอื่นในที่ที่มีอยู่ แต่ไม่ใช่ในทิศทางตรงกันข้าม มันอาจจะเป็นมาตรฐานที่เข้มงวดและการตรวจสอบข้าม


3
(-1) สาเหตุปัจจุบันได้พบการรักษาทางคณิตศาสตร์อย่างกว้างขวาง ดูตัวอย่างงานของจูเดียเพิร์ล นอกจากนี้คำจำกัดความ "ทางเทคนิค" และ "ที่สามารถนำไปปฏิบัติได้มากที่สุด" ของสหสัมพันธ์แบบปลอมคืออะไร
Julian Schuessler

3

ความสัมพันธ์ระหว่างสหสัมพันธ์และสาเหตุได้ทำให้นักปรัชญาและนักสถิตินิ่งงันมาหลายศตวรรษ ในที่สุดเมื่อยี่สิบปีที่แล้วนักวิทยาศาสตร์คอมพิวเตอร์อ้างว่าได้แยกมันออกมา เรื่องนี้ดูเหมือนจะไม่เป็นที่รู้จักอย่างกว้างขวาง โชคดีจูเดียเพิร์ลผู้เสนอญัตติสำคัญในสาขานี้เพิ่งเผยแพร่หนังสืออธิบายงานนี้สำหรับผู้ชมที่เป็นที่นิยม: The Book of Why

https://www.amazon.com/Book-Why-Science-Cause-Effect/dp/046509760X

https://bigthink.com/errors-we-live-by/judea-pearls-the-book-of-why-brings-news-of-a-new-science-of-causes

การแจ้งเตือนผู้สปอยเลอร์: คุณสามารถอนุมานสาเหตุจากความสัมพันธ์ในบางสถานการณ์หากคุณรู้ว่าคุณกำลังทำอะไรอยู่ คุณต้องตั้งสมมติฐานเกี่ยวกับสาเหตุเพื่อเริ่มต้นด้วย (โมเดลเชิงสาเหตุอิงตามวิทยาศาสตร์) และคุณต้องการเครื่องมือที่ใช้ในการทำเหตุผลเชิงต่อต้าน (เชิงพีชคณิต) ขออภัยฉันไม่สามารถกลั่นให้เหลือสองสามบรรทัด (ฉันยังคงอ่านหนังสือของตัวเอง) แต่ฉันคิดว่าคำตอบสำหรับคำถามของคุณอยู่ที่นั่น


5
Pearl และผลงานของเขาค่อนข้างโดดเด่น มันจะเป็นสถิติผิดปกติที่ไม่เคยได้ยินเรื่องนี้ โปรดทราบว่าเขาได้ "แยกออกทั้งหมด" อย่างแท้จริงนั้นเปิดกว้างมากสำหรับการอภิปราย ไม่มีคำถามว่าวิธีการของเขาทำงานบนกระดาษ (เมื่อคุณสามารถรับประกันสมมติฐานได้ตรง) แต่วิธีการทำงานได้ดีในสถานการณ์จริงจะยิ่งอันตราย
gung - Reinstate Monica

4
ฉันต้องการให้ (+1) และ (-1) ในเวลาเดียวกันดังนั้นไม่ต้องลงคะแนนจากฉัน (+1) ใช้เพื่อกล่าวถึง Judea Pearl และผลงานของเขา งานของเขาช่วยสร้างสนามสถิติเชิงสาเหตุได้อย่างแน่นอน (-1) ที่บอกว่ามันมีนักปรัชญาและนักสถิตินิ่งงันมานานหลายศตวรรษ แต่ตอนนี้ Pearl แก้ไขแล้ว ฉันเชื่อว่าวิธีการ Pearl เป็นวิธีที่ดีที่สุดในการคิดเกี่ยวกับสิ่งต่าง ๆ แต่ในเวลาเดียวกันถ้าคุณใช้วิธีนี้ (ซึ่งคุณควร) คำตอบของคุณคือ "ถ้าสมมติฐานที่ไม่สามารถพิสูจน์ได้ของฉันถูกต้อง เรามาคิดเกี่ยวกับสมมติฐานเหล่านั้นกันเถอะ "
หน้าผา AB

2
btw ประโยคสุดท้ายของฉันไม่ได้เข้าใกล้แนวทางของ Pearl แต่เป็นการรับรู้ว่าการอนุมานสาเหตุยังคงเป็นเรื่องยากมากและคุณต้องซื่อสัตย์เกี่ยวกับข้อ จำกัด ในการวิเคราะห์ของคุณ
หน้าผา AB

1
Pearl ส่งเสริม neo-Bayesianism ชนิดใหม่ (เดินตามรอยเท้าของ ET Jaynes ผู้ยิ่งใหญ่) ซึ่งเป็นสิ่งที่ควรค่าแก่การรู้ แต่คำตอบของคุณเองบอกว่า: << คุณต้องตั้งสมมติฐานเกี่ยวกับสาเหตุเพื่อเริ่มต้นด้วย (แบบจำลองเชิงสาเหตุตามหลักวิทยาศาสตร์) >> - คุณไปแล้ว เจย์เนสเป็นนักวิจารณ์คนสำคัญของสถิติกระแสหลักซึ่งไม่ได้ให้เกียรติกับนักบวชอย่างชัดเจนและแทนที่จะใช้ระบบ "วัตถุประสงค์" ซึ่งเป็นสาเหตุของการสูญเสียเวรกรรม เพิร์ลเดินหน้าต่อไปและให้เครื่องมือแก่เราในการเผยแพร่สมมติฐานเกี่ยวกับเวรกรรมจากนักบวชสู่ผู้โพสต์ - ซึ่งไม่ใช่เวรกรรมยกเว้นนิฮอิโล
8948

1
ฉันยังหลีกเลี่ยง +1 สำหรับบทกวีที่มากเกินไปในตอนแรก ฉันหมายความว่าหลายสิ่งหลายอย่าง " นิ่งงัน [ปัญญาชนบางประเภท] สำหรับทุกวัย " แต่การสังเกตดังกล่าวมีแนวโน้มที่จะเป็นผลมาจากการสุ่มตัวอย่างแบบเอนเอียงและเล่นเป็นเรื่องเล่าเท็จเกี่ยวกับความรู้ของมนุษย์ราวกับว่ามันเป็นบล็อกโซ่ อ่านและเขียนถึง แต่ดูเหมือนว่าไม่มีมูลความจริงที่จะยืนยันว่าไม่มีใครในยุคนั้นเข้าใจแนวคิดเพียงเพราะมันเป็นความเข้าใจผิดของผู้อื่น ขออภัยที่พูดจาโผงผางเพียงอย่างเดียวภาษาละครเริ่มต้นดูเหมือนจะเบี่ยงเบนไปจากส่วนที่เหลือ
Nat

2

การเรียกร้องเชิงสาเหตุสำหรับอายุจะไม่เหมาะสมในกรณีนี้

ปัญหาเกี่ยวกับการอ้างเหตุผลในการออกแบบคำถามการสอบของคุณสามารถถูกต้มลงไปในข้อเท็จจริงง่ายๆอย่างหนึ่ง: อายุไม่ใช่การรักษาอายุไม่ได้จัดการเลย เหตุผลหลักในการทำการศึกษาที่ถูกควบคุมนั้นเป็นเพราะเนื่องจากการควบคุมและควบคุมตัวแปรที่น่าสนใจคุณสามารถพูดได้ว่าการเปลี่ยนแปลงในตัวแปรเดียวทำให้เกิดการเปลี่ยนแปลงในผลลัพธ์ (ภายใต้เงื่อนไขการทดลองที่เฉพาะเจาะจงมากและโหลดเรือ ของข้อสันนิษฐานอื่น ๆ เช่นการมอบหมายแบบสุ่มและผู้ทดลองไม่ได้ทำอะไรผิดพลาดในรายละเอียดการดำเนินการ

แต่นั่นไม่ใช่สิ่งที่การออกแบบการสอบอธิบาย - มันมีเพียงสองกลุ่มของผู้เข้าร่วมกับข้อเท็จจริงเฉพาะหนึ่งที่แตกต่างพวกเขารู้ (อายุ) แต่คุณไม่มีทางรู้วิธีอื่นใดในกลุ่มที่แตกต่าง เนื่องจากขาดการควบคุมคุณไม่สามารถรู้ได้ว่ามันเป็นความแตกต่างของอายุที่ทำให้เกิดการเปลี่ยนแปลงหรือไม่หรือเป็นเพราะเหตุผลที่เด็กอายุ 40 ปีเข้าร่วมการศึกษาคือเพราะพวกเขาต้องการเงินในขณะที่อายุ 20 ปีเป็น นักเรียนที่เข้าร่วมสินเชื่อในชั้นเรียนและมีแรงจูงใจที่แตกต่างกัน - หรือความแตกต่างทางธรรมชาติที่เป็นไปได้ในกลุ่มของคุณ

ตอนนี้ศัพท์ทางเทคนิคสำหรับสิ่งต่าง ๆ เหล่านี้แตกต่างกันไปตามสนาม คำศัพท์ทั่วไปสำหรับสิ่งต่าง ๆ เช่นอายุของผู้เข้าร่วมและเพศคือ "แอตทริบิวต์ผู้เข้าร่วม", "ตัวแปรภายนอก", "ตัวแปรอิสระของแอตทริบิวต์" ฯลฯ ท้ายที่สุดคุณต้องพบกับสิ่งที่ไม่ใช่ "การทดลองจริง" หรือ "การทดลองจริงที่ควบคุม" เพราะสิ่งที่คุณต้องการเรียกร้องเกี่ยวกับ - เช่นอายุไม่ได้อยู่ในการควบคุมของคุณที่จะเปลี่ยนแปลงดังนั้นส่วนใหญ่คุณสามารถหวังโดยไม่ต้องใช้วิธีการขั้นสูงมากขึ้น (เช่นการอนุมานสาเหตุเงื่อนไขเพิ่มเติมข้อมูลระยะยาว ฯลฯ ) คือการอ้างว่ามีความสัมพันธ์

นี่ก็เป็นหนึ่งในเหตุผลที่ว่าทำไมการทดลองทางสังคมศาสตร์และการเข้าใจคุณลักษณะที่ยากต่อการควบคุมของผู้คนนั้นเป็นเรื่องยุ่งยากในทางปฏิบัติ - ผู้คนต่างกันในหลาย ๆ วิธีและเมื่อคุณไม่สามารถเปลี่ยนแปลงสิ่งที่คุณต้องการ เพื่อเรียนรู้เกี่ยวกับคุณมักจะต้องการเทคนิคการทดลองและการอนุมานที่ซับซ้อนกว่าหรือกลยุทธ์ที่แตกต่างกันโดยสิ้นเชิง

คุณจะเปลี่ยนการออกแบบเพื่ออ้างเหตุผลได้อย่างไร

ลองนึกภาพสถานการณ์สมมติเช่นนี้: กลุ่ม A และ B ประกอบด้วยผู้เข้าร่วมที่มีอายุ 20 ปี

คุณมีกลุ่ม A เล่นเกมเผด็จการตามปกติ

สำหรับกลุ่ม B คุณจะได้รับ Magical Aging Ray of Science (หรืออาจจะมีผีรักษาพวกเขาด้วยหน้าตาที่น่ากลัว ) ซึ่งคุณได้ปรับจูนอย่างระมัดระวังเพื่อเพิ่มอายุผู้เข้าร่วมทั้งหมดในกลุ่ม B เพื่อให้พวกเขามีอายุ 40 ปี แต่ มิฉะนั้นปล่อยให้พวกเขาไม่เปลี่ยนแปลงแล้วให้พวกเขาเล่นเกมเผด็จการเช่นเดียวกับกลุ่ม A

เพื่อความแม่นยำที่เพิ่มขึ้นคุณจะได้รับกลุ่ม C ที่มีอายุ 40 ปีโดยธรรมชาติเพื่อยืนยันว่าการสังเคราะห์อายุนั้นเปรียบได้กับการแก่ตามธรรมชาติ แต่ให้สิ่งต่าง ๆ เรียบง่ายและบอกว่าเรารู้ว่าการแก่ชราแบบเทียมนั้นเหมือนของจริง งาน".

ตอนนี้หากกลุ่ม B เก็บเงินได้มากกว่ากลุ่ม A คุณสามารถเรียกร้องได้ว่าการทดลองบ่งชี้ว่าการแก่ชราทำให้คนเก็บเงินได้มากขึ้น แน่นอนว่ายังมีอีกประมาณหนึ่งพันเหตุผลว่าทำไมการอ้างสิทธิ์ของคุณอาจกลายเป็นผิด แต่อย่างน้อยการทดสอบของคุณมีการตีความสาเหตุที่ถูกต้อง


2

ไม่ได้มีความสัมพันธ์ทางตรรกะทางเดียวระหว่างเวรกรรมและสหสัมพันธ์

พิจารณาความสัมพันธ์ของคุณสมบัติที่คุณคำนวณกับข้อมูลบางอย่างเช่นความสัมพันธ์ (เชิงเส้น) ที่พบบ่อยที่สุดตามที่กำหนดโดย Pearson สำหรับคำจำกัดความความสัมพันธ์เฉพาะนี้คุณสามารถสร้างจุดข้อมูลแบบสุ่มที่จะมีความสัมพันธ์เป็นศูนย์หรือหนึ่งโดยไม่มีความสัมพันธ์เชิงสาเหตุใด ๆ ระหว่างพวกเขาเพียงแค่มีสมมาตร (a) บางอย่าง สำหรับคำจำกัดความของความสัมพันธ์ใด ๆ คุณสามารถสร้างใบสั่งยาที่จะแสดงพฤติกรรมทั้งสอง: ค่าสูงของความสัมพันธ์โดยไม่มีความสัมพันธ์ทางคณิตศาสตร์ในระหว่างและค่าต่ำของความสัมพันธ์แม้ว่าจะมีการแสดงออกคงที่

ใช่ความสัมพันธ์จาก "ไม่เกี่ยวข้อง แต่มีความสัมพันธ์สูง" อ่อนแอกว่า "ไม่มีความสัมพันธ์แม้จะเกี่ยวข้องกัน" แต่ตัวบ่งชี้ (!) เดียวที่คุณมีหากมีความสัมพันธ์กันอยู่นั่นคือคุณต้องมองหาคำอธิบายให้หนักขึ้น


แถบที่สูงกว่า "ไม่มีความสัมพันธ์" คือความเป็นอิสระทางสถิติซึ่งมีความหมายเช่น P (A | B) = P (A) อันที่จริงความสัมพันธ์เพียร์สันศูนย์ไม่ได้หมายความถึงความเป็นอิสระทางสถิติ แต่เช่นศูนย์ความสัมพันธ์ระยะไม่
user8948

2

โดยทั่วไปแล้วคุณไม่สามารถข้ามจากความสัมพันธ์ไปสู่สาเหตุได้ ตัวอย่างเช่นมีปรากฏการณ์ทางสังคมศาสตร์ที่เป็นที่รู้จักกันดีเกี่ยวกับสถานะทางสังคม / ชั้นเรียนและมีแนวโน้มที่จะใช้จ่าย / บันทึก สำหรับหลาย ๆ คนหลาย ๆปีที่ผ่านมาก็เชื่อว่าสาเหตุนี้แสดงให้เห็นว่า ปีที่แล้วมีงานวิจัยที่เข้มข้นกว่านี้แสดงว่ามันไม่ใช่

คลาสสิก "ความสัมพันธ์ไม่ได้เป็นสาเหตุ" - ในกรณีนี้เป็นปัจจัยที่รบกวนก็คือการที่เติบโตขึ้นมาในความยากจนสอนคนที่จะใช้เงินที่แตกต่างกันและการใช้จ่ายถ้ามีส่วนเกินเพราะมันไม่อาจจะมีในวันพรุ่งนี้แม้ว่าบันทึกไว้ด้วยเหตุผลต่างๆ .

ในตัวอย่างของคุณสมมติว่าผู้สูงอายุทุกคนอาศัยอยู่ในสงครามที่คนหนุ่มสาวไม่ได้ทำ ลิงก์อาจเป็นได้ว่าคนที่เติบโตขึ้นมาในสังคมที่สับสนวุ่นวายมีความเสี่ยงต่ออันตรายและการสูญเสียชีวิตเรียนรู้ที่จะจัดลำดับความสำคัญของทรัพยากรการออมเพื่อตนเองและต่อความต้องการมากกว่าผู้ที่เติบโตขึ้นมาในสถานการณ์ที่มีความสุข บริษัท ประกันสุขภาพจะดูแลและการอยู่รอดไม่ใช่ปัญหาที่กำหนดมุมมองของพวกเขา จากนั้นคุณจะได้รับการเชื่อมโยงที่ชัดเจนเดียวกัน - คนเก่า (รวมทั้งผู้ที่ใกล้ชิดกับรุ่นของพวกเขา) ให้มากขึ้น แต่มันจะเพียง แต่เห็นได้ชัดว่าจะเชื่อมโยงกับอายุ ในความเป็นจริงองค์ประกอบที่ก่อให้เกิดเป็นสถานการณ์ทางสังคมหนึ่งใช้เวลาก่อสร้างปีและสิ่งที่นิสัยที่สอน - ไม่ได้อายุต่อ se


2

มีเหตุผลบางประการที่ข้อสรุปนี้ไม่สมเหตุสมผล

  1. มันไม่ใช่สมมติฐานที่กำหนดไว้ล่วงหน้า
  2. ไม่มีกลุ่มควบคุม
  3. อายุไม่ใช่ปัจจัยเสี่ยงที่แก้ไขได้ ... ขึ้นอยู่กับคำถามที่คุณพยายามถาม

การปรับปรุงที่แนะนำในการออกแบบคือการศึกษาข้ามประเภทต่อไปนี้

การตั้งค่าเดียวกัน: สุ่มการลงโทษอายุใด ๆ ที่ครอบครองดินแดน การออกแบบ: เลือกคู่เผด็จการทั้งเด็กและผู้ใหญ่ที่จับคู่กัน ให้หม้อเงินแก่พวกเขาตรวจสอบสัดส่วนที่แตกต่างกัน (เก่า - หนุ่ม =พี1) ขโมยเงินคืนเพื่อให้ประเทศและผู้ปกครองมีสินทรัพย์เหมือนเดิม ขับไล่พวกเขาออกจากบัลลังก์ของตนและติดตั้งในดินแดนของอีกฝ่าย ทำซ้ำการให้การตรวจสอบความแตกต่างสัดส่วนที่ถูกระงับ (เก่า - หนุ่ม =พี2)


1

เวรกรรมและสหสัมพันธ์เป็นประเภทต่าง ๆ ของสิ่งต่าง ๆ นั่นคือเหตุผลที่ความสัมพันธ์เพียงอย่างเดียวไม่เพียงพอที่จะอนุมานสาเหตุ

ตัวอย่างเช่นเวรกรรมเป็นทิศทางในขณะที่ความสัมพันธ์ไม่ได้ เมื่อทำการอนุมานสาเหตุคุณต้องระบุสาเหตุและผลกระทบ

มีสิ่งอื่น ๆ ที่อาจรบกวนการอนุมานของคุณ ตัวแปรที่ซ่อนอยู่หรือที่สามและคำถามเกี่ยวกับสถิติทั้งหมด (การเลือกตัวอย่างขนาดตัวอย่าง ฯลฯ )

แต่สมมติว่าสถิติของคุณทำอย่างถูกต้องความสัมพันธ์สามารถให้เบาะแสเกี่ยวกับสาเหตุ โดยทั่วไปหากคุณพบความสัมพันธ์หมายความว่ามีสาเหตุบางอย่างและคุณควรเริ่มมองหามัน

คุณสามารถเริ่มต้นด้วยสมมติฐานที่มาจากความสัมพันธ์ของคุณ แต่สมมติฐานไม่ได้เป็นเวรกรรมมันเป็นเพียงความเป็นไปได้ของเวรกรรม จากนั้นคุณต้องทดสอบ หากสมมติฐานของคุณต่อต้านการทำผิดพลาดอย่างเพียงพอคุณอาจต้องทำอะไรบางอย่าง

ตัวอย่างเช่นในสมมติฐานอายุ - ความโลภของคุณสมมติฐานทางเลือกหนึ่งอาจเป็นไปได้ว่ามันไม่ใช่อายุ แต่ความยาวของการเป็นเผด็จการ ดังนั้นคุณจะมองหาเผด็จการที่เก่าแก่ แต่ได้รับอำนาจเมื่อไม่นานมานี้ในฐานะกลุ่มควบคุมและผู้มีอำนาจเผด็จการตั้งแต่วัยเด็กเป็นคนที่สองและตรวจสอบผลลัพธ์ที่นั่น


-2

ขอขอบคุณ @AdamO ที่เสนอการอภิปรายและการโต้แย้งจำนวนมากในโพสต์นี้ ฉันพยายามเสนอมุมมองทางกายภาพเกี่ยวกับความเป็นเหตุเป็นผลซึ่งอาจไม่คุ้นเคยกับผู้อ่านเฉลี่ยของสถิติ

คุณถูกต้องจากมุมมองของวิทยาศาสตร์กายภาพ ในรูปแบบที่ง่ายที่สุดความเป็นไปได้ของมุมมองที่เป็นอิสระทางกายภาพเกี่ยวกับความเป็นไปได้ของเวลานั้นอยู่บนพื้นฐานของมุมมองนิรนัย - นาม (DN) ของคำอธิบายทางวิทยาศาสตร์โดยพิจารณาเหตุการณ์ที่ต้องอธิบาย ในมุมมอง DN สถานะทางกายภาพถูกพิจารณาว่าถูกอธิบายว่าหากใช้กฎ (ที่กำหนดขึ้น) มันสามารถได้มาจากเงื่อนไขเริ่มต้นที่กำหนด (เงื่อนไขเบื้องต้นดังกล่าวอาจรวมถึงโมเมนต์และระยะทางจากกันและกันของดาวคู่ในช่วงเวลาใดก็ตาม) 'คำอธิบายโดยการกำหนดระดับ' บางครั้งเรียกว่าการกำหนดระดับเชิงสาเหตุ

ทำให้สมบูรณ์มากขึ้นเกี่ยวกับเรื่องนี้อย่างใดอย่างหนึ่งจะรวมถึงรูปแบบการอุปนัย - สถิติของ Hempel เพื่อสร้างคำอธิบายทางวิทยาศาสตร์ซึ่งการเชื่อมโยงมีการอภิปรายที่สมบูรณ์มากขึ้นของเวร

สำหรับปัญหาในมืออายุอาจเกี่ยวข้องกับประสบการณ์ แต่ความสัมพันธ์นั้นไม่ง่ายยิ่งไปกว่านั้นการทำงานของสมองในวัยที่แตกต่างกันนั้นแตกต่างกัน ประสบการณ์ในฐานะตัวดัดแปลงของพฤติกรรมนั้นค่อนข้างผันแปรและเพียงเพราะหมู่คนในความรู้สึกทางอาณาเขตและทางโลกบางอย่างอาจมีประสบการณ์ในอดีตที่คล้ายกันไม่ได้หมายความว่าพฤติกรรมใด ๆ ที่เกิดจากประสบการณ์เหล่านั้นสามารถคาดการณ์ถึงกลุ่มคนอื่น ๆ ด้วยความเคารพต่อการควบคุมการทดลองสามัญชนของประสบการณ์เป็นตัวแปรที่ไม่สามารถควบคุมได้ซึ่งนำเสนอจำนวนที่ไม่รู้จักและไม่ได้อธิบายเกี่ยวกับความสัมพันธ์แบบลวงตาในการเปรียบเทียบแบบไบนารีใด ๆ ที่ความแตกต่างใด ๆ ที่พบไม่ควรพิจารณา ยิ่งไปกว่านั้นสาเหตุที่เป็นไปได้เมื่อพบ จะเป็นเพียงความสงสัยและไม่ใช่สิ่งที่ใคร ๆ สามารถพูดด้วยความมั่นใจ ที่ดีที่สุดคือสมมติฐานการทำงานไม่ได้ข้อสรุปที่ดีที่สุด ความเชื่อมั่นที่เกี่ยวกับความเป็นเหตุเป็นผลควรถูกดึงมาจากหลักฐานที่ครอบคลุมเพียงพอสำหรับความเชื่อมั่นเหล่านั้นโดยปราศจากข้อสงสัยอย่างสมเหตุสมผล นั่นไม่ใช่กรณีของคำถามข้างต้นที่มีข้อมูลไม่เพียงพอที่จะเรียกร้องความสัมพันธ์เชิงสาเหตุใด ๆ นอกเหนือจากบริบทโดยบังเอิญจากการจัดกลุ่มตามรุ่น เราสามารถกำหนดสมมุติฐานมากมายเช่นการวิวัฒนาการของความเอื้ออาทรกับอายุได้รับการแก้ไขโดยประสบการณ์ทางประวัติศาสตร์ / วัฒนธรรมซึ่งไม่มีข้อสรุปที่แน่ชัดจากปัญหาดังกล่าว ความเชื่อมั่นที่เกี่ยวกับความเป็นเหตุเป็นผลควรถูกดึงมาจากหลักฐานที่ครอบคลุมเพียงพอสำหรับความเชื่อมั่นเหล่านั้นโดยปราศจากข้อสงสัยอย่างสมเหตุสมผล นั่นไม่ใช่กรณีของคำถามข้างต้นที่มีข้อมูลไม่เพียงพอที่จะเรียกร้องความสัมพันธ์เชิงสาเหตุใด ๆ นอกเหนือจากบริบทโดยบังเอิญจากการจัดกลุ่มตามรุ่น เราสามารถกำหนดสมมุติฐานมากมายเช่นการวิวัฒนาการของความเอื้ออาทรกับอายุได้รับการแก้ไขโดยประสบการณ์ทางประวัติศาสตร์ / วัฒนธรรมซึ่งไม่มีข้อสรุปที่แน่ชัดจากปัญหาดังกล่าว ความเชื่อมั่นที่เกี่ยวกับความเป็นเหตุเป็นผลควรถูกดึงมาจากหลักฐานที่ครอบคลุมเพียงพอสำหรับความเชื่อมั่นเหล่านั้นโดยปราศจากข้อสงสัยอย่างสมเหตุสมผล นั่นไม่ใช่กรณีของคำถามข้างต้นที่มีข้อมูลไม่เพียงพอที่จะเรียกร้องความสัมพันธ์เชิงสาเหตุใด ๆ นอกเหนือจากบริบทโดยบังเอิญจากการจัดกลุ่มตามรุ่น เราสามารถกำหนดสมมุติฐานมากมายเช่นการวิวัฒนาการของความเอื้ออาทรกับอายุได้รับการแก้ไขโดยประสบการณ์ทางประวัติศาสตร์ / วัฒนธรรมซึ่งไม่มีข้อสรุปที่แน่ชัดจากปัญหาดังกล่าว


ถ้า X-> M และ M-> Y ส่วนใหญ่จะเห็นด้วย X ทำให้ Y (การไกล่เกลี่ย) ฉันคิดว่าคุณต้องมีความชัดเจนเกี่ยวกับวิธีการที่เกี่ยวข้องกับตัวแปร "ที่สาม" โดยเฉพาะ: อคติของคอลไลเดอร์และการรบกวนเป็นอีกกรณีหนึ่งที่ "ตัวแปรที่สาม"
AdamO

@AdamO ตัวแปรแทรกแซง (X → W → Y) หากตรวจไม่พบอาจทำให้เกิดสาเหตุทางอ้อมดูโดยตรง ด้วยเหตุนี้ความสัมพันธ์ที่ระบุโดยการทดลองจึงไม่ได้แสดงถึงความสัมพันธ์เชิงสาเหตุเว้นแต่ความสัมพันธ์ปลอมจะถูกตัดออกไป ฉันใส่ลิงค์ไปสู่ความสัมพันธ์แบบลวงตาสำหรับผู้ที่ต้องการอ่านเพิ่มเติมเกี่ยวกับเรื่องนี้
คาร์ล

1
สวัสดี @Carl ขอบคุณสำหรับลิงค์ Wiki ฉันแก้ไขข้อความที่คุณพูดถึงข้างต้นเพราะไม่มีสิ่งใดเช่น "ตัวแปรแทรกแซง" ที่คาดหวังในเทววิทยา ระยะเวลาที่เหมาะสมคือการไกล่เกลี่ย Pearl ได้เขียนเกี่ยวกับมันมากมายถ้าคุณต้องการการอ้างอิงที่เป็นทางการ ตัวอย่าง: การละทิ้งเกลือจากอาหาร (x) ลด ouabain ภายนอก (m) และ ouabain ส่วนเกินจะเพิ่มความดันโลหิต (y) อย่างไรก็ตามคำแนะนำในการลดเกลือ (x) มีประสิทธิภาพในการลดความดันโลหิต (y) ouabain ไม่ได้ "แทรกแซง" แต่มันไกล่เกลี่ย: (m) เป็นสิ่งที่ทำไม (x) ทำงาน เราไม่ค่อยสนใจผลกระทบโดยตรง
AdamO

สวัสดี @AdamO มีความแตกต่างระหว่างการใช้งานทั่วไปและภาษาที่แน่นอน ตัวอย่างเช่นคน (1) พูดว่า "การสูบบุหรี่ (บุหรี่) ทำให้เกิดมะเร็งปอด" ทำมัน? การสูบบุหรี่ปรับเปลี่ยนความชอบธรรมชาติสำหรับเหตุการณ์ที่สุ่ม นั่นคือมันจะเพิ่มโอกาสในการเป็นมะเร็งปอด (2) ในไวยากรณ์ภาษาอังกฤษคลาสสิกเราบอกว่าคำคุณศัพท์แก้ไขคำนาม มันจะทำให้รู้สึกน้อยกว่าที่จะพูดว่า "การสูบบุหรี่ไกล่เกลี่ยมะเร็งปอด" หรือว่าคำคุณศัพท์ "ไกล่เกลี่ย" คำนาม ฉันไม่สงสัยเลยว่ามีคนใช้คำว่า "ไกล่เกลี่ย" อย่างไรก็ตามดูเหมือนว่าจะเป็นการใช้คำที่ไม่ถูกต้อง
คาร์ล

4
"Even its most ardent advocates fail to say how smoking increases the odds ratios of lung cancer. " - irrelevant: that was not the question, nor is it necessary to declare causation using proper counterfactual reasoning. "Not all lung cancer is 'caused' by smoking" - that was never implied and again, irrelevant. Again, please read Causality and share your thoughts after.
AdamO
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.