ฉันรู้ว่าความสัมพันธ์ไม่ได้บ่งบอกถึงความเป็นเหตุเป็นผล แต่การขาดความสัมพันธ์นั้นหมายถึงการขาดความเป็นเหตุเป็นผล?
ฉันรู้ว่าความสัมพันธ์ไม่ได้บ่งบอกถึงความเป็นเหตุเป็นผล แต่การขาดความสัมพันธ์นั้นหมายถึงการขาดความเป็นเหตุเป็นผล?
คำตอบ:
การขาดความสัมพันธ์หมายความว่าไม่มีเหตุอะไร?
ไม่ระบบควบคุมใด ๆ เป็นตัวอย่าง
หากปราศจากการควบคุมความสัมพันธ์เชิงสาเหตุเป็นไปไม่ได้ชัดเจน แต่การควบคุมที่ประสบความสำเร็จหมายถึงการพูดอย่างคร่าว ๆ ว่าปริมาณบางอย่างนั้นคงที่ซึ่งหมายความว่าจะไม่มีความสัมพันธ์กับสิ่งใดรวมถึงสิ่งต่าง ๆ ที่ทำให้มันคงที่
ดังนั้นในสถานการณ์นี้การสรุปว่าไม่มีความสัมพันธ์เชิงสาเหตุจากการขาดสหสัมพันธ์จะเป็นความผิดพลาด
ฉบับที่ส่วนใหญ่เป็นเพราะโดยความสัมพันธ์คุณน่าจะหมายถึงความสัมพันธ์เชิงเส้น สองตัวแปรสามารถมีความสัมพันธ์nonlinearlyและอาจแสดงไม่มีความสัมพันธ์เชิงเส้น มันง่ายที่จะสร้างตัวอย่างเช่นนั้น แต่ฉันจะให้ตัวอย่างที่ใกล้กับคำถามของคุณ (แคบลง)
ลองดูที่ตัวแปรสุ่มและไม่ใช่สุ่มฟังก์ชันกับที่เราสร้างตัวแปรสุ่ม(x) หลังมีสาเหตุมาจากตัวแปรเดิมอย่างชัดเจนไม่ใช่แค่ความสัมพันธ์ มาวาดพล็อตกระจาย:f ( x ) = x 2 y = f ( x )
รูปภาพที่มีความสัมพันธ์แบบไม่เชิงเส้นที่ชัดเจนและดี แต่ในกรณีนี้ก็เป็นสาเหตุโดยตรงเช่นกัน อย่างไรก็ตามสัมประสิทธิ์สหสัมพันธ์เชิงเส้นนั้นไม่มีนัยสำคัญกล่าวคือไม่มีความสัมพันธ์เชิงเส้นแม้จะมีความสัมพันธ์เชิงเส้นที่ไม่เชิงเส้นอย่างชัดเจนและแม้แต่เวรกรรม:
>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)
rho =
0.0140
pval =
0.8904
UPDATE: @Kodiologist ถูกต้องในความคิดเห็น มันสามารถแสดงทางคณิตศาสตร์ว่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นสำหรับตัวแปรทั้งสองนี้เป็นศูนย์แน่นอน ในตัวอย่างของฉันคือตัวแปรปกติมาตรฐานดังนั้นเราจึงมีสิ่งต่อไปนี้: ดังนั้น ความแปรปรวนร่วม (และต่อมาสหสัมพันธ์) เป็นศูนย์:
เราจะได้รับผลเดียวกันสำหรับการกระจายสมมาตรใด ๆ เช่นชุด[-1,1]
ไม่ โดยเฉพาะอย่างยิ่งตัวแปรสุ่มสามารถขึ้นอยู่กับ แต่ไม่เกี่ยวข้องกัน
นี่คือตัวอย่าง สมมติว่าฉันมีเครื่องที่รับอินพุตเดี่ยวและสร้างตัวเลขสุ่มซึ่งเท่ากับหรือด้วยความน่าจะเป็นที่เท่ากัน เห็นได้ชัดว่าเป็นสาเหตุYตอนนี้ให้เป็นตัวแปรสุ่มกระจายอย่างสม่ำเสมอบนและเลือกกับ , การกระตุ้นให้เกิดการกระจายร่วมกันY) และขึ้นอยู่กับตั้งแต่
อย่างไรก็ตามความสัมพันธ์ของและคือ 0 เพราะY
บางทีการมองจากมุมมองการคำนวณอาจช่วยได้
เป็นตัวอย่างที่เป็นรูปธรรมนำตัวสร้างตัวเลขเทียมเทียม
มีความสัมพันธ์เชิงสาเหตุระหว่างเมล็ดที่คุณตั้งค่าและเอาท์พุทจากเครื่องกำเนิดหรือไม่?
มีความสัมพันธ์ที่วัดได้หรือไม่?
คำตอบที่ดีกว่าสำหรับคำถามคือความสัมพันธ์คือความสัมพันธ์ทางสถิติคณิตศาสตร์และ / หรือทางกายภาพในขณะที่ความสัมพันธ์เชิงสาเหตุเป็นความสัมพันธ์เชิงอภิปรัชญา คุณไม่สามารถรับจากความสัมพันธ์ (หรือไม่ใช่ความสัมพันธ์) อย่างเป็นเหตุเป็นผลได้โดยไม่มีชุดสมมติฐาน (ขนาดใหญ่) ที่เชื่อมโยงอภิปรัชญากับฟิสิกส์ (ตัวอย่างหนึ่งคือสิ่งที่คนสองคนอาจตกลงกันว่าเป็น "ผู้สังเกตการณ์ที่มีเหตุผล" คือระดับใหญ่โดยพลการและอาจคลุมเครือ) ถ้า A จ่าย B เพื่อทำ C ซึ่งผลลัพธ์เป็น D สาเหตุของ D คืออะไร ไม่มีเหตุผลที่สมเหตุสมผลในการเลือก C หรือ B หรือ A (หรือกิจกรรมใด ๆ ของ A) ทฤษฎีการควบคุมเกี่ยวข้องกับระบบในอาณาจักรที่พวกเขาอยู่ภายใต้การควบคุม วิธีหนึ่งในการรับตัวแปรตามภายใต้การควบคุมคือการลดการตอบสนองของตัวแปรนั้นให้อยู่ในช่วงที่เป็นไปได้ของการเปลี่ยนแปลง (ควบคุม) ของตัวแปรอิสระต่อเสียงรบกวนทางสถิติ ตัวอย่างเช่นเรารู้ว่าความดันอากาศมีความสัมพันธ์กับสุขภาพ (เพียงลองหายใจสุญญากาศ) แต่ถ้าเราควบคุมความดันอากาศเป็น 1 +/- 0.001 atm ความแปรปรวนของความดันอากาศจะมีผลต่อสุขภาพอย่างไร
ใช่ตรงกันข้ามกับคำตอบก่อนหน้า ฉันจะใช้คำถามเป็นเทคนิคโดยเฉพาะความหมายของ "ความสัมพันธ์" บางทีฉันอาจใช้มันกว้างเกินไป แต่เห็นกระสุนนัดที่สองของฉัน ฉันหวังว่ามันจะได้รับการพิจารณาที่เหมาะสมเพื่อหารือเกี่ยวกับคำตอบอื่น ๆ ที่นี่เพราะพวกเขาส่องสว่างส่วนต่าง ๆ ของคำถาม ฉันวาดตามวิธีการของ Pearl เพื่อหาสาเหตุและโดยเฉพาะอย่างยิ่งสิ่งที่ฉันทำในบทความบางเรื่องกับ Kevin Korb วู้ดเวิร์ดอาจมีบัญชีที่ไม่ใช่เทคนิคที่ชัดเจนที่สุด
@conjugateprior พูดว่า "ระบบควบคุมใด ๆ ที่เป็นตัวอย่าง" ใช่สำหรับข้ออ้างที่แข็งแกร่งกว่าว่าการไม่มีสหสัมพันธ์ในการทดสอบของคุณนั้นไม่ได้เป็นสาเหตุ ฉันจะสมมติว่าคำถามทั่วไปมากกว่า แน่นอนว่าการทดลองหนึ่งอาจล้มเหลวในการควบคุมสาเหตุกำบังหรือควบคุมอย่างไม่เหมาะสมสำหรับผลกระทบทั่วไปและซ่อนความสัมพันธ์ แต่ถ้าเป็นสาเหตุที่ทำให้นี้มีจะมีการทดสอบการควบคุมที่มีความสัมพันธ์ที่ถูกเปิดเผย คำจำกัดความหรือเรื่องราวเกี่ยวกับสาเหตุเกือบทั้งหมดถือว่าเป็นความแตกต่างที่สร้างความแตกต่าง ดังนั้นจึงไม่มีความสัมพันธ์ใด ๆ หากมีการเชื่อมโยงโดยตรงในเครือข่ายแบบเบย์สาเหตุมันไม่ได้หมายความว่าy x → yมักจะทำให้ความแตกต่างกับเท่านั้นที่มีบางการทดลองการแก้ไขสาเหตุอื่น ๆ ทั้งหมดของที่ wiggling Wiggles Y
@aksakal มีตัวอย่างที่ดีว่าเหตุใดการทำให้เกิดเชิงเส้นไม่เพียงพอ เห็นด้วย แต่ฉันต้องการที่จะกว้างและไม่ใช่ทางเทคนิค หากก็ไม่สมบูรณ์ที่จะบอกลูกค้าว่าเป็น uncorrelated กับxดังนั้นผมจะใช้ความสัมพันธ์ในวงกว้างมากจะหมายถึงความแตกต่างในที่เกี่ยวข้องได้อย่างน่าเชื่อถือมีความแตกต่างในปีมันสามารถเป็นแบบไม่เชิงเส้นหรือไม่เป็นพารามิเตอร์ตามที่คุณต้องการ เอฟเฟกต์ของเกณฑ์ใช้ได้ดี (สร้างความแตกต่างให้กับแต่เฉพาะในช่วงที่ จำกัด หรือโดยการมีขนาดใหญ่หรือเล็กกว่าค่าเฉพาะเช่นแรงดันในวงจรดิจิตอล)
@Kodiologist สร้างตัวอย่างโดยที่ดังนั้นแต่ไม่มีความสัมพันธ์เชิงเส้น แต่เห็นได้ชัดว่ามีความสัมพันธ์ที่ค้นพบได้ดังนั้นจึงมีความสัมพันธ์กันในวงกว้าง| y | = | x |
@Szabolcs ใช้ตัวสร้างตัวเลขสุ่มเพื่อแสดงเอาต์พุตสตรีมที่สร้างขึ้นเพื่อให้ไม่มีความเกี่ยวข้อง เช่นเดียวกับตัวเลขของสตรีมจะปรากฏแบบสุ่ม แต่ไม่แน่นอน ฉันยอมรับว่าคุณไม่น่าจะพบความสัมพันธ์หากให้ข้อมูลเท่านั้น แต่มีอยู่
@Li Zhi ตั้งข้อสังเกตว่าคุณไม่สามารถข้ามเหตุผลจากความสัมพันธ์ไปยังสาเหตุ ใช่ไม่มีสาเหตุไม่มีสาเหตุ แต่คำถามเริ่มต้นจากสาเหตุ: มันหมายถึงความสัมพันธ์? ในตัวอย่างความดันอากาศเรามีผลกระทบเกณฑ์ มีช่วงที่ความดันอากาศไม่เกี่ยวข้องกับสุขภาพ แน่นอนว่ามันไม่มีผลกระทบต่อสุขภาพ แต่มีช่วงที่มันจะเป็น นั่นก็เพียงพอแล้ว แต่น่าจะดีกว่าที่จะทราบช่วงที่มีและไม่มีผลกระทบ ถ้าแล้วก็มีความสัมพันธ์กันตลอดห่วงโซ่เพราะมีสาเหตุ การสังเกตซ้ำ (หรือการทดลอง) สามารถแสดงว่าไม่ได้ทำให้เกิดโดยตรงA D แต่ความสัมพันธ์มีเพราะมีเรื่องราวสาเหตุ
ฉันไม่ทราบว่าสิ่งที่ @ user2088176 มีอยู่ในใจ แต่ฉันคิดว่าถ้าเราใช้คำถามโดยทั่วไปแล้วคำตอบคือใช่ อย่างน้อยฉันก็คิดว่านั่นเป็นคำตอบที่จำเป็นสำหรับวรรณกรรมการค้นพบสาเหตุและบัญชีการแทรกแซงของสาเหตุ สาเหตุคือความแตกต่างที่สร้างความแตกต่าง และความแตกต่างนั้นจะถูกเปิดเผยในการทดลองบางอย่างว่าเป็นความสัมพันธ์แบบถาวร