ทำไม "อธิบายออกไป" ทำให้เข้าใจง่าย?


36

ฉันเพิ่งเรียนรู้เกี่ยวกับหลักการของการให้เหตุผลความน่าจะเป็นที่เรียกว่า " อธิบายออกไป " และฉันพยายามที่จะเข้าใจสัญชาตญาณ

ให้ฉันตั้งค่าสถานการณ์ ให้เป็นเหตุการณ์ที่เกิดแผ่นดินไหว ให้เหตุการณ์ เป็นเหตุการณ์ที่ยักษ์เขียวขจีกำลังเดินเล่นรอบเมือง ให้เป็นเหตุการณ์ที่พื้นสั่นสะเทือน ให้B ที่คุณเห็นอย่างใดอย่างหนึ่งหรือสามารถทำให้เกิดซีABCABABC

ฉันใช้การอธิบายแบบ "อธิบายทันที" หากเกิดขึ้นหนึ่งในหรือเพิ่มขึ้น แต่อีกเหตุผลหนึ่งลดลงเนื่องจากฉันไม่ต้องการเหตุผลทางเลือกเพื่ออธิบายว่าทำไมเกิดขึ้น อย่างไรก็ตามปรีชาปัจจุบันของฉันบอกฉันว่าทั้งและควรเพิ่มขึ้นถ้าเกิดขึ้นเนื่องจากเกิดขึ้นทำให้มีโอกาสมากขึ้นที่สาเหตุของเกิดขึ้นCP(A)P(B)CP(A)P(B)CCC

ฉันจะปรับความเข้าใจปรีชาปัจจุบันของฉันด้วยแนวคิดที่จะอธิบายได้อย่างไร ฉันจะใช้การอธิบายเพื่อพิสูจน์ว่าและขึ้นอยู่กับเงื่อนไขอย่างไรABC


4
อะไรหมายถึง? AB
mark999

2
หมายความว่าเป็นอิสระจากขออภัย BAB
David Faux

1
ฉันจะเลือกสถานการณ์ที่อาจทำให้คุณสับสนน้อยลง "พื้นดินสั่นสะเทือน" อาจเป็นสาเหตุหรือผลกระทบของ "แผ่นดินไหว" และทั้งคู่อาจเกิดจาก "การเดินเล่นยักษ์สีเขียว" สำหรับการอธิบายให้เกิดขึ้นทั้ง A และ B ต้องเป็นสาเหตุของ C.
Neil G

@DavidFaux คุณไม่จำเป็นต้องขอโทษ นั่นคือสัญกรณ์ทางคณิตศาสตร์มาตรฐานสำหรับการระบุความเป็นอิสระของตัวแปร Btw, รุ่งโรจน์กับคำถามที่ดีและ +1 เพราะลิงก์ที่คุณให้นั้นดีจริงๆ! ฉันสับสนเกี่ยวกับแนวคิดเหล่านั้นทั้งหมดและบทความที่คุณให้ไว้นั้นดีจริงๆ ขอบคุณ! :)
Charlie Parker

คำตอบ:


39

ชี้แจงและสัญกรณ์

ถ้า C เกิดขึ้นหนึ่งใน P (A) หรือ P (B) เพิ่มขึ้น แต่อีกอันหนึ่งลดลง

สิ่งนี้ไม่ถูกต้อง คุณมี (โดยปริยายและสมเหตุสมผล) สันนิษฐานว่า A คือ (เล็กน้อย) เป็นอิสระจาก B และ A และ B เป็นสาเหตุของ C เท่านั้นนี่ก็หมายความว่า A และ B ขึ้นอยู่กับเงื่อนไข Cจริง ๆผลกระทบร่วมของพวกเขา ข้อเท็จจริงเหล่านี้มีความสอดคล้องกันเนื่องจากการอธิบายเป็นเรื่องเกี่ยวกับ P (A | C) ซึ่งไม่เหมือนกับการกระจาย P (A) สัญกรณ์บาร์ปรับอากาศเป็นสิ่งสำคัญที่นี่

อย่างไรก็ตามปรีชาปัจจุบันของฉันบอกฉันว่าทั้ง P (A) และ P (B) ควรเพิ่มขึ้นถ้า C เกิดขึ้นเนื่องจาก C เกิดขึ้นทำให้มีโอกาสมากขึ้นที่สาเหตุของ C เกิดขึ้น

คุณมี 'การอนุมานจากการรื้อถอนแบบกึ่งควบคุม' (ดูรายละเอียดด้านล่าง) เพื่อเริ่มต้นกับคุณแล้วเชื่อว่าซีแสดงให้เห็นว่าไม่ว่าจะเป็นหรือ B ที่เกิดขึ้นเพื่อให้คุณไม่สามารถรับได้บางอย่างมากขึ้นว่า A หรือ B ที่เกิดขึ้นเมื่อคุณเห็นซี แต่วิธีการเกี่ยวกับและ B ได้รับ C? เป็นไปได้ แต่มีโอกาสน้อยกว่า A และไม่ใช่ B หรือ B และไม่ใช่ A นั่นคือ 'การอธิบายออกไป' และสิ่งที่คุณต้องการสัญชาตญาณ

ปรีชา

ลองย้ายไปเป็นโมเดลต่อเนื่องเพื่อให้เราสามารถมองเห็นสิ่งต่าง ๆ ได้ง่ายขึ้นและคิดเกี่ยวกับสหสัมพันธ์ว่าเป็นรูปแบบเฉพาะของความไม่อิสระ สมมติว่าคะแนนการอ่าน (A) และคะแนนคณิตศาสตร์ (B) มีการกระจายอย่างอิสระในประชากรทั่วไป ทีนี้สมมติว่าโรงเรียนจะรับนักเรียนที่มีคะแนนการอ่านและคณิตศาสตร์รวมกันมากกว่าเกณฑ์ที่กำหนด (ไม่สำคัญว่าเกณฑ์นั้นจะนานแค่ไหนก็เลือกได้ไม่น้อย)

นี่คือตัวอย่างที่เป็นรูปธรรม: สมมติว่าหน่วยอิสระมักกระจายคะแนนการอ่านและคณิตศาสตร์และตัวอย่างนักเรียนโดยสรุปด้านล่าง เมื่อคะแนนการอ่านและคณิตศาสตร์ของนักเรียนอยู่ด้วยกันเกินเกณฑ์การรับเข้าเรียน (ที่นี่ 1.5) นักเรียนจะแสดงเป็นจุดสีแดง

อธิบายได้ว่าเป็นความสัมพันธ์แบบ collider

เนื่องจากคะแนนคณิตศาสตร์ที่ดีชดเชยคะแนนการอ่านที่ไม่ดีและในทางกลับกันประชากรของนักเรียนที่รับเข้าเรียนจะเป็นเช่นนั้นการอ่านและคณิตศาสตร์ในขณะนี้ขึ้นอยู่กับและมีความสัมพันธ์เชิงลบ (-0.65 ที่นี่) สิ่งนี้ก็เป็นจริงเช่นกันในประชากรที่ไม่ได้รับการยอมรับ (-0.19 ที่นี่)

ดังนั้นเมื่อคุณเจอนักเรียนที่เลือกแบบสุ่มและคุณได้ยินเกี่ยวกับคะแนนคณิตศาสตร์สูงของเธอคุณควรคาดหวังให้เธอได้คะแนนการอ่านต่ำกว่า - คะแนนคณิตศาสตร์ 'อธิบาย' การรับเข้าเรียนของเธอ แน่นอนว่าเธออาจมีคะแนนการอ่านสูง - เรื่องนี้เกิดขึ้นจริงในพล็อต - แต่ก็มีโอกาสน้อยกว่า และสิ่งนี้ไม่มีผลต่อการสันนิษฐานก่อนหน้านี้ของเราที่ว่าไม่มีสหสัมพันธ์ลบหรือบวกระหว่างคณิตศาสตร์และคะแนนการอ่านในประชากรทั่วไป

ตรวจสอบสัญชาติญาณ

การย้ายกลับไปเป็นตัวอย่างที่ไม่ต่อเนื่องใกล้เคียงกับต้นฉบับของคุณ พิจารณาการ์ตูนที่ดีที่สุด (และบางทีเท่านั้น) เกี่ยวกับ 'การอธิบาย'

การรื้อถอนกึ่งควบคุม

แผนการของรัฐบาลคือ A แผนการของผู้ก่อการร้ายคือ B และปฏิบัติต่อการทำลายโดยทั่วไปเช่น C โดยไม่สนใจข้อเท็จจริงที่ว่ามีหอคอยสองแห่ง หากเห็นได้ชัดว่าทำไมผู้ฟังถึงมีเหตุผลพอสมควรเมื่อพวกเขาสงสัยในทฤษฎีของผู้พูดคุณจะเข้าใจ 'การอธิบาย'


3
ฉันคิดว่าตัวอย่างที่โชคร้ายที่สุดในขณะที่คณิตศาสตร์และความสามารถในการอ่านระบุว่าถูกสันนิษฐานว่าเป็นอิสระนี่อาจจะไม่ใช่กรณีจริงซึ่งนำไปสู่ความสับสนด้วยความเคารพต่อการใช้คำว่า "ความจริง" ในภายหลัง
Robert Jones

ฉันคิดว่าตัวอย่างที่ดีกว่าน่าจะเป็นกรณีของบุคคลที่สามารถกินอะไรสักอย่างซึ่งอาจเป็นมันฝรั่งหรือไส้กรอก หากบุคคลนั้นไม่ได้รับน้ำหนักระหว่างการทดลองความน่าจะเป็นที่ได้บริโภคมันฝรั่งหรือไส้กรอกจะน้อยกว่าถ้าบุคคลนั้นมีน้ำหนัก
Robert Jones

เห็นได้ชัดว่าบุคคลนั้นอาจกินสิ่งอื่นแทนและสร้างความสับสนให้กับประเด็นต่อไปอาจจะเป็นการเข้าห้องน้ำดังนั้นจึงชัดเจนว่ามีความจำเป็นต้องเตรียมพร้อมที่จะมองหาคำอธิบายที่อื่น
Robert Jones

@RobertJones ตัวอย่างที่ฉันได้รับในชั้นเรียนคือ "ฉลาด" และ "สปอร์ต" เป็นเกณฑ์การรับสมัคร
gwg

1
เมื่อฉันเข้าใจแล้วสมรรถภาพทางกายและจิตใจโดยทั่วไปถือว่ามีความสัมพันธ์
Robert Jones

26

ฉันคิดว่าสัญชาตญาณของคุณโอเค แต่ความเข้าใจของคุณเกี่ยวกับการใช้เหตุผล "อธิบายออกไป" นั้นผิด

ในบทความที่คุณเชื่อมโยงกับ

"การอธิบายออกไป" เป็นรูปแบบทั่วไปของการให้เหตุผลซึ่งการ ยืนยันสาเหตุหนึ่งของเหตุการณ์ที่สังเกตหรือเชื่อว่าลดความจำเป็นในการเรียกสาเหตุทางเลือก

(เน้นเพิ่ม)

สิ่งนี้ค่อนข้างแตกต่างจากของคุณ:

ฉันใช้การอธิบายแบบ "อธิบายทันที" หากเกิดขึ้นหนึ่งในหรือ เพิ่มขึ้น แต่อีกเหตุผลหนึ่งลดลงเนื่องจากฉันไม่ต้องการเหตุผลทางเลือกเพื่ออธิบายว่าทำไมเกิดขึ้นCP(A)P(B)C

คุณไม่เพียงแค่ต้องการให้เกิดขึ้น แต่ยังต้องมีการอธิบายออกไปโดยการยืนยันหรือก่อนที่คุณจะลดความน่าจะเป็นของคำอธิบายที่เป็นไปได้อื่น ๆCAB

คิดอีกวิธีหนึ่ง พื้นดินสั่นสะเทือน คุณสังเกตว่ายักษ์กำลังเดินไปรอบ ๆ นี่เป็นการอธิบายว่าออกไปดังนั้นดูเหมือนว่าไม่น่าเป็นไปได้ที่จะเกิดแผ่นดินไหวในตอนนี้ แต่การสังเกตยักษ์นั้นเป็นสิ่งสำคัญ - จนกว่าคุณจะได้รับสิ่งนี้ในฐานะที่เป็นคำอธิบายที่น่าจะเป็นของแผ่นดินไหว เมื่อทั้งหมดที่คุณมีคืออันที่จริงแล้วทั้งและคือ>และตามลำดับตามคำตอบของ @ Glen_bBCCP(A|C)P(B|C)P(A)P(B)


+1 สำหรับคำตอบอื่น ๆ สองสามข้อ แต่ฉันคิดว่าไม่ได้ให้ความสำคัญกับสิ่งที่ฉันคิดว่าเป็นความผิดพลาดของ OP ในการ "อธิบายออกไป"
Peter Ellis

+1: กระชับและตรงประเด็น คุณอาจต้องการชี้ให้เห็นว่า OP อาจหายไปว่า A และ B ต้องเป็นสาเหตุของ C
Neil G

5

ในกรณีที่ไม่มีข้อมูลเพิ่มเติมเฉพาะที่เปลี่ยนแปลงความน่าจะเงื่อนไขของหรือกฎ Bayes จะบอกคุณAB

P(A|C)=P(C|A)P(A)P(C)และในทำนองเดียวกันสำหรับP(B|C)

หากและทั้งคู่มีขนาดใหญ่กว่า 1 (ซึ่งคุณคาดหวังถ้าคำอธิบาย ' 'มันเป็นสิ่งที่มีค่าเฉลี่ย) จากนั้นทั้งสองและจะมีมากขึ้นน่าจะเป็นเงื่อนไขเพิ่มเติมกว่าที่พวกเขาก่อนที่จะเป็นที่สังเกตP(C|A)P(C)P(C|B)P(C) ABC

มันจะเป็นที่สนใจเพื่อดูว่าจะกลายเป็นหนึ่งค่อนข้างมีโอกาสมากขึ้นหลังจากการเฝ้าสังเกตเมื่อเทียบกับก่อนC

P(A|C)P(B|C)=P(C|A)P(A)P(C|B)P(B)

นั่นคือความน่าจะเป็นสัมพัทธ์ของทั้งสองหลังจากการสังเกตคือความน่าจะเป็นสัมพัทธ์ก่อน ( ) คูณอัตราส่วนของความน่าจะเป็นเงื่อนไขของการสังเกตได้รับ 'คำอธิบาย' ทั้งสองCP(A)/P(B)C


2

คุณกำลังขอสัญชาติญาณ มันหมายความว่าอะไรและเป็นอิสระ? หมายความว่าถ้าฉันบอกคุณว่าฉันเพิ่งเห็นสัตว์ประหลาดความคิดเห็นของคุณเกี่ยวกับเหตุการณ์ที่เกิดขึ้นหรือไม่ของแผ่นดินไหวจะไม่เปลี่ยนแปลง และตรงกันข้าม หากคุณคิดว่าทั้งและสูงและฉันบอกคุณว่าพื้นดินสั่นสะเทือนและไม่มีสัตว์ประหลาดในเมืองนั่นจะไม่เปลี่ยนความคิดเห็นของคุณเกี่ยวกับ การเกิดแผ่นดินไหวทำให้เป็นไปได้มากขึ้น?B P ( C A ) P ( C B )ABP(CA)P(CB)


2

จากนามธรรมที่เชื่อมโยงปรากฏว่า "การอธิบายออกไป" กำลังพูดถึงกลไกการเรียนรู้ซึ่งเป็นวิธีการทั่วไปที่มนุษย์ให้เหตุผลไม่ใช่วิธีตรรกะหรือความน่าจะเป็นทางการ มันเป็นวิธีการให้เหตุผลแบบมนุษย์ที่ไม่ถูกต้องอย่างเป็นทางการเช่นเดียวกับการให้เหตุผลเชิงอุปนัยไม่ถูกต้องอย่างเป็นทางการ (เมื่อเทียบกับการใช้เหตุผลแบบนิรนัย) ดังนั้นฉันคิดว่าตรรกะอย่างเป็นทางการและความน่าจะเป็นคำตอบนั้นดีมาก แต่ไม่สามารถใช้ได้ (โปรดทราบว่าบทคัดย่ออยู่ในบริบทของ Machine Intelligence)

ตัวอย่างยักษ์ใหญ่ของคุณดีมากสำหรับเรื่องนี้ เราเชื่อว่าแผ่นดินไหวหรือยักษ์ใหญ่สามารถทำให้พื้นสั่นสะเทือนได้ แต่เราก็เชื่อว่ายักษ์ไม่มีตัวตน - หรือไม่น่าจะมีอยู่จริง พื้นดินสั่นไหว เราจะไม่ตรวจสอบว่ามียักษ์กำลังเดินไปมาหรือไม่ แต่เราจะสอบถามว่าเกิดแผ่นดินไหวหรือไม่ เมื่อได้ยินว่ามีแผ่นดินไหวเกิดขึ้นจริงเราเชื่อมั่นมากยิ่งขึ้นว่าแผ่นดินไหวเป็นคำอธิบายที่เพียงพอสำหรับการสั่นไหวและยักษ์ใหญ่นั้นยิ่งมั่นใจว่าไม่มีอยู่จริง

เราจะยอมรับว่ายักษ์ทำให้พื้นสั่นเมื่อ: 1) เราได้เห็นยักษ์และเต็มใจที่จะเชื่อว่าเราไม่ได้ถูกหลอกและการสันนิษฐานก่อนหน้าของเราว่ายักษ์ไม่น่าเป็นไปได้สูงหรือเป็นไปไม่ได้หรือ 2) เราสามารถกำจัดความเป็นไปได้ของแผ่นดินไหวโดยสิ้นเชิงและยังกำจัดความเป็นไปได้ทั้งหมด D, E, F, G, ... ที่เราไม่เคยคิดมาก่อน แต่ตอนนี้ดูเหมือนว่าจะมีขนาดใหญ่กว่ายักษ์

ในกรณียักษ์มันสมเหตุสมผล กลไกการเรียนรู้นี้ (คำอธิบายที่เราพบว่ามีแนวโน้มมากขึ้นและทำให้คำอธิบายอื่น ๆ มีความเป็นไปได้น้อยลงในแต่ละครั้งที่คำอธิบายนั้นใช้ได้) โดยทั่วไปมีเหตุผล แต่จะเผาเราเช่นกัน ตัวอย่างเช่นความคิดที่ว่าโลกโคจรรอบดวงอาทิตย์หรือแผลที่เกิดจากแบคทีเรียนั้นมีช่วงเวลาที่ยากลำบากในการดึงเพราะ "อธิบายออกไป" ซึ่งในกรณีนี้เราเรียกว่าอคติยืนยัน

ความจริงที่ว่านามธรรมอยู่ในการตั้งค่าของหน่วยสืบราชการลับของเครื่องก็ทำให้ฉันสิ่งนี้กำลังพูดถึงกลไกการเรียนรู้ที่มนุษย์ใช้กันทั่วไป (และสัตว์อื่น ๆ ฉันจินตนาการ) ที่อาจเป็นประโยชน์ต่อระบบการเรียนรู้แม้ว่ามันจะมีข้อบกพร่องสูง ชุมชน AI พยายามใช้ระบบที่เป็นทางการเป็นเวลาหลายปีโดยไม่ได้ใกล้ชิดกับความฉลาดของมนุษย์และฉันเชื่อว่าลัทธิปฏิบัตินิยมได้รับชัยชนะเหนือพิธีการและ "อธิบายออกไป" เป็นสิ่งที่เราทำและทำให้ AI ต้องการทำเช่นนั้น


1

C (0<P(C)<1)CABABไม่สามารถเป็นอิสระ ในตัวอย่างของคุณคุณเลือกตัวแปรที่คุณเข้าใจอย่างถ่องแท้ว่าต้องพึ่งพาไม่ใช่เรื่องที่เป็นอิสระ นั่นคือเหตุการณ์ที่เกิดแผ่นดินไหวและยักษ์ที่เหยียบย่ำไม่เป็นอิสระเพราะทั้งคู่มีแนวโน้มที่จะเกิดขึ้นเมื่อพื้นสั่นสะเทือน นี่คืออีกตัวอย่าง: ให้ C เป็นเหตุการณ์ที่ฝนตกและ A เป็นเหตุการณ์ที่คุณใช้ร่มและ B เป็นเหตุการณ์ที่คุณสวมใส่ rainboots เห็นได้ชัดว่า A และ B ไม่เป็นอิสระเพราะเมื่อ C เกิดขึ้นคุณมีแนวโน้มที่จะสวมใส่ Galoshes และพกพาและร่ม แต่ถ้าคุณอาศัยอยู่ในพื้นที่ที่ไม่เคยมีฝนตกเลย A และ B อาจไม่ขึ้นกับใคร - ไม่ใช้ร่มหรือกาแล็คซี่เป็นอุปกรณ์กันฝนดังนั้นบางทีคุณอาจสวมกาลิชในสวนและใช้ร่มเพื่อจับ ปลา.

ABC

  1. P(AB)=P(A)P(B)=P(A|C)P(B|C)P(C)2AB
  2. P(AB)=P(AB|C)P(C)=P(A|C)P(B|C)P(C)ABC

P(C)=P(C)2P(C)=0P(C)=1


ผมคิดว่า OP จะสงสัยว่าจะเข้าใจ A และ B เป็นอิสระเล็กน้อย แต่มีเงื่อนไขขึ้นอยู่กับ C, ไม่ได้เป็นวิธีที่จะเข้าใจ A และ B เป็นเล็กน้อยขึ้นอยู่กับเงื่อนไข แต่เป็นอิสระเกี่ยวกับซี
conjugateprior
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.