เนื่องจากฉันพบว่าพวกมันน่าหลงใหลฉันอยากจะได้ยินว่าคนในชุมชนนี้ค้นพบว่าอะไรคือความขัดแย้งทางสถิติที่น่าสนใจที่สุดและเพราะอะไร
เนื่องจากฉันพบว่าพวกมันน่าหลงใหลฉันอยากจะได้ยินว่าคนในชุมชนนี้ค้นพบว่าอะไรคือความขัดแย้งทางสถิติที่น่าสนใจที่สุดและเพราะอะไร
คำตอบ:
มันไม่ได้เป็นความขัดแย้งต่อ seแต่มันก็เป็นความคิดเห็นงงอย่างน้อยในตอนแรก
ในช่วงสงครามโลกครั้งที่สองอับราฮัมวัลด์เป็นนักสถิติสำหรับรัฐบาลสหรัฐฯ เขามองไปที่เครื่องบินทิ้งระเบิดที่กลับมาจากภารกิจและวิเคราะห์รูปแบบของ "บาดแผล" กระสุนปืนบนเครื่องบิน เขาแนะนำว่ากองทัพเรือเสริมพื้นที่ที่เครื่องบินไม่มีความเสียหาย
ทำไม? เรามีเอฟเฟกต์การเลือกในที่ทำงาน ตัวอย่างนี้แสดงให้เห็นว่าความเสียหายที่เกิดขึ้นในพื้นที่ที่สังเกตสามารถทนได้ เครื่องบินทั้งสองไม่เคยถูกโจมตีในพื้นที่ที่ไม่มีการแตะต้องข้อเสนอที่ไม่น่าจะเกิดขึ้น เราสนใจเกี่ยวกับเครื่องบินที่ลงไปไม่ใช่แค่พวกที่กลับมา ผู้ที่ตกสู่บาปจะได้รับการโจมตีในสถานที่ซึ่งมิได้ถูกแตะต้องผู้ที่รอดชีวิต
สำหรับสำเนาของบันทึกเดิมของเขาให้ดูที่นี่ สำหรับการใช้งานที่ทันสมัยมากขึ้นเห็นนี้โพสต์บล็อกวิทยาศาสตร์อเมริกัน
ขยายเมื่อรูปแบบตามที่โพสต์บล็อกนี้ในระหว่างสงครามโลกครั้งที่แนะนำของหมวกกันน็อกดีบุกนำไปสู่การมากขึ้นบาดแผลที่ศีรษะกว่าหมวกผ้ามาตรฐาน หมวกกันน็อกใหม่นี้แย่กว่าสำหรับทหารหรือไม่? ไม่มี แม้ว่าการบาดเจ็บจะสูงขึ้น แต่การเสียชีวิตก็ลดลง
อีกตัวอย่างหนึ่งคือการเข้าใจผิดในระบบนิเวศ
ตัวอย่าง
สมมติว่าเรามองหาความสัมพันธ์ระหว่างการลงคะแนนและรายได้โดยการลดส่วนแบ่งการลงคะแนนให้กับวุฒิสมาชิกโอบามาในรายได้เฉลี่ยของรัฐ (เป็นพัน) เราได้ค่าตัดประมาณ 20 และค่าสัมประสิทธิ์ความชันเท่ากับ 0.61
หลายคนจะตีความผลลัพธ์นี้ว่าผู้คนที่มีรายได้สูงมีแนวโน้มที่จะลงคะแนนให้พรรคเดโมแครตมากกว่า แท้จริงแล้วหนังสือกดที่เป็นที่นิยมได้ทำให้การโต้แย้งนี้
แต่เดี๋ยวก่อนฉันคิดว่าคนรวยมีแนวโน้มที่จะเป็นรีพับลิกันมากกว่า? พวกเขาคือ.
สิ่งที่ถดถอยนี้เป็นจริงที่บอกเราเป็นที่อุดมไปด้วยรัฐมีแนวโน้มที่จะลงคะแนนให้พรรคประชาธิปัตย์และคนจนรัฐมีแนวโน้มที่จะลงคะแนนเสียงให้พรรครีพับลิ ภายในรัฐที่กำหนดคนรวยมีแนวโน้มที่จะลงคะแนนให้พรรครีพับลิกันและคนจนมีแนวโน้มที่จะลงคะแนนให้พรรคประชาธิปัตย์มากขึ้น ดูการทำงานของแอนดรูว์เกลแมนและ coauthors
หากไม่มีข้อสมมติฐานเพิ่มเติมเราไม่สามารถใช้ข้อมูลระดับกลุ่ม (รวม) เพื่อทำการอนุมานเกี่ยวกับพฤติกรรมระดับบุคคล นี่คือการเข้าใจผิดทางนิเวศวิทยา ข้อมูลระดับกลุ่มสามารถบอกเราเกี่ยวกับพฤติกรรมระดับกลุ่มเท่านั้น
ในการก้าวกระโดดไปสู่การอนุมานระดับบุคคลเราจำเป็นต้องมีข้อสมมติฐานที่แน่นอน ที่นี่ตัวเลือกการลงคะแนนเสียงของบุคคลส่วนใหญ่ไม่แตกต่างกันอย่างเป็นระบบกับรายได้เฉลี่ยของรัฐ คนที่มีรายรับ $ X ในรัฐที่ร่ำรวยต้องมีแนวโน้มที่จะลงคะแนนให้กับพรรคประชาธิปัตย์เช่นเดียวกับคนที่รับรายได้$ X ในรัฐที่ยากจน แต่คนในคอนเนตทิในทุกระดับรายได้มีแนวโน้มที่จะลงคะแนนให้พรรคประชาธิปัตย์กว่าคนในมิสซิสซิปปี้ที่บรรดาระดับรายเดียวกัน ดังนั้นการสันนิษฐานความสอดคล้องถูกละเมิดและเราจะนำไปสู่ข้อสรุปที่ผิด (หลงกลโดยการรวมอคติ )
หัวข้อนี้เป็นงานอดิเรกบ่อยครั้งของDavid Freedmanตอนปลาย; ดูกระดาษนี้ตัวอย่างเช่น ในบทความนั้นฟรีแมนได้จัดให้มีวิธีสำหรับการจำกัดความน่าจะเป็นระดับบุคคลโดยใช้ข้อมูลกลุ่ม
การเปรียบเทียบกับบุคคลที่ผิดธรรมดาของ Simpson ที่
อื่นใน CW นี้ @Michelle เสนอให้บุคคลที่ผิดธรรมดาของ Simpson เป็นตัวอย่างที่ดีอย่างที่มันเป็น ความขัดแย้งของซิมป์สันและการเข้าใจผิดทางนิเวศวิทยานั้นมีความสัมพันธ์กันอย่างใกล้ชิด แต่ก็ชัดเจน ตัวอย่างทั้งสองแตกต่างกันในลักษณะของข้อมูลที่กำหนดและการวิเคราะห์ที่ใช้
สูตรมาตรฐานของความขัดแย้งของซิมป์สันคือตารางสองทาง ในตัวอย่างของเราที่นี่สมมติว่าเรามีข้อมูลส่วนบุคคลและเราจำแนกแต่ละบุคคลเป็นรายได้สูงหรือต่ำ เราจะได้รับตารางแสดงรายได้ 2x2 จากผลรวมทั้งหมด เราจะเห็นว่าส่วนแบ่งสูงของคนที่มีรายได้สูงโหวตให้กับพรรคประชาธิปัตย์เมื่อเทียบกับคนที่มีรายได้ต่ำ หากเราจะสร้างตารางฉุกเฉินสำหรับแต่ละรัฐอย่างไรก็ตามเราจะเห็นรูปแบบตรงกันข้าม
ในการเข้าใจผิดทางนิเวศวิทยาเราจะไม่ยุบรายได้ลงในตัวแปรแบบแบ่งขั้ว (หรือหลายขั้ว) เพื่อให้ได้ระดับรัฐเราจะได้รับรายได้เฉลี่ย (หรือค่ามัธยฐาน) ของรัฐและการลงคะแนนเสียงของรัฐและดำเนินการถดถอยและพบว่ารัฐที่มีรายได้สูงกว่ามีแนวโน้มที่จะลงคะแนนเสียงให้กับพรรคประชาธิปัตย์มากขึ้น หากเราเก็บข้อมูลระดับบุคคลและดำเนินการถดถอยแยกกันตามรัฐเราจะพบผลที่ตรงกันข้าม
โดยสรุปความแตกต่างคือ:
การสังเกตทั่วไป
@NeilG แสดงความคิดเห็นว่านี่เป็นเพียงการบอกว่าคุณไม่สามารถเลือกตัวแปรที่ไม่สามารถสังเกตเห็นได้ / ละเว้นตัวแปรที่ทำให้เกิดปัญหาในการถดถอยของคุณ ถูกตัอง! อย่างน้อยในบริบทของการถดถอยฉันคิดว่า "บุคคลที่ผิดธรรมดา" เกือบทั้งหมดเป็นเพียงกรณีพิเศษของการละเว้นตัวแปรอคติ
อคติการเลือก (ดูการตอบสนองอื่น ๆ ของฉันใน CW นี้) สามารถควบคุมได้โดยการรวมตัวแปรที่ขับเคลื่อนการเลือก แน่นอนว่าตัวแปรเหล่านี้มักจะไม่ได้รับการตรวจสอบเพื่อผลักดันปัญหา / ข้อขัดแย้ง การถดถอยที่แท้จริง (การตอบกลับอื่น ๆ ของฉัน) สามารถเอาชนะได้โดยการเพิ่มแนวโน้มเวลา กรณีเหล่านี้บอกว่าโดยพื้นฐานแล้วคุณมีข้อมูลเพียงพอ แต่ต้องการตัวทำนายเพิ่มเติม
ในกรณีของการเข้าใจผิดทางนิเวศวิทยามันเป็นเรื่องจริงคุณต้องมีผู้ทำนายมากขึ้น (ที่นี่ความลาดชันและจุดตัดเฉพาะของรัฐ) แต่คุณต้องมีการสังเกตการณ์มากกว่า - เป็นรายบุคคลมากกว่าระดับกลุ่มเพื่อสังเกตความสัมพันธ์เหล่านี้
(โดยบังเอิญถ้าคุณมีการเลือกมากที่ตัวแปรการเลือกแบ่งการรักษาและการควบคุมอย่างสมบูรณ์แบบในตัวอย่าง WWII ที่ฉันให้คุณอาจต้องการข้อมูลเพิ่มเติมเพื่อประเมินการถดถอยเช่นกันที่นั่นเครื่องบินตก)
การมีส่วนร่วมของฉันคือความขัดแย้งของ Simpsonเพราะ:
อาจเป็นเรื่องยากมากที่จะอธิบายว่าทำไมการค้นพบเป็นวิธีที่พวกเขาจะวางคนในภาษาอังกฤษธรรมดา
tl; dr เวอร์ชั่นของเส้นขนาน: นัยสำคัญทางสถิติของผลลัพธ์ปรากฏแตกต่างกันไปขึ้นอยู่กับวิธีการแบ่งพาร์ติชันข้อมูล สาเหตุมักปรากฏขึ้นเนื่องจากตัวแปรที่ทำให้สับสน
ไม่มีความขัดแย้งในสถิติมีเพียงปริศนาที่รอการแก้ไข
แต่ที่ชื่นชอบคือสองซองจดหมาย "ความขัดแย้ง" สมมติว่าฉันใส่ซองจดหมายสองซองไว้ข้างหน้าคุณและบอกคุณว่าซองหนึ่งมีเงินมากเป็นสองเท่าของซองอื่น (แต่ไม่ใช่ซองไหน) คุณให้เหตุผลดังนี้ สมมติว่าซองซ้ายมีแล้วมีโอกาส 50% ซองด้านขวามี2 xและด้วยความน่าจะเป็น 50% มันมี0.5 xสำหรับค่าที่คาดหวังของ1.25 x แต่แน่นอนคุณสามารถย้อนกลับซองจดหมายและสรุปได้ว่าซองจดหมายด้านซ้ายมีค่า1.25เท่าของซองจดหมายด้านขวา เกิดอะไรขึ้น?
นี่คือการประดิษฐ์ล่าสุด มันถูกอภิปรายอย่างหนักในวารสารปรัชญาชุดเล็กในช่วงทศวรรษที่ผ่านมา มีผู้สนับสนุนอย่างแข็งขันสำหรับคำตอบที่ต่างกันสองคำตอบ ("Halfers" และ "Thirders") มันก่อให้เกิดคำถามเกี่ยวกับธรรมชาติของความเชื่อความน่าจะเป็นและการปรับสภาพและทำให้ผู้คนต้องตีความควอนตัมเชิงกล "หลายโลก" (ในบรรดาสิ่งที่แปลกประหลาดอื่น ๆ )
นี่คือข้อความจาก Wikipedia:
อาสาสมัคร Sleeping Beauty จะได้รับการทดสอบต่อไปนี้และจะแจ้งรายละเอียดทั้งหมดต่อไปนี้ ในวันอาทิตย์เธอนอนหลับ จากนั้นเหรียญที่เป็นธรรมจะถูกโยนเพื่อกำหนดขั้นตอนการทดลองที่จะดำเนินการ หากเหรียญปรากฏขึ้นหัวความงามจะถูกปลุกขึ้นมาและสัมภาษณ์ในวันจันทร์จากนั้นการทดสอบจะสิ้นสุดลง หากเหรียญขึ้นมาเธอจะถูกปลุกให้ตื่นและสัมภาษณ์ในวันจันทร์และวันอังคาร แต่เมื่อเธอถูกสั่งให้นอนหลับอีกครั้งในวันจันทร์เธอจะได้รับยาความจำเสื่อมที่ทำให้เธอไม่สามารถจำการตื่นนอนก่อนหน้านี้ได้ ในกรณีนี้การทดสอบจะสิ้นสุดลงหลังจากเธอถูกสัมภาษณ์ในวันอังคาร
เมื่อใดก็ตามที่ความงามของเจ้าหญิงนิทราถูกปลุกขึ้นมาและสัมภาษณ์เธอถูกถามว่า "ตอนนี้ความน่าเชื่อถือของคุณคืออะไรสำหรับข้อเสนอที่เหรียญลงไปที่หัว"
ตำแหน่งของ Thirder คือ SB ควรตอบสนอง "1/3" (นี่เป็นการคำนวณทฤษฎีบทของ Bayes อย่างง่าย) และตำแหน่ง Halfer ก็คือเธอควรจะพูดว่า "1/2" (เพราะนั่นเป็นความน่าจะเป็นที่ถูกต้องสำหรับเหรียญยุติธรรม! ) IMHO การอภิปรายทั้งหมดขึ้นอยู่กับความเข้าใจในความน่าจะเป็นที่ จำกัด แต่นั่นไม่ใช่ประเด็นทั้งหมดในการสำรวจความขัดแย้งที่ชัดเจน?
(ภาพประกอบจากProject Gutenberg )
แม้ว่านี่ไม่ใช่สถานที่ที่จะพยายามแก้ไขความขัดแย้ง - เพียงเพื่อระบุพวกเขา - ฉันไม่ต้องการปล่อยให้ผู้คนแขวนอยู่และฉันแน่ใจว่าผู้อ่านส่วนใหญ่ของหน้านี้ไม่ต้องการลุยคำอธิบายทางปรัชญา เราสามารถใช้เคล็ดลับจากET Jaynesผู้แทนที่คำถาม“ เราจะสร้างแบบจำลองทางคณิตศาสตร์ของสามัญสำนึกของมนุษย์ได้อย่างไร” ซึ่งเป็นสิ่งที่เราต้องการเพื่อคิดผ่านปัญหาเจ้าหญิงนิทรา - โดย“ เราจะสร้างเครื่องจักรได้อย่างไร ซึ่งจะนำไปสู่การใช้เหตุผลที่น่าเชื่อถือได้ตามหลักการที่กำหนดไว้อย่างชัดเจนซึ่งแสดงถึงสามัญสำนึกในอุดมคติ?” ดังนั้นหากคุณต้องการแทนที่หุ่นยนต์คิดของเจย์เนส SB คุณสามารถโคลนหุ่นยนต์นี้ (แทนที่จะจัดการกับยาลบความทรงจำเพ้อฝัน) สำหรับการทดลองในวันอังคารดังนั้นจึงสร้างรูปแบบที่ชัดเจนของการตั้งค่า SB ที่สามารถวิเคราะห์ได้อย่างไม่น่าสงสัย การสร้างแบบจำลองนี้ในแบบมาตรฐานโดยใช้ทฤษฎีการตัดสินใจเชิงสถิติแล้วเปิดเผยว่ามีคำถามสองข้อที่ถูกถามจริงๆที่นี่ ( โอกาสที่ที่ดินหัวเหรียญยุติธรรมจะเป็นอย่างไรและโอกาสใดที่เหรียญมีหัวลงดิน โคลนใครถูกปลุกให้ตื่น? ) คำตอบคือ 1/2 (ในกรณีแรก) หรือ 1/3 (ในกรณีที่สองโดยใช้ทฤษฎีบทของเบย์) ไม่มีหลักการทางกลศาสตร์ควอนตัมเกี่ยวข้องในการแก้ปัญหานี้ :-)
Arntzenius, Frank (2002) ภาพสะท้อนของเจ้าหญิงนิทรา การวิเคราะห์ 62.1 หน้า 53-62 Elga, Adam (2000) ความเชื่อที่ตั้งตัวเองและปัญหาความงามนอนหลับ การวิเคราะห์ 60 pp 143-7
Franceschi, Paul (2005) เจ้าหญิงนิทราและปัญหาที่เกิดจากการลดโลก preprint
Groisman, Berry (2007) ในตอนท้ายของการนอนหลับฝันร้ายของความงาม
Lewis, D (2001) Sleeping Beauty: การตอบกลับ Elga การวิเคราะห์ 61.3 pp 171-6
Papineau, DavidและVictor Dura-Vila (2008) thirder และ Everettian: ตอบกลับของลูอิส 'ควอนตัม Sleeping Beauty'
Pust, Joel (2008) Horgan ในเจ้าหญิงนิทรา ซินธิส 160 หน้า 97-101
Vineberg, Susan (ไม่ได้ระบุไว้, อาจจะเป็นปี 2003) ความงามของเตือนเรื่อง
สามารถพบได้ทั้งหมด (หรืออย่างน้อยก็พบเมื่อหลายปีก่อน) บนเว็บ
ขัดแย้ง St.Petersburgซึ่งทำให้คุณคิดว่าแตกต่างกันในแนวคิดและความหมายของค่าที่คาดหวัง สัญชาตญาณ (ส่วนใหญ่สำหรับผู้ที่มีพื้นฐานด้านสถิติ) และการคำนวณนั้นให้ผลลัพธ์ที่แตกต่างกัน
ขัดแย้งฟรีย์-ลินด์ซึ่งแสดงให้เห็นว่าภายใต้สถานการณ์บางอย่างเริ่มต้นวิธี frequentist คชกรรมและการทดสอบสมมติฐานสามารถให้คำตอบที่ขัดแย้งกันอย่างสิ้นเชิง มันบังคับให้ผู้ใช้คิดอย่างถ่องแท้ถึงความหมายของการทดสอบรูปแบบเหล่านี้และพิจารณาว่าเป็นสิ่งที่ต้องการหรือไม่ สำหรับตัวอย่างล่าสุดดูการสนทนานี้
มีการเข้าใจผิดสองสาวที่มีชื่อเสียง:
ในครอบครัวที่มีลูกสองคนโอกาสที่จะเกิดอะไรขึ้นถ้าเด็กคนใดคนหนึ่งเป็นผู้หญิงเด็กทั้งสองเป็นผู้หญิง?
คนส่วนใหญ่สังหรณ์ใจพูดแต่คำตอบคือ1/2
1/3
ปัญหาพื้นฐานคือการเลือก"ผู้หญิงคนหนึ่งจากผู้หญิงทุกคนที่มีพี่น้อง"โดยการสุ่มนั้นไม่เหมือนกับการเลือก"ครอบครัวเดียวกันจากทุกครอบครัวที่มีลูกสองคนและเด็กผู้หญิงอย่างน้อยหนึ่งคน"
อันนี้ง่ายพอที่จะสอดคล้องกับสัญชาตญาณเมื่อคุณเข้าใจ แต่มีรุ่นที่ซับซ้อนมากขึ้นที่ยากต่อการเข้าใจ:
ในครอบครัวที่มีลูกสองคนโอกาสที่จะเกิดอะไรขึ้นถ้าเด็กคนหนึ่งเป็นเด็กชายที่เกิดในวันอังคารที่เด็กทั้งสองเป็นเด็กชาย? (คำตอบ: 13/27)
ในครอบครัวที่มีลูกสองคนโอกาสที่จะเกิดอะไรขึ้นถ้าเด็กคนหนึ่งเป็นผู้หญิงชื่อฟลอริด้าว่าเด็กทั้งสองเป็นผู้หญิง (คำตอบ: ใกล้มากถึง 1/2 โดยสมมติว่า "Florida" เป็นชื่อที่หายากมาก)
ข้อมูลเพิ่มเติมเกี่ยวกับปริศนาเหล่านี้สามารถพบได้ในคำตอบนี้นี้
(เช่น: ข้อมูลเพิ่มเติมเกี่ยวกับเด็กผู้ชายที่เกิดในวันอังคาร , ข้อมูลเพิ่มเติมเกี่ยวกับหญิงสาวที่ชื่อฟลอริดา )
1/3
ไม่2/3
แน่นอน? เพียงหนึ่งเดียวจากGB, BG, GG
ขออภัย แต่ฉันไม่สามารถช่วยตัวเองได้ (เช่นกันฉันชอบความขัดแย้งทางสถิติ!)
อีกครั้งอาจไม่ใช่ความขัดแย้งต่อ seและอีกตัวอย่างหนึ่งของตัวแปรที่ถูกละเว้น
สาเหตุที่แท้จริง / การถดถอย
ตัวแปรใด ๆ ที่มีแนวโน้มเวลาจะสัมพันธ์กับตัวแปรอื่นที่มีแนวโน้มเวลาเช่นกัน ตัวอย่างเช่นน้ำหนักของฉันตั้งแต่แรกเกิดถึงอายุ 27 จะมีความสัมพันธ์อย่างมากกับน้ำหนักของคุณตั้งแต่แรกเกิดถึงอายุ 27 เห็นได้ชัดว่าน้ำหนักของฉันไม่ได้เกิดจากน้ำหนักของคุณ ถ้าเป็นเช่นนั้นฉันจะขอให้คุณไปที่โรงยิมบ่อยขึ้นโปรด
เมื่อคุณทำการวิเคราะห์อนุกรมเวลาคุณต้องแน่ใจว่าตัวแปรของคุณอยู่กับที่หรือคุณจะได้ผลลัพธ์ที่เป็นไปได้
(ฉันยอมรับอย่างเต็มที่ว่าฉันขโมยความคิดคำตอบของฉันเองที่นี่ )
หนึ่งในรายการโปรดของฉันคือปัญหา Monty Hall ฉันจำได้ว่าเรียนรู้เกี่ยวกับมันในชั้นเรียนสถิติระดับประถมบอกพ่อของฉันเพราะเราทั้งคู่ต่างก็ไม่เชื่อฉันจำลองเลขสุ่มแล้วเราก็พยายามแก้ปัญหา เพื่อความประหลาดใจของเรามันเป็นเรื่องจริง
โดยทั่วไปปัญหาระบุว่าถ้าคุณมีสามประตูในรายการเกมหลังซึ่งหนึ่งเป็นรางวัลและอีกสองไม่มีอะไรถ้าคุณเลือกประตูแล้วก็บอกว่าอีกสองประตูที่เหลือหนึ่งในสองไม่ใช่ประตูรางวัล และอนุญาตให้สลับการเลือกของคุณหากคุณเลือกคุณควรสลับประตูปัจจุบันไปที่ประตูที่เหลือ
นี่คือลิงค์ไปสู่การจำลอง R เช่นกัน: LINK
Parrondo's Paradox:
จากwikipdedia : "Parrondo's paradox, Paradox ในทฤษฎีเกมได้รับการอธิบายว่า: การรวมกันของการสูญเสียกลยุทธ์กลายเป็นกลยุทธ์ที่ชนะมันได้รับการตั้งชื่อตามผู้สร้าง Juan Parrondo ผู้ค้นพบความขัดแย้งในปี 1996 คำอธิบายเพิ่มเติมคือ :
มีคู่ของเกมแต่ละเกมที่มีความเป็นไปได้สูงที่จะแพ้มากกว่าชนะซึ่งเป็นไปได้ที่จะสร้างกลยุทธ์ที่ชนะโดยการเล่นเกมสลับกัน
Parrondo คิดค้นความขัดแย้งที่เกี่ยวข้องกับการวิเคราะห์วงล้อสีน้ำตาลของเขาซึ่งเป็นการทดลองทางความคิดเกี่ยวกับเครื่องจักรที่สามารถดึงพลังงานจากการเคลื่อนที่ด้วยความร้อนแบบสุ่มซึ่งได้รับความนิยมโดย Richard Feynman นักฟิสิกส์ อย่างไรก็ตามความขัดแย้งจะหายไปเมื่อวิเคราะห์อย่างจริงจัง "
นอกจากนี้ยังมีความขัดแย้งที่เกี่ยวข้องเมื่อเร็ว ๆ นี้ที่เรียกว่า "อัลลิสันมิกซ์ " ซึ่งแสดงให้เห็นว่าเราสามารถใช้ IID สองชุดและชุดที่ไม่มีความสัมพันธ์กันและแย่งพวกมันแบบสุ่มเพื่อให้ชุดผสมบางชุด
เป็นที่น่าสนใจว่าปัญหาเด็กสองคนและปัญหามอนตี้ฮอลล์มักถูกกล่าวถึงกันในบริบทของความขัดแย้ง ทั้งคู่แสดงให้เห็นถึงความขัดแย้งชัดเจนชัดเจนครั้งแรกในปี 2432 เรียกว่าเบอร์ทรานด์บ็อกซ์เป็นเส้นขนานซึ่งสามารถเป็นตัวแทนของทั้งคู่ ฉันคิดว่ามันเป็น "ความขัดแย้ง" ที่น่าสนใจที่สุดเพราะคนที่มีการศึกษาและชาญฉลาดมากคนเดียวกันตอบคำถามทั้งสองนี้ในทางตรงกันข้ามด้วยความเคารพต่อความขัดแย้งนี้ นอกจากนี้ยังเปรียบเทียบกับหลักการที่ใช้ในเกมไพ่เช่นบริดจ์หรือที่รู้จักในชื่อหลักการของตัวเลือกที่ จำกัด ซึ่งจะมีการทดสอบความละเอียดตามเวลา
สมมติว่าคุณมีรายการที่เลือกแบบสุ่มซึ่งฉันจะเรียกว่า "กล่อง" ทุกกล่องที่เป็นไปได้มีคุณสมบัติสมมาตรอย่างน้อยหนึ่งในสอง แต่บางกล่องมีทั้งสองอย่าง ฉันจะเรียกคุณสมบัติ "ทอง" และ "เงิน" ความน่าจะเป็นที่กล่องเป็นเพียงแค่ทองก็คือ P และเนื่องจากคุณสมบัติมีความสมมาตร P จึงเป็นความน่าจะเป็นที่กล่องเป็นเพียงเงิน นั่นทำให้ความน่าจะเป็นที่กล่องหนึ่งอันมีคุณสมบัติเพียง 2P และความน่าจะเป็นที่มีทั้ง 1-2P
หากคุณได้รับการบอกว่ากล่องเป็นทองคำ แต่ไม่ว่าจะเป็นเงินคุณอาจถูกล่อลวงให้บอกว่าโอกาสที่มันจะเป็นเพียงแค่ทองคือ P / (P + (1-2P)) = P / (1-P) แต่คุณจะต้องระบุความน่าจะเป็นแบบเดียวกันสำหรับกล่องสีเดียวถ้าคุณบอกว่ามันเป็นเงิน และถ้าความน่าจะเป็นนี้คือ P / (1-P) เมื่อใดก็ตามที่คุณบอกแค่สีเดียวมันจะต้องเป็น P / (1-P) แม้ว่าคุณจะไม่ได้บอกสี แต่เรารู้ว่ามันเป็น 2P จากย่อหน้าสุดท้าย
ความขัดแย้งที่เห็นได้ชัดนี้ได้รับการแก้ไขโดยการสังเกตว่าถ้ากล่องมีเพียงสีเดียวก็ไม่มีความเคลือบแคลงเกี่ยวกับสีที่คุณจะบอก แต่ถ้ามันมีสองตัว คุณต้องรู้ว่าตัวเลือกนั้นถูกสร้างขึ้นเพื่อตอบคำถามและนั่นคือรากของความขัดแย้งที่ชัดเจน หากคุณไม่ได้รับแจ้งคุณสามารถสันนิษฐานได้ว่ามีเพียงสีที่ถูกสุ่มเลือกเท่านั้นทำให้คำตอบ P / (P + (1-2P) / 2) = 2P หากคุณยืนยันว่า P / (1-P) เป็นคำตอบคุณถือว่าโดยปริยายว่าไม่มีความเป็นไปได้ที่จะมีการพูดถึงสีอื่นเว้นแต่ว่าเป็นสีเดียวเท่านั้น
ในปัญหามอนตี้ฮอลล์การเปรียบเทียบสีนั้นไม่ง่ายนัก แต่เป็น P = 1/3 คำตอบที่อิงกับสองประตูที่ยังไม่ได้เปิด แต่แรกเริ่มมีโอกาสเท่าเทียมกันที่จะได้รับรางวัลสมมติว่า Monty Hall จำเป็นต้องเปิดประตูที่เขาทำแม้ว่าเขาจะมีทางเลือกก็ตาม คำตอบนั้นคือ P / (1-P) = 1/2 คำตอบที่อนุญาตให้เขาเลือกแบบสุ่มคือ 2P = 2/3 สำหรับความน่าจะเป็นที่การสลับจะชนะ
ในปัญหาลูกสองสีในการเปรียบเทียบของฉันค่อนข้างเปรียบเทียบกับเพศ มีสี่ราย P = 1/4 ในการตอบคำถามเราจำเป็นต้องรู้ว่ามันถูกกำหนดแล้วว่ามีผู้หญิงในครอบครัว หากเป็นไปได้ที่จะเรียนรู้เกี่ยวกับเด็กผู้ชายในครอบครัวด้วยวิธีการนั้นคำตอบคือ 2P = 1/2 ไม่ใช่ P / (1-P) = 1/3 มันซับซ้อนกว่านี้เล็กน้อยถ้าคุณพิจารณาชื่อฟลอริดาหรือ "เกิดวันอังคาร" แต่ผลลัพธ์ก็เหมือนกัน คำตอบคือ 1/2 ถ้ามีตัวเลือกและข้อความส่วนใหญ่ของปัญหาบ่งบอกถึงตัวเลือกดังกล่าว และเหตุผลที่ "เปลี่ยน" จาก 1/3 เป็น 13/27 หรือจาก 1/3 เป็น "เกือบ 1/2" ดูเหมือนว่าขัดแย้งและไม่ได้ใช้งานง่ายเพราะข้อสันนิษฐานที่ไม่มีทางเลือกนั้นไม่ได้ใช้งานง่าย
ในหลักการของการ จำกัด การเลือกสมมติว่าคุณขาดไพ่ชุดเดียวกัน - เช่น Jack, Queen และ King ในชุดเดียวกัน โอกาสเริ่มต้นแม้กระทั่งการ์ดใด ๆ ที่เป็นของคู่ต่อสู้ที่เฉพาะเจาะจง แต่หลังจากที่ฝ่ายตรงข้ามเล่นหนึ่งโอกาสของเขาที่จะมีคนอื่น ๆ จะลดลงเพราะเขาสามารถเล่นไพ่ใบนั้นถ้าเขามี
ฉันพบภาพกราฟิกที่เรียบง่ายของการเข้าใจผิดทางนิเวศวิทยา (ที่นี่รัฐที่ร่ำรวย / รัฐที่ยากจนผู้ลงคะแนนขัดแย้ง) ช่วยให้ฉันเข้าใจในระดับที่เข้าใจง่ายว่าทำไมเราถึงเห็นรูปแบบการกลับรายการเมื่อเรารวมประชากรของรัฐ:
สมมติว่าคุณได้รับข้อมูลเกี่ยวกับการเกิดในราชวงศ์ของบางราชอาณาจักร ในแผนภูมิต้นไม้แต่ละการเกิดถูกบันทึกไว้ สิ่งที่แปลกประหลาดเกี่ยวกับครอบครัวนี้ก็คือพ่อแม่พยายามที่จะมีลูกเท่านั้นเมื่อเร็ว ๆ นี้เด็กชายคนแรกเกิดและไม่มีลูกอีกแล้ว
ดังนั้นข้อมูลของคุณอาจมีลักษณะคล้ายกับสิ่งนี้:
G G B
B
G G B
G B
G G G G G G G G G B
etc.
สัดส่วนของเด็กชายและเด็กหญิงในตัวอย่างนี้จะสะท้อนถึงความน่าจะเป็นโดยทั่วไปของการให้กำเนิดเด็กผู้ชาย (พูด 0.5) คำตอบและคำอธิบายสามารถพบได้ในหัวข้อนี้
นี่คือ Paradox ของ Simpson อีกครั้ง แต่ 'ถอยหลัง' และข้างหน้ามาจากหนังสือเล่มใหม่ของ Judea Pearl เกี่ยวกับการอนุมานสาเหตุในสถิติ: ไพรเมอร์ [^ 1]
Paradox คลาสสิกของซิมป์สันทำงานดังนี้ลองพิจารณาเลือกหมอสองคน คุณเลือกโดยอัตโนมัติด้วยผลลัพธ์ที่ดีที่สุด แต่สมมติว่าผลลัพธ์ที่ดีที่สุดเลือกกรณีที่ง่ายที่สุด บันทึกที่ไม่ดีของอีกฝ่ายเป็นผลมาจากการทำงานที่ยุ่งยากมากขึ้น
ตอนนี้คุณเลือกใคร ดีกว่าที่จะดูผลลัพธ์ที่แบ่งชั้นด้วยความยากลำบากและจากนั้นตัดสินใจ
มีอีกด้านหนึ่งของเหรียญ (อีกอันที่ขัดแย้งกัน) ซึ่งบอกว่าผลลัพธ์ของการแบ่งชั้นยังสามารถนำคุณไปสู่การเลือกที่ผิด
คราวนี้พิจารณาเลือกที่จะใช้ยาหรือไม่ ยาเสพติดมีผลข้างเคียงที่เป็นพิษ แต่กลไกการรักษาของการกระทำคือการลดความดันโลหิต โดยรวมแล้วยาจะช่วยเพิ่มผลลัพธ์ในประชากร แต่เมื่อแบ่งชั้นความดันโลหิตหลังการรักษาผลลัพธ์จะแย่ลงทั้งในกลุ่มที่มีความดันต่ำและกลุ่มที่มีความดันโลหิตสูง สิ่งนี้จะเป็นจริงได้อย่างไร เพราะเรามีการแบ่งชั้นผลลัพธ์โดยไม่ได้ตั้งใจและในแต่ละผลลัพธ์สิ่งที่เหลืออยู่ที่ต้องสังเกตคือผลข้างเคียงที่เป็นพิษ
เพื่ออธิบายให้ชัดเจนลองนึกภาพยานี้ออกแบบมาเพื่อแก้ไขหัวใจที่แตกสลายและทำได้โดยลดความดันโลหิตและแทนที่จะแบ่งชั้นความดันโลหิตที่เราแบ่งชั้นบนหัวใจคงที่ เมื่อยาทำงาน, หัวใจได้รับการแก้ไข (และความดันโลหิตจะลดลง), แต่ผู้ป่วยบางรายจะได้รับผลข้างเคียงที่เป็นพิษ. เนื่องจากการทำงานของยากลุ่ม 'หัวใจคงที่' จะมีผู้ป่วยจำนวนมากที่ได้ทานยามากกว่าที่จะมีผู้ป่วยทานยาในกลุ่มหัวใจที่แตกหัก ผู้ป่วยที่รับประทานยามากขึ้นหมายถึงผู้ป่วยที่ได้รับผลข้างเคียงมากขึ้นและเห็นได้ชัดว่า (แต่เท็จ) ผลลัพธ์ที่ดีกว่าสำหรับผู้ป่วยที่ไม่ได้ใช้ยา
ผู้ป่วยที่หายดีขึ้นโดยไม่ทานยาถือเป็นโชคดี ผู้ป่วยที่ใช้ยาและดีขึ้นเป็นส่วนผสมของผู้ที่ต้องการยาเพื่อให้ดีขึ้นและผู้ที่จะโชคดีอยู่แล้ว การตรวจผู้ป่วยด้วย 'หัวใจคงที่' หมายถึงไม่รวมผู้ป่วยที่จะได้รับการแก้ไขหากพวกเขาใช้ยา ไม่รวมผู้ป่วยดังกล่าวหมายถึงการยกเว้นอันตรายจากการไม่ใช้ยาซึ่งหมายความว่าเราเห็นอันตรายจากการใช้ยา
ความขัดแย้งของซิมป์สันเกิดขึ้นเมื่อมีสาเหตุของผลลัพธ์นอกเหนือจากการรักษาเช่นความจริงที่ว่าแพทย์ของคุณทำเฉพาะกรณีที่ยุ่งยาก การควบคุมสำหรับสาเหตุที่พบบ่อย (กรณีที่ยุ่งยากกับกรณีง่าย) ช่วยให้เราเห็นผลที่แท้จริง ในตัวอย่างหลังเราได้แบ่งชั้นโดยไม่ได้ตั้งใจในผลลัพธ์ที่ไม่ได้อยู่ในสาเหตุซึ่งหมายความว่าคำตอบที่แท้จริงอยู่ในการรวมไม่ใช่ข้อมูลที่แบ่งเป็นชั้น ๆ
[^ 1]: Pearl J. การอนุมานเชิงสาเหตุในสถิติ John Wiley & Sons; 2016
หนึ่งใน "รายการโปรดของฉัน" ซึ่งหมายความว่ามันเป็นสิ่งที่ไดรฟ์ผมบ้าเกี่ยวกับความหมายของการศึกษาจำนวนมาก (และมักจะโดยผู้เขียนเองไม่ได้เป็นเพียงสื่อ) เป็นที่ของตกทอดอคติ
วิธีหนึ่งที่จะคิดว่ามันจะคิดว่ามีผลกระทบบางอย่างที่เป็นมากเป็นอันตรายกับอาสาสมัครให้มากเพื่อที่จะมีโอกาสที่ดีมากของการฆ่าพวกเขา หากผู้เข้าร่วมการทดลองได้รับผลกระทบนี้ก่อนการศึกษาดังนั้นเมื่อถึงเวลาที่เริ่มการทดลองผู้เข้าร่วมที่ยังมีชีวิตอยู่จะมีโอกาสสูงมากที่จะมีความยืดหยุ่นผิดปกติ การคัดเลือกโดยธรรมชาติอย่างแท้จริงในที่ทำงาน เมื่อเกิดเหตุการณ์นี้การศึกษาจะสังเกตว่าวิชาสัมผัสมีสุขภาพดีผิดปกติ (เนื่องจากทุกคนที่ไม่แข็งแรงอยู่แล้วเสียชีวิตหรือทำให้แน่ใจว่าจะหยุดการสัมผัสกับผลที่ออกมา) สิ่งอำนวยมักจะตีความได้ว่าว่าการสัมผัสเป็นจริงที่ดีสำหรับวิชา นี่คือผลลัพธ์ของการละเว้นการตัดปลาย (เช่นเพิกเฉยต่ออาสาสมัครที่เสียชีวิตและไม่ได้ทำการศึกษา)
ในทำนองเดียวกันผู้ที่หยุดการสัมผัสกับผลกระทบในระหว่างการศึกษามักจะไม่แข็งแรงอย่างไม่น่าเชื่อ: นี่เป็นเพราะพวกเขาตระหนักว่าการเปิดรับอย่างต่อเนื่องอาจจะฆ่าพวกเขา แต่จากการศึกษาพบว่าผู้ที่ลาออกนั้นไม่แข็งแรงมาก!
@ คำตอบของ Charlie เกี่ยวกับเครื่องบินทิ้งระเบิดสงครามโลกครั้งที่สองนั้นสามารถเป็นตัวอย่างได้ แต่ก็มีตัวอย่างที่ทันสมัยมากมายเช่นกัน ตัวอย่างล่าสุดคือการศึกษารายงานว่าดื่มกาแฟวันละ 8+ แก้ว(!!) เชื่อมโยงกับสุขภาพหัวใจที่สูงขึ้นอย่างมากในอาสาสมัครที่มีอายุมากกว่า 55 ปี ผู้คนจำนวนมากที่มีปริญญาเอกตีความเช่นนี้ว่า "การดื่มกาแฟเป็นสิ่งที่ดีต่อหัวใจของคุณ!" รวมถึงผู้เขียนการศึกษาด้วย ฉันอ่านสิ่งนี้เพราะคุณต้องมีหัวใจที่แข็งแรงอย่างไม่น่าเชื่อที่จะยังคงดื่มกาแฟ 8 ถ้วยต่อวันหลังจากอายุ 55 ปีและไม่มีอาการหัวใจวาย แม้ว่ามันจะไม่ฆ่าคุณ แต่ก็มีบางสิ่งที่น่าเป็นห่วงเกี่ยวกับสุขภาพของคุณทุกคนที่รักคุณ (รวมถึงแพทย์ของคุณ) จะกระตุ้นให้คุณหยุดดื่มกาแฟทันที การศึกษาเพิ่มเติมพบว่าการดื่มกาแฟมากไม่มีผลประโยชน์ในกลุ่มวัยรุ่นซึ่งฉันเชื่อว่าเป็นหลักฐานเพิ่มเติมว่าเรากำลังเห็นผลการรอดชีวิตมากกว่าผลเชิงบวก กระนั้นก็มีการศึกษาระดับปริญญาเอกมากมายที่พูดว่า "
ฉันประหลาดใจที่ยังไม่มีใครพูดถึงNewcombe's Paradoxถึงแม้ว่ามันจะถูกกล่าวถึงอย่างหนักในทฤษฎีการตัดสินใจ มันเป็นหนึ่งในรายการโปรดของฉันอย่างแน่นอน