ใน [1, §3.2] David Freedmanเสนอคำตอบที่เป็นลบกับคำถามของคุณ นั่นคือไม่มีแบบจำลองทางสถิติหรืออัลกอริทึม (เพียง) สามารถแก้ปัญหาของจอห์นสโนว์ได้ ปัญหาของหิมะก็คือการพัฒนาข้อโต้แย้งที่สำคัญสนับสนุนทฤษฎีของเขาว่าอหิวาตกโรคเป็นโรคติดเชื้อที่เกิดจากน้ำโดยต่อต้านทฤษฎีการเกิดฝ้าในวันนี้ (บทที่ 3 ใน [1] ชื่อ“ แบบจำลองเชิงสถิติและรองเท้าหนัง” ยังมีอยู่ในแบบฟอร์มที่เผยแพร่ก่อนหน้านี้ [2] ที่นี่ )
ในหน้าสั้น ๆ เหล่านี้ [1, pp.47–53] ซึ่งส่วนใหญ่เป็นการอ้างอิงจาก John Snow เอง Freedman ให้เหตุผลว่า "สิ่งที่หิมะได้ทำจริงในปี ค.ศ. 1853-54 นั้นน่าสนใจยิ่งกว่านิทานในวงกว้าง ปั๊มถนน]. " เท่าที่หลักฐานทางสถิติ marshalling (รอบปฐมทัศน์อื่น ๆ เช่นการระบุกรณีดัชนี ฯลฯ มีการหารือนอกเหนือ) หิมะใช้ประโยชน์จากการเปลี่ยนแปลงตามธรรมชาติเพื่อให้เกิดการทดลองเสมือนจริงที่น่าทึ่ง
ปรากฎว่าในช่วงเวลาก่อนหน้านี้มีการแข่งขันที่รุนแรงระหว่าง บริษัท น้ำประปาในลอนดอนและสิ่งนี้ส่งผลให้เกิดการผสมน้ำประปาในพื้นที่ (ในคำพูดของหิมะ) "ที่ใกล้ชิดที่สุด"
ท่อของแต่ละ บริษัท จะลงไปตามถนนทุกสายและเข้าไปในสนามและตรอกซอกซอยเกือบทั้งหมด บ้านสองสามหลังถูกจัดหาโดย บริษัท หนึ่งแห่งและอีกสองแห่งตามการตัดสินใจของเจ้าของหรือผู้ครอบครองในเวลานั้นเมื่อ บริษัท น้ำกำลังแข่งขันอย่างแข็งขัน
...
เนื่องจากไม่มีความแตกต่างใด ๆ ในบ้านหรือผู้คนที่ได้รับการจัดหาของ บริษัท น้ำทั้งสองหรือในสภาพทางกายภาพใด ๆ ที่พวกเขาถูกล้อมรอบเป็นที่ชัดเจนว่าการทดลองไม่ได้ถูกคิดค้นขึ้นซึ่งจะทดสอบอย่างละเอียดมากขึ้น ผลกระทบของการประปาในความคืบหน้าของอหิวาตกโรคมากกว่านี้สถานการณ์ที่วางไว้พร้อมทำก่อนที่ผู้สังเกตการณ์
—John Snow
อีกนิดที่สำคัญอย่างยิ่งของการเปลี่ยนแปลงทางธรรมชาติ 'จอห์นหิมะใช้ประโยชน์ในเรื่องนี้กึ่งทดลองว่า บริษัท น้ำหนึ่งมีปริมาณน้ำในแม่น้ำเทมส์ปลายน้ำของการปล่อยน้ำเสียในขณะที่คนอื่น ๆ มีไม่กี่ปีก่อนที่จะย้ายการบริโภคของต้นน้ำ ฉันจะให้คุณเดาว่าอันไหนมาจากตารางข้อมูลของ John Snow!
| จำนวน | อหิวาตกโรค ตายต่อ
บริษัท | บ้าน | ความตาย 10,000 บ้าน
-------------------------------------------------- --------
Southwark & Vauxhall | 40,046 | 1263 | 315
แลมเบ ธ 26,107 | 98 | 37
ส่วนที่เหลือของลอนดอน 256,423 | 1422 | 59
ในฐานะที่เป็นอิสระบันทึกอย่างไม่เต็มใจ
ในฐานะที่เป็นส่วนหนึ่งของเทคโนโลยีทางสถิติ [ตารางข้างต้น] นั้นไม่น่าทึ่ง แต่เรื่องราวที่เล่านั้นเป็นเรื่องที่โน้มน้าวใจมาก พลังของการโต้แย้งเป็นผลมาจากความชัดเจนของการให้เหตุผลก่อนหน้าการรวบรวมหลักฐานที่แตกต่างกันจำนวนมากและปริมาณของรองเท้าหนังหิมะก็เต็มใจที่จะใช้เพื่อรับข้อมูล [1, p.51]
อีกจุดหนึ่งของความแปรปรวนทางธรรมชาติที่ถูกเอาเปรียบโดยหิมะเกิดขึ้นในมิติเวลา : การเคลื่อนย้ายปริมาณน้ำที่กล่าวมาข้างต้นเกิดขึ้นระหว่างการระบาดสองครั้งทำให้หิมะสามารถเปรียบเทียบน้ำของ บริษัท เดียวกันกับที่มีและไม่มีน้ำเสียเพิ่ม (ต้องขอบคุณ Philip B. Stark ผู้เขียนหนึ่ง [1] สำหรับข้อมูลนี้ผ่าน Twitterดูการบรรยายออนไลน์ของเขา)
เรื่องนี้ยังให้การศึกษาที่ให้คำแนะนำในทางตรงกันข้ามระหว่างนิรนัยและการเหนี่ยวนำตามที่กล่าวไว้ในคำตอบนี้
ฟรีแมน D, ถ่านหิน D, Sekhon JS, Stark PB แบบจำลองทางสถิติและการอนุมานเชิงสาเหตุ: บทสนทนากับสังคมศาสตร์ เคมบริดจ์; นิวยอร์ก: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์; 2010
อิสระ DA โมเดลเชิงสถิติและเครื่องหนังรองเท้า สังคมวิทยาวิธี 1991; 21: 291-313 ดอย: 10.2307 / 270939 ข้อความเต็ม