คุณจะอธิบายลักษณะเฉพาะที่แยกความแตกต่างของ Bayesian จากการใช้เหตุผลแบบบ่อยเป็นภาษาอังกฤษได้อย่างไร
คุณจะอธิบายลักษณะเฉพาะที่แยกความแตกต่างของ Bayesian จากการใช้เหตุผลแบบบ่อยเป็นภาษาอังกฤษได้อย่างไร
คำตอบ:
นี่คือวิธีที่ฉันจะอธิบายความแตกต่างพื้นฐานให้กับยายของฉัน:
ฉันวางโทรศัพท์ผิดที่ในบ้าน ฉันสามารถใช้ตัวระบุตำแหน่งโทรศัพท์บนฐานของเครื่องมือเพื่อค้นหาโทรศัพท์และเมื่อฉันกดตัวระบุตำแหน่งโทรศัพท์โทรศัพท์จะเริ่มส่งเสียงบี๊บ
ปัญหา: ฉันควรค้นหาด้านใดในบ้านของฉัน
ฉันได้ยินเสียงโทรศัพท์ส่งเสียงบี๊บ ฉันยังมีแบบจำลองทางจิตซึ่งช่วยให้ฉันระบุบริเวณที่เสียงกำลังมา ดังนั้นเมื่อได้ยินเสียงบี๊บฉันสรุปพื้นที่ของบ้านของฉันฉันต้องค้นหาเพื่อค้นหาโทรศัพท์
ฉันได้ยินเสียงโทรศัพท์ส่งเสียงบี๊บ ตอนนี้นอกเหนือจากแบบจำลองทางจิตซึ่งช่วยให้ฉันระบุพื้นที่ที่มาจากเสียงฉันยังรู้ตำแหน่งที่ฉันวางโทรศัพท์ผิดไปในอดีต ดังนั้นฉันจึงรวมข้อสรุปของฉันโดยใช้เสียงบี๊บและข้อมูลก่อนหน้าของฉันเกี่ยวกับสถานที่ที่ฉันวางโทรศัพท์ผิดเพื่อที่จะระบุพื้นที่ที่ฉันต้องค้นหาเพื่อค้นหาโทรศัพท์
ลิ้นอย่างแน่นหนาในแก้ม:
Bayesian กำหนด "ความน่าจะเป็น" ในลักษณะเดียวกับที่นักสถิติที่ไม่ใช่ส่วนใหญ่ทำ - นั่นคือการบ่งชี้ความน่าเชื่อถือของข้อเสนอหรือสถานการณ์ หากคุณถามคำถามเขาเขาจะให้คำตอบโดยตรงกับคุณในการกำหนดความน่าจะเป็นที่อธิบายถึงความเป็นไปได้ของผลลัพธ์ที่เป็นไปได้สำหรับสถานการณ์เฉพาะ (และระบุสมมติฐานก่อนหน้า)
นักบวชประจำคือคนที่เชื่อว่าน่าจะเป็นตัวแทนของความถี่ในระยะยาวกับเหตุการณ์ที่เกิดขึ้น; หากต้องการเขาจะสร้างประชากรที่สมมติขึ้นจากสถานการณ์เฉพาะของคุณซึ่งอาจได้รับการพิจารณาเป็นตัวอย่างแบบสุ่มเพื่อให้เขาสามารถพูดคุยเกี่ยวกับความถี่ในระยะยาวได้อย่างมีความหมาย หากคุณถามเขาเกี่ยวกับสถานการณ์เฉพาะเขาจะไม่ให้คำตอบโดยตรง แต่ให้ออกแถลงการณ์เกี่ยวกับประชากร (อาจเป็นจินตภาพ) แทน นักสถิติที่ไม่ได้เป็นประจำจำนวนมากจะสับสนได้ง่ายโดยคำตอบและตีความว่าเป็นความน่าจะเป็นแบบเบย์เกี่ยวกับสถานการณ์เฉพาะ
อย่างไรก็ตามมันเป็นสิ่งสำคัญที่จะต้องทราบว่าวิธีการแบบฝึกหัดบ่อยที่สุดมี Bayesian เทียบเท่าว่าในสถานการณ์ส่วนใหญ่จะให้ผลลัพธ์เดียวกันเป็นหลักความแตกต่างส่วนใหญ่เป็นเรื่องของปรัชญาและในทางปฏิบัติมันเป็นเรื่องของ "ม้าหลักสูตร"
อย่างที่คุณอาจคาดเดาได้ฉันเป็นคนเบย์และวิศวกร ; o)
หยาบมากฉันจะบอกว่า:
ผู้พบบ่อย: การสุ่มตัวอย่างไม่มีที่สิ้นสุดและกฎการตัดสินใจมีความคมชัด ข้อมูลเป็นตัวอย่างแบบสุ่มที่ทำซ้ำได้ - มีความถี่ พารามิเตอร์พื้นฐานจะได้รับการแก้ไขนั่นคือคงที่ในระหว่างกระบวนการสุ่มตัวอย่างที่ทำซ้ำได้นี้
Bayesian: ปริมาณที่ไม่รู้จักได้รับการปฏิบัติอย่างน่าจะเป็นและสามารถอัพเดทสถานะของโลกได้ตลอดเวลา ข้อมูลถูกสังเกตจากตัวอย่างที่รับรู้ ไม่รู้จักพารามิเตอร์และอธิบายความน่าจะเป็น มันเป็นข้อมูลที่ได้รับการแก้ไข
มีการโพสต์บล็อกที่ยอดเยี่ยมซึ่งให้ตัวอย่างที่ลึกซึ้งเกี่ยวกับวิธีการ Bayesian และ Frequentist จะจัดการปัญหาเดียวกันได้ ทำไมไม่ตอบปัญหาด้วยตัวคุณเองแล้วตรวจดู?
ปัญหา (นำมาจากบล็อกของ Panos Ipeirotis):
คุณมีเหรียญที่เมื่อพลิกหัวขึ้นด้วยความน่าจะเป็น p และจบลงด้วยความน่าจะเป็น 1-p (ไม่ทราบค่าของ p)
เมื่อพยายามที่จะประมาณค่า p คุณจะพลิกเหรียญ 100 ครั้ง มันจบลงที่หัว 71 ครั้ง
จากนั้นคุณต้องตัดสินใจเกี่ยวกับเหตุการณ์ต่อไปนี้: "ในการโยนต่อไปอีกสองครั้งเราจะได้รับสองหัวติดต่อกัน"
คุณจะเดิมพันว่าเหตุการณ์จะเกิดขึ้นหรือว่าจะไม่เกิดขึ้น?
ให้เราบอกว่าผู้ชายคนหนึ่งตายหกด้านและมันมีผลลัพธ์ 1, 2, 3, 4, 5, หรือ 6 นอกจากนี้เขาบอกว่าถ้ามันลงบน 3 เขาจะให้หนังสือข้อความฟรีแก่คุณ
จากนั้นไม่เป็นทางการ:
ผู้ถกเถียงกันบ่อยครั้งจะบอกว่าผลลัพท์มีโอกาสเท่ากับ 1 ใน 6 ที่เกิดขึ้น เธอมองว่าความน่าจะเป็นมาจากการแจกแจงความถี่ในระยะยาว
คชกรรมแต่จะบอกว่าแขวนบนที่สองที่ผมรู้ว่าคนที่เขาเดวิดเบลนคนโกงที่มีชื่อเสียง! ฉันมีความรู้สึกว่าเขาทำอะไรบางอย่าง ฉันจะบอกว่ามีโอกาสเพียง 1% ที่จะลงจอดบน 3 BUT แต่ ฉันจะประเมินความเชื่อนั้นอีกครั้งและเปลี่ยนให้มากขึ้นเมื่อเขาตาย ถ้าฉันเห็นตัวเลขอื่น ๆ ปรากฏขึ้นอย่างเท่าเทียมกันบ่อยครั้งฉันจะเพิ่มโอกาสจาก 1% เป็นสิ่งที่สูงขึ้นเล็กน้อยมิฉะนั้นฉันจะลดให้มากขึ้น เธอมองว่าความน่าจะเป็นระดับความเชื่อในข้อเสนอ
สนุกนิดหน่อย ...
จากเว็บไซต์นี้:
http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html
และจากเว็บไซต์เดียวกันเรียงความที่ดี ...
"คำอธิบายอย่างง่ายของทฤษฎีบทของเบย์"
Bayesian ถูกขอให้ทำการเดิมพันซึ่งอาจรวมถึงสิ่งใดก็ตามที่แมลงวันบินจะคลานขึ้นไปบนกำแพงได้เร็วขึ้นเพื่อยาที่จะรักษาชีวิตส่วนใหญ่หรือนักโทษคนใดควรเข้าคุก เขามีกล่องขนาดใหญ่พร้อมที่จับ เขารู้ว่าถ้าเขาใส่ทุกอย่างที่เขารู้ลงไปในกล่องรวมถึงความคิดเห็นส่วนตัวของเขาและหมุนมือจับมันจะเป็นการตัดสินใจที่ดีที่สุดสำหรับเขา
ผู้ที่ถูกถามบ่อยจะต้องเขียนรายงาน เขามีหนังสือกฎดำเล่มโต หากสถานการณ์ที่เขาถูกขอให้ทำรายงานเกี่ยวกับกฏของเขาเขาสามารถทำตามกฎและเขียนรายงานอย่างระมัดระวังว่าผิดที่สุดหนึ่งครั้งใน 100 (หรือหนึ่งครั้งใน 20 หรือหนึ่งครั้ง) เวลาในสิ่งที่ข้อกำหนดสำหรับรายงานของเขากล่าว)
ผู้รู้บ่อยรู้ (เพราะเขาเขียนรายงานไว้) ว่าบางครั้งเบย์ทำการเดิมพันว่าในกรณีที่เลวร้ายที่สุดเมื่อความคิดเห็นส่วนตัวของเขาผิดอาจกลายเป็นเลว ผู้เล่นประจำรู้ด้วย (ด้วยเหตุผลเดียวกัน) ว่าถ้าเขาเดิมพันกับเบย์ทุกครั้งที่เขาแตกต่างจากเขาจากนั้นในระยะยาวเขาจะสูญเสีย
ในภาษาอังกฤษธรรมดาฉันจะบอกว่าการใช้เหตุผลแบบเบย์และการมีเหตุผลเป็นประจำนั้นแตกต่างกันสองวิธีในการตอบคำถาม:
ความน่าจะเป็นคืออะไร
ความแตกต่างส่วนใหญ่จะเป็นไปตามวิธีการที่แต่ละคนตอบคำถามนี้เพราะมันเป็นตัวกำหนดขอบเขตของการประยุกต์ใช้ทฤษฎีที่ถูกต้อง ตอนนี้คุณไม่สามารถให้คำตอบในแง่ของ "ภาษาอังกฤษธรรมดา" ได้โดยไม่ต้องสร้างคำถามเพิ่มเติม สำหรับฉันคำตอบคือ (อย่างที่คุณคงเดาได้)
ความน่าจะเป็นคือตรรกะ
. นอกจากนี้แคลคูลัสของความน่าจะเป็นยังมาจากแคลคูลัสของข้อเสนอ สิ่งนี้สอดคล้องกับการให้เหตุผลแบบ "Bayesian" อย่างใกล้ชิดที่สุด - แม้ว่ามันจะขยายเหตุผลแบบ Bayesian ในแอปพลิเคชันโดยการให้หลักการในการกำหนดความน่าจะเป็นนอกเหนือไปจากหลักการในการจัดการมัน แน่นอนสิ่งนี้นำไปสู่คำถามติดตาม "ตรรกะคืออะไร" สำหรับฉันสิ่งที่ใกล้เคียงที่สุดที่ฉันสามารถให้เพื่อเป็นคำตอบสำหรับคำถามนี้คือ "ตรรกะคือการตัดสินสามัญสำนึกของบุคคลที่มีเหตุผลพร้อมชุดของข้อสันนิษฐานที่กำหนด" (บุคคลที่มีเหตุผลคืออะไร ฯลฯ ฯลฯ ) ลอจิกมีคุณสมบัติแบบเดียวกันทั้งหมดที่มีเหตุผลแบบเบย์ ตัวอย่างเช่นลอจิกไม่ได้บอกคุณว่าจะต้องคิดอะไรหรืออะไรคือ "ความจริงอย่างแน่นอน" เพียง แต่บอกคุณว่าความจริงของข้อเสนอหนึ่งเกี่ยวข้องกับความจริงของอีกข้อหนึ่งอย่างไร คุณต้องจัดหาระบบตรรกะด้วย "สัจพจน์" เพื่อเริ่มต้นกับข้อสรุป นอกจากนี้ยังมีข้อ จำกัด เดียวกันกับที่คุณสามารถรับผลลัพธ์โดยพลการจากสัจพจน์ที่ขัดแย้งกัน แต่ "สัจพจน์" นั้นไม่มีอะไรนอกจากความน่าจะเป็นมาก่อนซึ่งได้ตั้งค่าไว้
สำหรับเหตุผลที่เกิดขึ้นบ่อยครั้งเรามีคำตอบ:
ความน่าจะเป็นคือความถี่
แม้ว่าฉันไม่แน่ใจว่า "ความถี่" เป็นคำภาษาอังกฤษธรรมดาในวิธีที่ใช้ที่นี่ - บางที "สัดส่วน" เป็นคำที่ดีกว่า ฉันต้องการเพิ่มเข้าไปในคำตอบที่พบบ่อยว่าความน่าจะเป็นของเหตุการณ์นั้นเป็นปริมาณจริง (ที่สังเกตได้) ซึ่งสามารถวัดได้ซึ่งมีอยู่อย่างอิสระจากบุคคล / วัตถุที่คำนวณ แต่ฉันไม่สามารถทำได้ด้วยวิธี "ภาษาอังกฤษธรรมดา"
ดังนั้นบางทีความแตกต่างอาจเป็นได้ว่า "การให้เหตุผลแบบธรรมดา" เป็นความพยายามที่ให้เหตุผลจากความน่าจะเป็น "สัมบูรณ์" ในขณะที่การใช้เหตุผลแบบเบส์คือความพยายามในการให้เหตุผลจากความน่าจะเป็น "ญาติ"
ความแตกต่างอีกประการหนึ่งคือรากฐานที่พบบ่อยเป็นสิ่งที่คลุมเครือมากขึ้นในการที่คุณแปลปัญหาโลกแห่งความจริงให้เป็นคณิตศาสตร์เชิงนามธรรมของทฤษฎี ตัวอย่างที่ดีคือการใช้ "ตัวแปรสุ่ม" ในทฤษฎี - พวกเขามีคำจำกัดความที่แม่นยำในโลกนามธรรมของคณิตศาสตร์ แต่ไม่มีกระบวนการที่ชัดเจนที่เราสามารถใช้ตัดสินใจว่าปริมาณที่สังเกตได้บางอย่างหรือไม่ใช่ "สุ่ม" ตัวแปร".
วิธีการให้เหตุผลแบบเบย์แนวคิดของ "ตัวแปรสุ่ม" ไม่จำเป็น การแจกแจงความน่าจะเป็นถูกกำหนดให้กับปริมาณเพราะไม่เป็นที่รู้จักซึ่งหมายความว่าไม่สามารถอนุมานได้อย่างมีเหตุมีผลจากข้อมูลที่เรามี สิ่งนี้ให้การเชื่อมโยงอย่างง่ายระหว่างปริมาณที่สังเกตได้และทฤษฎี - เนื่องจาก "ไม่ทราบ" นั้นไม่คลุมเครือ
คุณยังสามารถเห็นความแตกต่างเพิ่มเติมในตัวอย่างข้างต้นซึ่งเป็นวิธีคิดสองวิธีคือ "สุ่ม" กับ "ไม่ทราบ" "การสุ่ม" เป็นคำในลักษณะที่ว่า "การสุ่ม" ดูเหมือนว่ามันเป็นคุณสมบัติของปริมาณที่แท้จริง ในทางกลับกันการ "ไม่ทราบ" ขึ้นอยู่กับบุคคลที่คุณถามเกี่ยวกับปริมาณนั้น - ดังนั้นจึงเป็นคุณสมบัติของนักสถิติที่ทำการวิเคราะห์ สิ่งนี้ก่อให้เกิดคำคุณศัพท์ "วัตถุประสงค์" และ "อัตนัย" ซึ่งมักจะยึดติดกับแต่ละทฤษฎี มันง่ายที่จะแสดงให้เห็นว่า "การสุ่ม" ไม่สามารถเป็นสมบัติของตัวอย่างมาตรฐานบางอย่างได้โดยเพียงแค่ถามผู้ใช้บ่อยสองคนที่ได้รับข้อมูลที่แตกต่างกันเกี่ยวกับปริมาณเดียวกันเพื่อตัดสินใจว่า "สุ่ม" หนึ่งในนั้นคือ Bernoulli Urn: นักประดาน้ำ 1 ถูกปิดตาขณะกำลังวาด ในขณะที่นักเล่น 2 ยืนอยู่เหนือโกศการดูนักเตะ 1 ดึงลูกบอลออกจากโกศ หากการประกาศของ "randomness" เป็นสมบัติของลูกบอลในโกศแล้วมันไม่สามารถขึ้นอยู่กับความรู้ที่แตกต่างกันของนักเล่น 1 และ 2 - และด้วยเหตุนี้ทั้งสองควรให้การประกาศเดียวกันของ "สุ่ม" หรือ "ไม่สุ่ม" .
ในความเป็นจริงฉันคิดว่าปรัชญาในเรื่องนี้เป็นเรื่องใหญ่ นั่นไม่ใช่การยกเลิกการอภิปราย แต่มันเป็นคำเตือน บางครั้งเรื่องการปฏิบัติมีความสำคัญฉันจะยกตัวอย่างด้านล่าง
นอกจากนี้คุณสามารถโต้แย้งได้อย่างง่ายดายว่ามีมากกว่าสองวิธี:
เพื่อนร่วมงานอาวุโสเมื่อเร็ว ๆ นี้เตือนผมว่า "คนจำนวนมากในการพูดคุยภาษาทั่วไปเกี่ยวกับ frequentist และคชกรรม. ผมคิดว่าความแตกต่างที่ถูกต้องมากขึ้นคือความน่าจะเป็นที่ใช้และ frequentist. ทั้งโอกาสสูงสุดและวิธีการแบบเบย์ยึดมั่นในหลักการความน่าจะเป็นในขณะที่วิธีการ frequentist ไม่ "
ฉันจะเริ่มต้นด้วยตัวอย่างการปฏิบัติที่ง่ายมาก:
ดังนั้นการทดสอบนั้นแม่นยำ 100% หรือแม่นยำ 95% ขึ้นอยู่กับว่าผู้ป่วยมีสุขภาพดีหรือไม่ดี เมื่อนำมารวมกันนั่นหมายความว่าการทดสอบนั้นมีความแม่นยำอย่างน้อย 95%
จนถึงตอนนี้ดีมาก เหล่านี้คือคำแถลงที่จะทำโดยผู้ใช้บ่อย ข้อความเหล่านั้นเข้าใจง่ายและเป็นจริง ไม่จำเป็นต้องวาฟเฟิลเกี่ยวกับ 'การตีความเป็นประจำ'
แต่สิ่งที่น่าสนใจเมื่อคุณพยายามหมุนสิ่งต่างๆ จากผลการทดสอบคุณเรียนรู้อะไรได้บ้างเกี่ยวกับสุขภาพของผู้ป่วย จากผลการทดสอบในเชิงลบผู้ป่วยมีสุขภาพที่ดีอย่างเห็นได้ชัดเนื่องจากไม่มีเชิงลบที่ผิดพลาด
แต่เราต้องพิจารณากรณีที่การทดสอบเป็นบวก การทดสอบเป็นผลบวกเพราะผู้ป่วยป่วยจริงหรือเป็นผลบวกปลอม? นี่คือที่ซึ่งนักประจำและ Bayesian แตกต่าง ทุกคนจะยอมรับว่าสิ่งนี้ไม่สามารถตอบได้ในขณะนี้ ผู้ที่พบบ่อยจะปฏิเสธที่จะตอบ Bayesian จะพร้อมที่จะให้คำตอบแก่คุณ แต่คุณจะต้องให้ Bayesian เป็นคนแรกก่อน - คือบอกสิ่งที่สัดส่วนของผู้ป่วยที่ป่วย
เมื่อต้องการสรุปข้อความต่อไปนี้เป็นจริง:
หากคุณพอใจกับข้อความเช่นนั้นแสดงว่าคุณกำลังใช้การตีความเป็นประจำ สิ่งนี้อาจเปลี่ยนจากโปรเจ็กต์เป็นโปรเจ็กต์ขึ้นอยู่กับปัญหาที่คุณกำลังดู
แต่คุณอาจต้องการที่จะทำให้งบที่แตกต่างและตอบคำถามต่อไปนี้:
สิ่งนี้ต้องการวิธีการแบบก่อนและแบบเบย์ โปรดทราบว่านี่เป็นเพียงคำถามเดียวที่น่าสนใจสำหรับแพทย์ แพทย์จะพูดว่า"ฉันรู้ว่าผู้ป่วยจะได้รับผลบวกหรือผลลบตอนนี้ฉันก็ว่าผลลัพธ์เชิงลบหมายถึงผู้ป่วยมีสุขภาพที่ดีและสามารถส่งกลับบ้านได้ ผลบวก - พวกเขาป่วยหรือเปล่า? "
ในการสรุป: ในตัวอย่างเช่นนี้ Bayesian จะเห็นด้วยกับทุกอย่างที่พูดบ่อยครั้ง แต่ Bayesian จะยืนยันว่าข้อความของผู้ใช้บ่อยในขณะที่ความจริงไม่มีประโยชน์มาก และจะยืนยันว่าคำถามที่มีประโยชน์สามารถตอบได้เฉพาะกับก่อน
นักความถี่จะพิจารณาแต่ละค่าที่เป็นไปได้ของพารามิเตอร์ (H หรือ S) และถามว่า "ถ้าพารามิเตอร์เท่ากับค่านี้ความน่าจะเป็นของการทดสอบของฉันคืออะไร?"
Bayesian จะพิจารณาแต่ละค่าที่สังเกตได้ที่เป็นไปได้ (+ หรือ -) ตามลำดับแล้วถามว่า "ถ้าฉันจินตนาการว่าฉันเพิ่งสังเกตเห็นคุณค่านั้น
For sick patients, the test is NOT very accurate.
คุณลืมสิ่งนั้นใช่ไหม
สถิติแบบเบย์และบ่อยครั้งเข้ากันได้กับสิ่งที่พวกเขาสามารถเข้าใจได้ว่าเป็นสองกรณีที่ จำกัด การประเมินความน่าจะเป็นของเหตุการณ์ในอนาคตจากเหตุการณ์ในอดีตและแบบจำลองที่สมมติขึ้นมาหากมีใครยอมรับว่า ระบบยังคงอยู่และในกรณีนี้การสังเกตจำนวนมากมีค่าเท่ากับการรู้ถึงพารามิเตอร์ของแบบจำลอง
สมมติว่าเราได้ทำการสังเกตการณ์บางอย่างเช่นผลลัพธ์ของการโยนเหรียญ 10 ครั้ง ในสถิติแบบเบย์คุณเริ่มจากสิ่งที่คุณสังเกตเห็นจากนั้นคุณประเมินความน่าจะเป็นของการสังเกตในอนาคตหรือพารามิเตอร์แบบจำลอง ในสถิติบ่อยครั้งคุณเริ่มต้นจากความคิด (สมมติฐาน) ของสิ่งที่เป็นจริงโดยสมมติว่าสถานการณ์ที่มีการสังเกตจำนวนมากที่เกิดขึ้นเช่นเหรียญไม่เอนเอียงและให้หัว 50% ถ้าคุณโยนมันหลายครั้ง จากสถานการณ์เหล่านี้ของการสังเกตจำนวนมาก (= สมมติฐาน) คุณประเมินความถี่ของการสังเกตเช่นเดียวกับที่คุณทำนั่นคือความถี่ของผลลัพธ์ที่แตกต่างกันของการโยนเหรียญ 10 ครั้ง เมื่อคุณนำผลลัพธ์ที่แท้จริงมาเปรียบเทียบกับความถี่ของผลลัพธ์ที่เป็นไปได้และตัดสินใจว่าผลลัพธ์นั้นเป็นของผลลัพธ์ที่คาดว่าจะเกิดขึ้นด้วยความถี่สูงหรือไม่ หากเป็นกรณีนี้คุณสรุปได้ว่าการสังเกตนั้นไม่ขัดแย้งกับสถานการณ์ของคุณ (= สมมุติฐาน) มิฉะนั้นคุณสรุปว่าการสังเกตที่ทำไม่สอดคล้องกับสถานการณ์ของคุณและคุณปฏิเสธสมมติฐาน
ดังนั้นสถิติแบบเบย์จึงเริ่มต้นจากสิ่งที่สังเกตและประเมินผลที่เป็นไปได้ในอนาคต สถิติผู้ใช้บ่อยเริ่มต้นด้วยการทดลองที่เป็นนามธรรมของสิ่งที่จะสังเกตได้ถ้ามีบางสิ่งบางอย่างและจากนั้นเปรียบเทียบผลลัพธ์ของการทดลองที่เป็นนามธรรมกับสิ่งที่สังเกตได้จริง มิฉะนั้นทั้งสองวิธีเข้ากันได้ พวกเขาทั้งสองประเมินความน่าจะเป็นของการสังเกตการณ์ในอนาคตโดยมีการสังเกตหรือตั้งสมมติฐานบางอย่าง
ฉันเริ่มเขียนสิ่งนี้ด้วยวิธีที่เป็นทางการมากขึ้น:
การวางตำแหน่งการอนุมานแบบเบย์เป็นแอปพลิเคชันเฉพาะของการอนุมานแบบบ่อยและในทางกลับกัน figshare
http://dx.doi.org/10.6084/m9.figshare.867707
ต้นฉบับเป็นของใหม่ หากคุณบังเอิญอ่านและมีความคิดเห็นโปรดแจ้งให้เราทราบ
ฉันจะบอกว่าพวกเขาดูความน่าจะเป็นในวิธีที่ต่างกัน Bayesian เป็นแบบอัตนัยและใช้ความเชื่อเบื้องต้นเพื่อกำหนดการกระจายความน่าจะเป็นก่อนหน้านี้ในค่าที่เป็นไปได้ของพารามิเตอร์ที่ไม่รู้จัก ดังนั้นเขาจึงอาศัยทฤษฎีความน่าจะเป็นเหมือนของ deFinetti ผู้ที่เห็นบ่อยครั้งน่าจะเป็นสิ่งที่เกี่ยวข้องกับความถี่ที่ จำกัด ตามสัดส่วนที่สังเกตได้ สอดคล้องกับทฤษฎีความน่าจะเป็นที่พัฒนาโดย Kolmogorov และ von Mises
ผู้ใช้บ่อยทำการอนุมานพารามิเตอร์โดยใช้ฟังก์ชันความน่าจะเป็น ชาวเบเซียนใช้สิ่งนั้นและทวีคูณโดยก่อนหน้าและปรับให้เป็นแบบปกติเพื่อรับการกระจายด้านหลังที่เขาใช้สำหรับการอนุมาน
วิธีที่ฉันตอบคำถามนี้คือผู้ใช้บ่อยเปรียบเทียบข้อมูลที่พวกเขาเห็นกับสิ่งที่พวกเขาคาดหวัง นั่นคือพวกเขามีแบบจำลองทางจิตว่ามีบางสิ่งเกิดขึ้นบ่อยเพียงใดจากนั้นดูข้อมูลและความถี่ที่เกิดขึ้น นั่นคือข้อมูลที่พวกเขาได้เห็นจากแบบจำลองที่พวกเขาเลือก
ในทางกลับกันคนเบย์รวมแบบจำลองทางจิตของพวกเขา นั่นคือพวกเขามีรูปแบบขึ้นอยู่กับประสบการณ์ของพวกเขาก่อนหน้านี้ที่บอกว่าสิ่งที่พวกเขาคิดว่าข้อมูลที่ควรมีลักษณะและแล้วพวกเขารวมนี้กับข้อมูลที่พวกเขาระวังที่จะชำระเมื่อบาง``หลัง '' ความเชื่อ นั่นคือพวกเขาพบความน่าจะเป็นที่โมเดลที่พวกเขาต้องการเลือกนั้นถูกต้องเมื่อข้อมูลที่พวกเขาสังเกตเห็น
ผู้พบบ่อย: สถานะที่แท้จริงของธรรมชาติคือ หากฉันวิเคราะห์แบบนี้เป็นประจำ 95% ของคำตอบของฉันจะถูกต้อง
Bayesian: มีโอกาส 95% ที่คำตอบที่แท้จริงคือ .... ฉันคิดจากการรวมกันของข้อมูลที่คุณให้ฉันและการคาดเดาก่อนหน้าของเราว่าความจริงคืออะไร
ผู้เล่นบ่อย: เดิมพันลูกเต๋า เฉพาะมูลค่าของลูกเต๋าที่จะตัดสินผล: คุณชนะเดิมพันหรือไม่ ขึ้นอยู่กับโอกาสคนเดียว
Bayesian: เล่น Texas Hold'em poker คุณเป็นคนเดียวที่เห็นไพ่สองใบของคุณ คุณมีความรู้เกี่ยวกับผู้เล่นคนอื่น ๆ บนโต๊ะ คุณต้องปรับความน่าจะเป็นของคุณให้ชนะในการฟลอพเทิร์นและริเวอร์และอาจเป็นไปตามผู้เล่นที่เหลือ พวกเขาป้านบ่อยไหม? พวกเขากำลังก้าวร้าวหรือผู้เล่นเรื่อย ๆ ? ทั้งหมดนี้จะเป็นตัวตัดสินว่าคุณทำอะไร ไม่เพียง แต่ความน่าจะเป็นของไพ่สองใบแรกที่คุณได้รับซึ่งจะเป็นตัวตัดสินว่าคุณจะชนะหรือไม่
ในการเล่นโป๊กเกอร์บ่อยครั้งจะหมายความว่าผู้เล่นทุกคนจะแสดงมือของเขาตั้งแต่แรกแล้วเดิมพันหรือหมอบก่อนไพ่ฟล็อพการ์ดเทิร์นและริเวอร์จะแสดง ตอนนี้มันขึ้นอยู่กับโอกาสอีกครั้งว่าคุณชนะหรือไม่
พูดถ้าคุณปวดหัวและไปพบแพทย์ สมมติว่าในการตัดสินใจของแพทย์มีสองสาเหตุสำหรับอาการปวดหัวอันดับ 1 สำหรับเนื้องอกในสมอง (สาเหตุที่ทำให้ปวดศีรษะ 99% ของเวลา) และ # 2 หวัด (สาเหตุซึ่งอาจสร้างอาการปวดหัวในผู้ป่วยน้อยมาก) .
ถ้าอย่างนั้นการตัดสินใจของแพทย์ตามแนวทางของผู้ใช้บ่อยคือคุณมีเนื้องอกในสมอง
การตัดสินใจของแพทย์ตามวิธี Bayesian จะบอกคุณว่าคุณเป็นหวัด (แม้ว่าจะมีเพียง 1% ของสาเหตุที่ทำให้ปวดหัว)
แมวตัวผู้และแมวตัวเมียจะถูกเขียนในห้องเหล็กพร้อมกับอาหารและน้ำให้เพียงพอเป็นเวลา 70 วัน
ผู้ใช้บ่อยบอกว่าระยะเวลาตั้งท้องโดยเฉลี่ยสำหรับfelinesคือ 66 วันตัวเมียอยู่ในความร้อนเมื่อแมวถูกเขียนขึ้นและเมื่ออยู่ในความร้อนเธอจะผสมพันธุ์ซ้ำเป็นเวลา 4 ถึง 7 วัน เนื่องจากมีแนวโน้มว่าจะมีการแพร่กระจายหลายครั้งและมีเวลาเพียงพอสำหรับการตั้งครรภ์ดังนั้นโอกาสที่จะเกิดขึ้นเมื่อเปิดกล่องในวันที่ 70 จึงมีลูกแมวเกิดใหม่
Bayesian จะพูดว่าฉันได้ยินมาร์วิน Gaye ที่ร้ายแรงมาจากกล่องในวันที่ 1 และจากนั้นเช้านี้ฉันได้ยินเสียงเหมือนลูกแมวจำนวนมากมาจากกล่อง ดังนั้นโดยไม่ต้องรู้มากเกี่ยวกับการสืบพันธุ์ของแมวโอกาสคือเมื่อเปิดกล่องในวันที่ 70 มีลูกแมวแรกเกิด