กรอบการเรียนรู้แบบเบย์ดีกว่าในการตีความอย่างไรเมื่อเรามักใช้นักบวชที่ไม่เป็นทางการหรือเป็นอัตนัย


18

มันมักจะเป็นที่ถกเถียงกันอยู่ว่ากรอบการทำงานแบบเบย์มีประโยชน์อย่างมากในการตีความ (มากกว่าบ่อยครั้ง) เพราะมันคำนวณความน่าจะเป็นของพารามิเตอร์ที่กำหนดข้อมูล -แทนใน กรอบบ่อย จนถึงตอนนี้ดีมากp(θ|x)p(x|θ)

แต่สมการทั้งหมดขึ้นอยู่กับ:

p(θ|x)=p(x|θ).p(θ)p(x)

ฉันสงสัยเล็กน้อยด้วยเหตุผล 2 ประการ:

  1. ในเอกสารจำนวนมากมีการใช้ตัวพิมพ์ใหญ่แบบปกติ (การแจกแจงแบบสม่ำเสมอ) และใช้เพียงแค่ดังนั้น Bayesians จะได้ผลลัพธ์เช่นเดียวกับผู้ที่ได้รับบ่อย การตีความเมื่อเบย์หลังและบ่อยครั้งความน่าจะเป็นการแจกแจงเดียวกันคืออะไร? มันให้ผลลัพธ์ที่เหมือนกันp(θ|x)=p(x|θ)

  2. เมื่อใช้ข้อมูลที่มีค่าคุณจะได้รับผลลัพธ์ที่แตกต่างกัน แต่ Bayesian ได้รับผลกระทบจากบุคคลก่อนดังนั้นทั้งหมดจึงมีสีแบบอัตนัยเช่นกันp(θ|x)

กล่าวอีกนัยหนึ่งการโต้แย้งทั้งหมดของดีกว่าในการตีความมากกว่าp (x | \ theta) ที่สร้างขึ้นบนสมมุติฐานว่าp (\ theta)เป็น "จริง" ชนิดซึ่งปกติไม่ใช่มัน เป็นเพียงจุดเริ่มต้นที่เราเลือกที่จะทำให้การเรียกใช้ MCMC เป็นข้อสันนิษฐาน แต่ไม่ใช่คำอธิบายของความเป็นจริง (มันไม่สามารถนิยามได้ฉันคิด)p(θ|x)p(x|θ)p(θ)

แล้วเราจะเถียงได้อย่างไรว่าชาวเบเซียนนั้นดีกว่าในการตีความ?


4
(1) ดูสงสัยเพราะข้อสรุปของมันไม่ถูกต้อง: ผลลัพธ์แบบเบย์กับนักบวชที่ไม่ชำนาญไม่จำเป็นต้องเหมือนกับข้อสรุปที่พบบ่อย ในความเป็นจริงในหลายกรณีดูเหมือนจะไม่มีข้อตกลงเกี่ยวกับสิ่งที่ "uninformative ก่อน" แม้จะเป็น! (2) ก็เป็นที่ถกเถียงกันเช่นกันเพราะโดยปริยายสันนิษฐานว่าการสันนิษฐานทุกครั้งในการวิเคราะห์บ่อยครั้งไม่ได้เป็นอัตนัย - แต่นั่นไม่ใช่กรณี ในที่สุดคุณหมายถึงอะไรโดย "ดีกว่าในการตีความ"? คำถามของคุณไม่ชัดเจนโดยไม่มีคำจำกัดความ
whuber

1
นอกจากความคิดเห็นของ whuber ที่ฉันต้องการจะพูดไม่มีเหตุผลทั่วไปว่าทำไม Bayes ดีกว่าผู้ใช้บ่อยดังนั้นจึงมีการโต้แย้ง บางครั้งเบย์ให้ผลลัพธ์ที่มีความหมายและบางครั้งวิธีที่ดีกว่า อย่างไรก็ตามในฟิลด์ที่นำมาใช้ไม่น่าจะมีเหตุผลว่าทำไมคนเราถึงได้ผลลัพธ์ที่แตกต่างกันมาก จากมุมมองทางปรัชญา Bayes นั้นแข็งแกร่ง แต่อย่างที่เรารู้ทฤษฎีและการปฏิบัติแตกต่างกันไปบางครั้งก็รุนแรง นอกจากนี้ฉันกังวลเล็กน้อยเกี่ยวกับย่อหน้าแรกของคุณ ดูเหมือนว่าคุณเป็นชาวเบย์ที่มีความมุ่งมั่น (ไม่มีอะไรผิดปกติกับมัน)
suncoolsu

ชื่อเรื่องไม่ควรเป็นuninformative or *objective* priorsอย่างไร subjectiveไพรเออร์จะตรงข้อมูลไพรเออร์
javadba

คำตอบ:


15

เพื่อให้การตอบสนองแคบลงกว่าความเป็นเลิศที่ได้รับการโพสต์ไปแล้วและมุ่งเน้นไปที่ความได้เปรียบในการตีความ - การตีความแบบเบย์ของ a, "95% ช่วงเวลาที่น่าเชื่อถือ" คือความน่าจะเป็นที่ค่าพารามิเตอร์ที่แท้จริง ช่วงเวลาเท่ากับ 95% หนึ่งในสองการตีความบ่อยๆของ a, "ช่วงความมั่นใจ 95%" แม้ว่าตัวเลขทั้งสองจะเหมือนกันคือในระยะยาวหากเราต้องดำเนินการหลาย ๆ ครั้งความถี่ที่ ช่วงเวลาจะครอบคลุมมูลค่าที่แท้จริงจะรวมกันเป็น 95% อดีตคือสัญชาตญาณไม่หลัง ลองอธิบายกับผู้จัดการบางครั้งคุณไม่สามารถพูดได้ว่า "ความน่าจะเป็นที่แผงเซลล์แสงอาทิตย์ของเราจะลดลงน้อยกว่า 20% ในช่วง 25 ปีคือ 95%" แต่ต้องบอกว่า "

การตีความบ่อยๆทางเลือกคือ "ก่อนที่ข้อมูลจะถูกสร้างขึ้นมีโอกาส 5% ที่ช่วงเวลาที่ฉันจะคำนวณโดยใช้ขั้นตอนที่ฉันตัดสินจะลดลงต่ำกว่าค่าพารามิเตอร์จริงทั้งหมดอย่างไรก็ตามตอนนี้เราได้รวบรวมข้อมูลแล้ว เราไม่สามารถสร้างข้อความใด ๆ ได้เพราะเราไม่ใช่ subjectivists และความน่าจะเป็นเป็น 0 หรือ 1 ขึ้นอยู่กับว่ามันทำหรือไม่อยู่ต่ำกว่าค่าพารามิเตอร์จริงทั้งหมด " นั่นจะช่วยให้ผู้ตรวจสอบบัญชีและเมื่อคำนวณเงินสำรองประกัน (จริง ๆ แล้วฉันพบว่าคำจำกัดความนี้สมเหตุสมผลแม้ว่าจะไม่ได้มีประโยชน์ แต่มันก็ไม่ง่ายที่จะเข้าใจโดยสังหรณ์ใจและโดยเฉพาะอย่างยิ่งถ้าคุณไม่ได้เป็นนักสถิติ)

การตีความเป็นประจำไม่สามารถหยั่งรู้ได้ เวอร์ชันเบย์คือ ดังนั้น "ข้อได้เปรียบที่สำคัญในการตีความ" ที่จัดขึ้นโดยวิธีการแบบเบย์


ปัญหาของฉันกับการต่อต้านการถกเถียงกันบ่อยครั้งคือมันพยายามมากเกินไปที่จะอธิบายขั้นตอนเป็นคำตอบ ลองทำแบบทดสอบด้วยตัวเองในการตีความ แต่เป็นข้อสรุปใดที่จะดึงออกมาจากผลลัพธ์ วิธีการที่คุณจะทำแตกต่างกันโดยขึ้นอยู่กับการได้ยินผลลัพธ์ที่ได้รับจากการเป็นประจำและ Bayesian? ในความเป็นจริงคุณจะยังคงทำตัวเหมือนเดิมเมื่อคุณเข้าใจทั้งสองอย่าง ไม่จำเป็นต้องไปที่ระดับของกระบวนการเพื่ออธิบายว่า "สิ่งที่ดีที่สุดคือการทำเช่นนั้นและอื่น ๆ ขึ้นอยู่กับความเชื่อมั่นที่ได้รับจากข้อมูล"
PascalVKooten

นอกจากนี้ตามคำนิยามคุณจะต้องอธิบายให้มากขึ้นในกรณีแบบเบย์เนื่องจากคุณไม่เพียงมี "สิ่งที่ข้อมูลบอกเรา" แต่ยังรวมถึงข้อมูลที่มีอยู่ก่อนหน้าด้วย! Bayesians มีแนวโน้มที่จะให้คำอธิบายบ่อยครั้งนาน แต่พวกเขาไม่ได้ไปอธิบายสิ่งที่พวกเขาเลือกก่อนทำไมพวกเขาเลือกก่อนและโดยเฉพาะว่าทำไมก่อน
PascalVKooten

ฉันจะไม่เห็นด้วยกับประเด็นสุดท้ายของคุณ ตัวอย่างเช่นเมื่อฉันทำการวิเคราะห์ความน่าเชื่อถือในอุปกรณ์ที่มีราคาแพงมากในงานก่อนหน้าของฉันเราปฏิบัติต่อผลลัพธ์ของการวิเคราะห์ความน่าเชื่อถือก่อนหน้านี้ของเราก่อนหน้านี้สำหรับอุปกรณ์ใหม่ของเราซึ่งมีขนาดลดลงในแง่ คำนึงถึงความไร้เสถียรภาพของโลกแห่งความเป็นจริงและการเปลี่ยนแปลงเล็กน้อยในการออกแบบ ฯลฯ และที่จริงแล้วสถิติแบบเบย์นั้นเกี่ยวกับการอัพเดตข้อมูลของคุณก่อน สถิติแบบคลาสสิกไม่ได้ "อัปเดต" ดังนั้นคุณจะได้รับผลลัพธ์ที่เหมือนกันหากก่อนหน้าของคุณแบน
jbowman

ฉันจะรวมชุดข้อมูลและทำการวิเคราะห์อื่น ... ไม่จำเป็นต้องมาก่อน ไม่ดีไปกว่าข้อมูลจริงก่อนหน้า: คุณได้รับข้อมูลหลัง "จริง"
PascalVKooten

ในกรณีของเราเนื่องจากการเปลี่ยนแปลงเล็กน้อยในการออกแบบอย่างต่อเนื่องและความรู้ของเราว่า mfg กระบวนการได้รับการพัฒนาเช่นกันทำให้เราไม่ได้ให้ข้อมูลก่อนหน้านี้สำหรับข้อมูลในอนาคต อาจมีข้อควรพิจารณาในขณะใช้งาน แต่ประเด็นของคุณคือสิ่งที่ดีสำหรับฉัน
jbowman

13

ในความคิดของฉันเหตุผลที่สถิติแบบเบย์นั้น "ดีกว่า" สำหรับการแทรกซึมนั้นไม่เกี่ยวข้องกับนักบวช แต่เป็นเพราะคำจำกัดความของความน่าจะเป็น คำจำกัดความของเบย์ (ความเป็นไปได้ที่สัมพันธ์กันกับความจริงของข้อเสนอบางอย่าง) นั้นมีความใกล้ชิดกับการใช้คำในชีวิตประจำวันมากกว่าคำจำกัดความที่ใช้บ่อย (ความถี่ในระยะยาวซึ่งมีบางอย่างเกิดขึ้น) ในสถานการณ์ที่ใช้งานได้จริงส่วนใหญ่คือสิ่งที่เราต้องการรู้ไม่ใช่p ( x | θ )และความยากลำบากเกิดขึ้นกับสถิติบ่อยครั้งเนื่องจากมีแนวโน้มที่จะตีความผลลัพธ์ในการคำนวณแบบประ Bayesian one, pp(θ|x)p(x|θ)ราวกับว่ามันเป็น p ( θ | x ) (ตัวอย่างเช่นการเข้าใจผิดของ p-value หรือตีความช่วงความเชื่อมั่นราวกับว่ามันเป็นช่วงเวลาที่น่าเชื่อถือ)p(x|θ)p(θ|x)

โปรดทราบว่านักบวชที่ให้ข้อมูลไม่จำเป็นต้องเป็นอัตนัยเช่นฉันจะไม่พิจารณาความรู้เชิงอัตนัยเพื่อยืนยันว่าความรู้ก่อนหน้าของระบบทางกายภาพบางอย่างควรเป็นอิสระจากหน่วยการวัด (ตามที่พวกเขาเป็นหลัก) และนักบวช "ที่ให้ข้อมูลน้อยที่สุด"

ด้านพลิกของการเพิกเฉยความรู้แบบอัตนัยก็คือระบบของคุณอาจย่อยได้ดีที่สุดเพราะคุณเพิกเฉยต่อความรู้จากผู้เชี่ยวชาญดังนั้นผู้กระทำจึงไม่จำเป็นต้องเป็นเรื่องเลวร้าย ยกตัวอย่างเช่นในปัญหา "อนุมานความลำเอียงของเหรียญ" ซึ่งมักใช้เป็นตัวอย่างที่สร้างแรงบันดาลใจคุณจะเรียนรู้อย่างช้าๆด้วยเครื่องแบบก่อนที่ข้อมูลจะเข้ามา แต่ความเอนเอียงทั้งหมดมีความเท่าเทียมกันมาก ไม่มันเป็นเรื่องง่ายที่จะทำเหรียญลำเอียงเล็กน้อยหรือเหรียญที่มีอคติอย่างสมบูรณ์ (สองหัวหรือสองครั้ง) ดังนั้นถ้าเราสร้างการสันนิษฐานนั้นในการวิเคราะห์ของเราผ่านทางทัศนะส่วนตัวเราจะต้องใช้ข้อมูลน้อยลงเพื่อระบุว่า อคติที่แท้จริงคือ

การวิเคราะห์บ่อยครั้งยังมีองค์ประกอบส่วนตัว (ตัวอย่างเช่นการตัดสินใจที่จะปฏิเสธสมมติฐานว่างถ้า p-value น้อยกว่า 0.05 ไม่มีการบังคับตรรกะที่จะทำเช่นนั้นมันเป็นเพียงประเพณีที่พิสูจน์แล้วว่ามีประโยชน์) ข้อได้เปรียบของวิธีการแบบเบย์คือการที่ผู้กระทำมีความชัดเจนในการคำนวณแทนที่จะทิ้งไว้โดยปริยาย

ในตอนท้ายของวันมันเป็นเรื่องของ "ม้าสำหรับหลักสูตร" คุณควรมีเครื่องมือทั้งสองชุดในกล่องเครื่องมือของคุณและเตรียมพร้อมที่จะใช้เครื่องมือที่ดีที่สุดสำหรับงานที่ทำอยู่


6

กรอบการทำงานแบบเบย์มีข้อได้เปรียบอย่างใหญ่หลวงต่อผู้ใช้บ่อยเพราะไม่ได้ขึ้นอยู่กับการมี "ลูกบอลคริสตัล" ในแง่ของการรู้ถึงสมมติฐานการกระจายที่ถูกต้อง วิธีการแบบเบย์นั้นขึ้นอยู่กับการใช้ข้อมูลที่คุณมีและการรู้วิธีเข้ารหัสข้อมูลนั้นลงในการแจกแจงความน่าจะเป็น

การใช้วิธีการแบบเบย์นั้นใช้ทฤษฎีความน่าจะเป็นในการใช้พลังงานอย่างเต็มที่ ทฤษฎีบทของเบย์ไม่ได้เป็นเพียงการกล่าวถึงกฎความน่าจะเป็นแบบคลาสสิกของผลิตภัณฑ์ใหม่:

p(θx|I)=p(θ|I)p(x|θI)=p(x|I)p(θ|xI)

p(x|I)0I

ทีนี้ถ้าคุณคิดว่าทฤษฎีบทของเบย์นั้นเป็นที่ต้องสงสัยก็มีเหตุมีผลคุณต้องคิดด้วยว่ากฎของผลิตภัณฑ์ก็เป็นที่น่าสงสัยเช่นกัน คุณสามารถหาอาร์กิวเมนต์การหักทอนได้ที่นี่ซึ่งได้มาจากกฎเกณฑ์ของผลิตภัณฑ์และผลรวมคล้ายกับทฤษฎีบทของ Cox รายการที่ชัดเจนมากขึ้นของสมมติฐานที่จำเป็นสามารถพบได้ที่นี่

เท่าที่ฉันรู้การอนุมานเป็นประจำไม่ได้ขึ้นอยู่กับชุดของมูลนิธิภายในกรอบตรรกะ เนื่องจากมันใช้สัจพจน์ของความน่าจะเป็น Kolmogorov ดูเหมือนจะไม่มีการเชื่อมต่อใด ๆ ระหว่างทฤษฎีความน่าจะเป็นและการอนุมานเชิงสถิติ ไม่มีสัจพจน์ใด ๆ สำหรับการอนุมานบ่อยซึ่งนำไปสู่ขั้นตอนที่จะต้องปฏิบัติตาม มีหลักการและวิธีการ (โอกาสสูงสุดช่วงความเชื่อมั่นค่า p ฯลฯ ) และพวกเขาทำงานได้ดี แต่พวกเขามักจะแยกและเชี่ยวชาญกับปัญหาเฉพาะ ฉันคิดว่าวิธีการที่ใช้บ่อยเป็นสิ่งที่ชัดเจนที่สุดในรากฐานของพวกเขาอย่างน้อยก็ในแง่ของกรอบทางตรรกะที่เข้มงวด

1θ

2

การใช้เครื่องแบบก่อนหน้านั้นมักจะเป็นการประมาณที่สะดวกที่จะทำเมื่อมีโอกาสเกิดความคมชัดเมื่อเปรียบเทียบกับรุ่นก่อน บางครั้งมันก็ไม่คุ้มค่ากับความพยายามในการผ่านและตั้งค่าอย่างเหมาะสมก่อน ในทำนองเดียวกันอย่าทำผิดพลาดในการทำให้สถิติเบย์แบบสับสนกับ MCMC MCMC เป็นเพียงอัลกอริทึมสำหรับการรวมเช่นเดียวกับ guassian quadratre และในชั้นเรียนที่คล้ายกับการประมาณ Laplace มันมีประโยชน์มากกว่า quadratre เล็กน้อยเพราะคุณสามารถใช้เอาต์พุตของอัลกอริทึมเพื่อทำอินทิกรัลทั้งหมดของคุณ (วิธีหลังและความแปรปรวนเป็นอินทิกรัล) และทั่วไปมากขึ้นที่ Laplace เพราะคุณไม่ต้องการตัวอย่างขนาดใหญ่หรือ ยอดเขาโค้งมนในด้านหลัง (Laplace นั้นเร็วกว่า)


3

μ=0) วางไว้เหนือสัมประสิทธิ์การถดถอยเข้ารหัสความรู้ว่าทุกสิ่งเท่าเทียมกันเราต้องการทางออกที่สัมประสิทธิ์มีขนาดต่ำกว่า นี่คือการหลีกเลี่ยงการสร้างชุดข้อมูลมากเกินไปโดยการหาวิธีแก้ปัญหาที่เพิ่มฟังก์ชั่นวัตถุประสงค์ แต่ไม่เหมาะสมในบริบทเฉพาะของปัญหาของเรา เรียกอีกอย่างหนึ่งว่าพวกเขามีวิธีที่จะให้แบบจำลองทางสถิติบางอย่างเกี่ยวกับ "ปม" เกี่ยวกับโดเมนเฉพาะ

อย่างไรก็ตามนี่ไม่ใช่สิ่งที่สำคัญที่สุดของวิธีการแบบเบย์ วิธีการแบบเบย์มีกำเนิดในที่พวกเขาให้ "เรื่องราว" ที่สมบูรณ์สำหรับวิธีการที่ข้อมูลเข้ามาอยู่ ดังนั้นพวกเขาจึงไม่ได้เป็นเพียงผู้หารูปแบบ แต่พวกเขาสามารถคำนึงถึงความเป็นจริงของสถานการณ์ในมือ ตัวอย่างเช่นลองใช้ LDA (การปันส่วน Dirichlet แฝง) ซึ่งให้เรื่องราวที่สมบูรณ์เกี่ยวกับการจัดทำเอกสารข้อความซึ่งจะมีลักษณะดังนี้:

  1. เลือกหัวข้อที่หลากหลายตามความน่าจะเป็นของหัวข้อที่เกิดขึ้น และ
  2. เลือกชุดคำศัพท์จากคำศัพท์ตามเงื่อนไขที่เลือก

ดังนั้นแบบจำลองจึงเหมาะสมกับความเข้าใจที่เฉพาะเจาะจงของวัตถุในโดเมน (ที่นี่เอกสารข้อความ) และวิธีการสร้าง ดังนั้นข้อมูลที่เราได้รับกลับจะถูกปรับให้ตรงกับโดเมนปัญหาของเรา (ความน่าจะเป็นของคำที่ให้หัวข้อหัวข้อความน่าจะเป็นของหัวข้อที่ถูกพูดถึงกันความน่าจะเป็นของเอกสารที่มีหัวข้อและขอบเขตอื่น ๆ ) ความจริงที่ว่าทฤษฎีบทของเบย์จำเป็นต้องทำเช่นนี้เกือบจะเป็นเรื่องรองดังนั้นเรื่องตลกเล็ก ๆ น้อย ๆ "เบย์คงไม่ใช่เบย์และพระคริสต์ก็ไม่ได้เป็นคริสเตียน"

ในระยะสั้นแบบจำลองแบบเบย์ทั้งหมดเกี่ยวกับการสร้างแบบจำลองวัตถุโดเมนอย่างจริงจังโดยใช้การแจกแจงความน่าจะเป็น ดังนั้นเราสามารถเข้ารหัสความรู้ที่ไม่สามารถใช้เทคนิคการจำแนกแบบง่าย ๆ ได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.