เมื่อใด (ถ้าเคย) เป็นวิธีการที่ใช้บ่อยดีกว่า Bayesian อย่างมาก?


72

ความเป็นมา : ฉันไม่มีการฝึกอบรมอย่างเป็นทางการในสถิติแบบเบย์ (แม้ว่าฉันสนใจที่จะเรียนรู้มากขึ้น) แต่ฉันรู้เพียงพอ - ฉันคิดว่า - ฉันจะได้รับส่วนสำคัญว่าทำไมหลายคนรู้สึกราวกับว่าพวกเขาเป็นที่นิยมมากกว่า แม้แต่นักศึกษาระดับปริญญาตรีในวิชาสถิติเบื้องต้น (ในสังคมศาสตร์) ชั้นที่ฉันกำลังสอนก็พบว่าวิธีการแบบเบส์ดึงดูดความสนใจ - "ทำไมเราถึงสนใจคำนวณความน่าจะเป็นของข้อมูลให้เป็นโมฆะเพราะเหตุใด สมมติฐานว่างเปล่าหรือสมมุติฐานทางเลือกและฉันยังได้อ่านหัวข้อเช่นนี้ซึ่งยืนยันถึงผลประโยชน์เชิงประจักษ์ของสถิติแบบเบย์ด้วยเช่นกัน แต่จากนั้นฉันก็ได้พบกับคำกล่าวของ Blasco (2001;

หากผู้เพาะพันธุ์สัตว์ไม่สนใจปัญหาเชิงปรัชญาที่เกี่ยวข้องกับการชักนำ แต่ในเครื่องมือที่ใช้ในการแก้ปัญหาโรงเรียนเบส์เซียนและโรงเรียนที่มีการอนุมานเป็นประจำได้รับการจัดตั้งขึ้นมาอย่างดีและไม่จำเป็นต้องพิสูจน์ว่าทำไมโรงเรียนแห่งใดแห่งหนึ่ง ไม่ใช่ของพวกเขาในขณะนี้มีความยากลำบากในการปฏิบัติงานยกเว้นกรณีที่ซับซ้อนบางอย่าง ... ในการเลือกโรงเรียนหนึ่งหรืออื่น ๆ ควรจะเกี่ยวข้องกับว่ามีการแก้ปัญหาในโรงเรียนหนึ่งที่อื่น ๆ ที่ไม่ได้นำเสนอถึงวิธีการได้อย่างง่ายดายปัญหาจะแก้ไขได้ และเพื่อความสะดวกสบายของนักวิทยาศาสตร์ที่รู้สึกด้วยวิธีการแสดงออกโดยเฉพาะ

คำถาม : คำพูดของ Blasco ดูเหมือนว่าจะแนะนำว่าอาจมีบางครั้งที่วิธีการใช้ชีวิตประจำวันเป็นวิธีที่ดีกว่า Bayesian และฉันก็อยากรู้อยากเห็น: เมื่อไรที่วิธีการของนักเล่นแร่แปรธาตุจะดีกว่าการเข้าใกล้แบบเบย์? ฉันสนใจในคำตอบที่จัดการกับคำถามทั้งแนวความคิด (เช่นเมื่อทราบถึงความน่าจะเป็นของข้อมูลที่ตั้งอยู่บนสมมติฐานว่างเปล่าโดยเฉพาะอย่างยิ่งมีประโยชน์หรือไม่) และสังเกตุ (เช่นภายใต้เงื่อนไขว่า

มันจะดีกว่าถ้าคำตอบถูกสื่อถึงความเป็นไปได้ - มันดีที่จะตอบกลับไปที่ชั้นเรียนของฉันเพื่อแบ่งปันกับนักเรียนของฉัน

ในที่สุดแม้ว่าจะเป็นผู้ใช้สถิติของผู้ใช้บ่อย แต่ฉันก็เปิดกว้างต่อความเป็นไปได้ที่ Bayesian เพิ่งจะชนะในกระดาน


10
เมื่อคุณจัดการกับความน่าจะเป็นเป้าหมายคือกระบวนการสุ่มตามธรรมชาติ ตัวอย่างเช่นการสลายตัวของสารกัมมันตรังสีไม่เกี่ยวข้องกับความเชื่อส่วนตัวของคุณหรือข้อมูลที่ไม่รู้จักหรือสิ่งอื่นใด มันไปตามจังหวะของมันเองและอะตอมก็สลายตัวแบบสุ่ม
Aksakal

6
ดูคำถามที่ผ่านมานี้ว่าโชคร้ายจบลงด้วยการปิดเป็นกว้างเกินไป (ผมลงคะแนนจะเปิด แต่มันไม่เคยเป็น): stats.stackexchange.com/questions/192572 คุณกำลังถามในสิ่งเดียวกัน ตรวจสอบคำตอบที่นั่น
อะมีบา

5
@ Aksakal: ฉันชอบที่จะมีการสนทนานี้ แต่มันเป็นเรื่องนอกและเราจะได้รับการบอกกล่าวดังนั้นฉันจึงปิด (และคำนวณ)
อะมีบา

12
"Bayesians ตอบคำถามที่ทุกคนสนใจโดยใช้สมมติฐานที่ไม่มีใครเชื่อในขณะที่ผู้ใช้บ่อยใช้ตรรกะไร้ที่ติเพื่อจัดการกับปัญหาที่ไม่สนใจใคร" - Louis Lyons
Ruggero Turra

4
@jsakaluk สังเกตว่าฐานที่มั่นของ Bayesians เป็นพื้นที่ที่มีข้อมูลไม่เพียงพอหรือเมื่อกระบวนการไม่เสถียรเช่นสังคมศาสตร์วิทยาศาสตร์ psudo วิทยาศาสตร์เพื่อชีวิต ฯลฯ ไม่จำเป็นต้องเป็น Bayesian ในกลศาสตร์ควอนตัมหรือฟิสิกส์ส่วนใหญ่ จริงอยู่ที่คุณสามารถเป็นแบบเบย์ที่นั่นเช่นกันมันเป็นเพียงการอนุมานของคุณจะไม่แตกต่างจากนักกิจกรรมประจำ
Aksakal

คำตอบ:


54

ต่อไปนี้เป็นเหตุผลห้าประการที่อาจทำให้วิธีการของผู้ใช้บ่อยขึ้น

  • ได้เร็วขึ้น เนื่องจากสถิติของ Bayesian นั้นให้คำตอบที่เหมือนกันเกือบทุกคำตอบ (และเมื่อพวกเขาไม่ทำมันก็ไม่ชัดเจน 100% ว่า Bayesian นั้นเป็นวิธีที่จะไปเสมอ ) ความจริงที่ว่าสถิติที่ได้รับบ่อยๆ อาร์กิวเมนต์ที่แข็งแกร่ง ในทำนองเดียวกันวิธีการที่ใช้บ่อยไม่ต้องการหน่วยความจำมากพอที่จะเก็บผลลัพธ์ แม้ว่าสิ่งเหล่านี้อาจดูเล็กน้อยโดยเฉพาะอย่างยิ่งกับชุดข้อมูลขนาดเล็กความจริงที่ว่า Bayesian และ Frequentist โดยทั่วไปเห็นด้วยในผลลัพธ์ (โดยเฉพาะถ้าคุณมีข้อมูลจำนวนมาก) หมายความว่าถ้าคุณจะดูแลคุณอาจเริ่มสนใจน้อย สิ่ง และแน่นอนถ้าคุณอาศัยอยู่ในโลกข้อมูลขนาดใหญ่สิ่งเหล่านี้ก็ไม่ได้สำคัญอะไรเลย

  • สถิติที่ไม่ใช่พารามิเตอร์ ฉันรับรู้ว่าสถิติแบบเบย์มีสถิติที่ไม่ใช่พารามิเตอร์ แต่ฉันขอยืนยันว่าด้านความถี่ของสนามมีเครื่องมือที่ใช้งานได้จริงอย่างปฏิเสธไม่ได้เช่นฟังก์ชันการกระจายเชิงประจักษ์ ไม่มีวิธีใดในโลกที่จะเข้ามาแทนที่ EDF หรือ Kaplan Meier curves เป็นต้น (แม้ว่าจะไม่ชัดเจนว่าวิธีการเหล่านี้เป็นจุดสิ้นสุดของการวิเคราะห์)

  • การวินิจฉัยน้อยลง วิธีการ MCMC ซึ่งเป็นวิธีที่พบมากที่สุดสำหรับการปรับแบบจำลองแบบเบย์โดยทั่วไปแล้วผู้ใช้ต้องการการทำงานมากกว่าชิ้นส่วนที่ใช้เป็นประจำ โดยทั่วไปแล้วการวินิจฉัยสำหรับการประเมิน MLE นั้นง่ายมากที่การใช้อัลกอริทึมที่ดีจะดำเนินการโดยอัตโนมัติ ด้วยเหตุนี้การวินิจฉัยอัลกอริทึมแบบบ่อยครั้งจึงเป็น "ทำให้แน่ใจว่าไม่มีข้อความสีแดงเมื่อใส่โมเดล" เนื่องจากนักสถิติทุกคนมีแบนด์วิดท์ที่ จำกัด สิ่งนี้ทำให้มีเวลามากขึ้นในการถามคำถามเช่น "ข้อมูลของฉันปกติจริงหรือไม่" หรือ "อันตรายเหล่านี้มีสัดส่วนจริงเหรอ?" ฯลฯ

  • การอนุมานที่ถูกต้องภายใต้การสะกดผิดโมเดล เราทุกคนเคยได้ยินว่า "ทุกรุ่นผิด แต่มีประโยชน์" แต่งานวิจัยที่แตกต่างกันก็ให้ความสำคัญกับเรื่องนี้ไม่มากก็น้อย วรรณกรรมบ่อย ๆ เต็มไปด้วยวิธีการแก้ไขข้อสรุปเมื่อแบบจำลอง misspecified: bootstrap ประมาณการตรวจสอบข้าม - การประเมินแซนวิช (ลิงก์ยังอธิบายถึงการอนุมาน MLE ทั่วไปภายใต้แบบจำลอง misspecification) สมการการประเมินทั่วไป (GEE's) เป็นต้นเท่าที่ฉันรู้มีน้อยมากในวรรณกรรม Bayesian เกี่ยวกับการอนุมานภายใต้การสะกดผิดโมเดล (แม้ว่าจะมีการถกเถียงกันอย่างมากเกี่ยวกับการตรวจสอบรูปแบบเช่น ฉันไม่คิดว่าเป็นเรื่องบังเอิญ: การประเมินว่าตัวประมาณทำงานอย่างไรกับการทดลองซ้ำ ๆ ไม่ต้องการให้ตัวประมาณขึ้นอยู่กับแบบจำลอง "ของจริง" แต่ใช้ทฤษฎีบทของเบย์

  • อิสรภาพจากเมื่อก่อน (นี่อาจเป็นสาเหตุที่พบได้บ่อยที่สุดว่าทำไมผู้คนถึงไม่ใช้วิธีการแบบเบย์สำหรับทุกสิ่ง) จุดแข็งของมุมมองแบบเบย์มักจะถูกขนานนามว่าเป็นการใช้ของนักบวช อย่างไรก็ตามในทุกสาขาที่ฉันได้ลงมือทำไปแล้วความคิดเกี่ยวกับข้อมูลก่อนการวิเคราะห์จะไม่ถูกนำมาพิจารณา การอ่านวรรณกรรมเกี่ยวกับวิธีการชักชวนนักบวชจากผู้เชี่ยวชาญที่ไม่ใช่เชิงสถิติให้เหตุผลที่ดีสำหรับเรื่องนี้ ฉันได้อ่านเอกสารที่พูดถึงสิ่งต่าง ๆ เช่น (คนฟางโหดร้ายเช่นการถอดความของตัวเอง) "ถามนักวิจัยที่จ้างคุณเพราะพวกเขามีปัญหาในการทำความเข้าใจสถิติเพื่อให้ช่วงที่พวกเขาแน่ใจ 90% ขนาดผลที่พวกเขามีปัญหา โดยทั่วไปช่วงนี้จะแคบเกินไปดังนั้นลองเพิ่มพวกเขาโดยพลการเล็กน้อยลองถามพวกเขาว่าความเชื่อของพวกเขาดูเหมือนการกระจายแกมม่าหรือไม่ คุณอาจต้องวาดการแจกแจงแกมม่าสำหรับพวกมันและแสดงให้เห็นว่ามันมีหางที่หนาได้อย่างไรถ้าพารามิเตอร์รูปร่างมีขนาดเล็ก สิ่งนี้จะเกี่ยวข้องกับการอธิบายสิ่งที่เป็น PDF สำหรับพวกเขาด้วย "(หมายเหตุ: ฉันไม่คิดว่าแม้แต่นักสถิติก็สามารถพูดได้อย่างแม่นยำเบื้องต้นไม่ว่าจะเป็น 90% หรือ 95% แน่นอนว่าขนาดของเอฟเฟกต์อยู่ในช่วงหรือไม่และความแตกต่างนี้อาจมีผลอย่างมากต่อการวิเคราะห์!) ความจริงได้รับการบอกว่าฉันค่อนข้างไร้ความปรานีและอาจมีสถานการณ์ที่ทำให้เกิดความสงสัยก่อนหน้าอาจตรงไปตรงมามากกว่านี้ แต่คุณจะเห็นได้ว่านี่เป็นเวิร์มของกระป๋องได้อย่างไร แม้ว่าคุณจะเปลี่ยนไปใช้นักบวชที่ไม่ให้ข้อมูล แต่ก็ยังคงเป็นปัญหาอยู่ เมื่อเปลี่ยนพารามิเตอร์สิ่งที่เข้าใจผิดได้ง่ายสำหรับนักบวชที่ไม่ให้ข้อมูลก็สามารถเห็นได้ว่าเป็นข้อมูลมาก! ตัวอย่างนี้ก็คือการที่ผมได้พูดคุยกับนักวิจัยหลายคนที่มุ่งมั่นจะทำไม่ได้ต้องการฟังว่าการตีความข้อมูลของผู้เชี่ยวชาญคนอื่นเป็นอย่างไรเนื่องจากสังเกตุผู้เชี่ยวชาญอื่น ๆ มักจะมีความมั่นใจมากกว่า พวกเขาต้องการเพียงแค่รู้ว่าสิ่งใดที่สามารถอนุมานได้จากข้อมูลของผู้เชี่ยวชาญคนอื่น ๆ และจากนั้นก็มาถึงข้อสรุปของพวกเขาเอง ฉันจำไม่ได้ว่าได้ยินที่ไหน แต่ฉันอ่านวลีที่ "ถ้าคุณเป็นชาวเบย์คุณต้องการให้ทุกคนเป็นผู้ใช้ประจำ" ฉันตีความว่าจะหมายความว่าในทางทฤษฎีถ้าคุณเป็นคนเบย์และมีคนอธิบายผลการวิเคราะห์ของพวกเขาคุณควรพยายามที่จะกำจัดอิทธิพลของพวกเขาก่อนแล้วคิดออกว่าผลกระทบจะเป็นอย่างไรถ้าคุณใช้ของคุณเอง แบบฝึกหัดเล็ก ๆ นี้จะง่ายขึ้นถ้าพวกเขาให้ช่วงความมั่นใจกับคุณมากกว่าช่วงเวลาที่น่าเชื่อถือ!

แน่นอนถ้าคุณละทิ้งนักบวชที่มีข้อมูลยังมีประโยชน์ในการวิเคราะห์แบบเบย์ โดยส่วนตัวฉันเชื่อว่าสิ่งนี้เป็นประโยชน์สูงสุดของพวกเขา มีปัญหาบางอย่างที่ยากมากในการรับคำตอบจากการใช้วิธี MLE แต่สามารถแก้ไขได้อย่างง่ายดายด้วย MCMC แต่มุมมองของฉันเกี่ยวกับการเป็นยูทิลิตี้ที่สูงที่สุดของ Bayesian นั้นเกิดจากนักบวชที่แข็งแกร่งในส่วนของฉันดังนั้นเอาเกลือเม็ดหนึ่งไปด้วย


1
(+1) คำตอบที่ดีแม้ว่าฉันคิดว่าคุณหมายถึงไม่ต้องการหน่วยความจำมากในการจัดเก็บผลลัพธ์หรือไม่
jsakaluk

1
ในแง่ของอิสรภาพจากนักบวช: คุณกำลังบอกว่าน้อยกว่าที่คุณต้องคิดและเข้าใจปัญหาของคุณดีขึ้นหรือไม่ ฉันรู้จักผู้จำหน่ายซอฟต์แวร์หลายรายที่ต้องการคุยกับคุณเพื่อให้คุณสามารถชี้ไปที่ - หรือดีกว่าเพียงคลิกเดียว - และมีคำตอบสำหรับปัญหาใด ๆ ที่คุณสามารถจินตนาการ! Heck คุณไม่จำเป็นต้องมีปัญหาเพียงแค่ดึงข้อมูลของคุณไปยังเว็บไซต์ของพวกเขาและพวกเขาจะพบปัญหาที่เป็นไปได้ทั้งหมดและแก้ปัญหาพวกเขาตุ๊ด! (ขออภัยไม่สามารถต้านทานการตอบด้วยความคิดเห็นที่เหมือนมนุษย์ฟางที่โหดร้าย)
Wayne

1
@ Wayne: ฉันรู้ว่าคุณล้อเล่น แต่นั่นถูกต้อง 100% สถิติเป็นเครื่องมือสำหรับตอบปัญหาโลกแห่งความจริง ฉันต้องการเน้นว่ามันเป็นเครื่องมือไม่ใช่ผลิตภัณฑ์ขั้นสุดท้าย โดยไม่คำนึงถึงสิ่งที่ด้านของการถกเถียงอาร์กิวเมนต์ "Frequentist vs Bayesian" อย่างถี่ถ้วน (ฉันนั่งบน "แล้วแต่จำนวนใดจะให้คำตอบที่ดีที่สุดสำหรับคำถามของฉัน" ด้านซึ่งหมายความว่าฉันชอบทั้งสองสำหรับปัญหาที่แตกต่างกัน) ไม่มีการโต้เถียงว่า ยูทิลิตี้ที่แท้จริงมากสำหรับเครื่องมือใด ๆ
หน้าผา AB

แน่นอนหากเครื่องมือของคุณมักจะผลิตผลิตภัณฑ์ที่น่ากลัวนั่นเป็นปัญหา และถ้าฉันมั่นใจว่าวิธีการแบบประจำกำลังทำสิ่งนี้อยู่ แต่วิธีการแบบเบย์ไม่ได้ฉันจะรับรองวิธีการแบบเบย์อย่างรวดเร็ว
หน้าผา AB

1
@CliffAB: การใช้งานง่ายเป็นสิ่งสำคัญและอย่างที่คุณบอกว่าถ้าผลลัพธ์มีคุณภาพเท่ากันทำไมต้องเลือกใช้งานยากกว่า ในขณะเดียวกันการคิดทำให้ชัดเจนและทำความเข้าใจกับนักบวช (ไม่ใช่ Bayesian ผมหมายถึงนักบวชที่นักวิทยาศาสตร์ทุกคนทุกแขนงและทุกการศึกษามีความสำคัญ) ต่อวิทยาศาสตร์ที่ดี สถิติแบบเบย์มีความชัดเจนและบังคับให้คุณคิดและเข้าใจปัญหาเหล่านี้ ในกรณีที่นี่ไม่ได้เป็นเพียงความไม่สะดวกทางกายเท่านั้นมันยังเป็นเนื้อหาที่ดีและดังนั้นสิ่งที่ตรงกันข้ามก็ไม่ได้ดีเช่นกัน
Wayne

23

ข้อได้เปรียบบางประการของสถิติผู้ใช้บ่อย:

  • มักจะมีวิธีแก้ปัญหาแบบปิดเพื่อแก้ไขปัญหาที่พบบ่อยในขณะที่คุณต้องการคอนจูเกตก่อนที่จะมีวิธีแก้ปัญหาแบบปิดในอะนาล็อกเบย์ สิ่งนี้มีประโยชน์สำหรับหลายสาเหตุ - หนึ่งในนั้นคือเวลาการคำนวณ
  • เหตุผลที่หวังว่าในที่สุดก็จะหายไป: ฆราวาสได้รับการสอนสถิติบ่อยครั้ง หากคุณต้องการที่จะเข้าใจหลายคนคุณต้องพูดบ่อยๆ
  • วิธีการ "ไร้เดียงสาจนพิสูจน์ได้ว่ามีความผิด" แนวทางการทดสอบความหมายของ Null Hypothesis Significance Testing (NHST) มีประโยชน์เมื่อเป้าหมายคือการพิสูจน์คนผิด (ฉันจะถือว่าสิทธิ์ของคุณและแสดงให้เห็นว่า ใช่มี NHST analogues อยู่ใน Bayesian แต่ฉันพบว่าเวอร์ชันบ่อยขึ้นตรงไปตรงมาและสามารถตีความได้มากขึ้น
  • นอกจากนี้ไม่มีสิ่งดังกล่าวเป็นอย่างแท้จริง uninformative ก่อนซึ่งทำให้บางคนรู้สึกไม่สบายใจ

1
(+1) ขอบคุณ - คุณช่วยอธิบายจุดแรกให้หน่อยได้ไหม? ในฐานะที่เป็นคนที่ไม่ชำนาญใน Bayesian จุดที่คุณทำเกี่ยวกับความจำเป็นในการ "ผันก่อน" (?) จะแพ้ฉันเล็กน้อย ...
jsakaluk

5
ฉันไม่คิดว่าคุณกำลังตีความการทดสอบสมมติฐานอย่างถูกต้อง คุณเพียงแค่ให้แต่ p-value เป็นจริงH_0) การตีความที่ถูกต้องของค่า p: ให้เป็นโมฆะมีเพียง % โอกาสที่จะได้ผลลัพธ์ที่รุนแรงหรือสุดขั้วจากนั้นก็สังเกตได้ การตีความที่ผิดนี้เกิดขึ้นบ่อยครั้งเมื่อมีการโต้เถียงกันสำหรับแนวทางแบบเบย์ นอกจากนั้นฉันชอบคำตอบของคุณ P(H0|Data)P(Data|H0)α
Zachary Blumenfeld

@ ZacharyBlumenfeld ขอบคุณที่ชี้ให้เห็นว่าฉันมี Bayesian ในใจของฉัน ฉันจะแก้ไขได้ทันที
TrynnaDoStat

1
@jsakaluk หากด้านหลังและรุ่นก่อนหน้ามีการกระจายตัวเหมือนกันก่อนหน้านี้จะถูกรวมเข้าด้วยกัน - รับประกันรูปแบบหลังแบบปิด ตัวอย่างเช่นหากข้อมูลของเราคือ Bernoulli และเราเลือกเบต้า ( , ) ก่อนหน้านั้นเรารู้ว่าด้านหลังเป็นเบต้า ( , ) โดยไม่ต้องทำการจำลองการสุ่มตัวอย่างหรือการคำนวณที่เข้มข้น αβα+i=1nxiβ+ni=1nxi
TrynnaDoStat

16

เหตุผลที่สำคัญที่สุดในการใช้วิธีการเป็นประจำซึ่งยังไม่ได้กล่าวถึงอย่างน่าประหลาดใจคือการควบคุมข้อผิดพลาด บ่อยครั้งที่การวิจัยนำไปสู่การตีความแบบแยกขั้ว (ฉันควรทำการศึกษาเกี่ยวกับสิ่งนี้หรือไม่ควรทำการแทรกแซงหรือไม่?) วิธีการที่ใช้บ่อยทำให้คุณสามารถควบคุมอัตราความผิดพลาด Type 1 ของคุณได้อย่างเคร่งครัด วิธีการแบบเบย์ไม่ได้ (แม้ว่าบางคนจะสืบทอดความเป็นสากลจากวิธีการที่เป็นไปได้ แต่ถึงอย่างนั้นอัตราความผิดพลาดอาจสูงมากในกลุ่มตัวอย่างขนาดเล็กและมีหลักฐานที่ค่อนข้างต่ำ (เช่น BF> 3) คุณสามารถตรวจสอบคุณสมบัติของ ปัจจัยเบส์ (ดูตัวอย่างhttp://papers.ssrn.com/sol3/papers.cfm?abstract_id=2604513) แต่นั่นยังคงเป็นวิธีของผู้ใช้บ่อย ฉันคิดว่าบ่อยมากนักวิจัยให้ความสำคัญกับการควบคุมความผิดพลาดมากกว่าเกี่ยวกับการหาปริมาณหลักฐานต่อเมื่อเทียบกับสมมติฐานที่เฉพาะเจาะจงบางอย่างและฉันคิดว่าอย่างน้อยที่สุดทุกคนให้ความสำคัญกับการควบคุมความผิดพลาดในระดับหนึ่ง complementarily


จุดดี. ฉันยังคิดถึงวิธีการเรียงลำดับกลุ่มและรูปแบบอื่น ๆ ของการทดสอบหลายรูปแบบซึ่งดูเหมือนว่า (จากมุมมองที่แคบของฉันซึ่งอาจมองข้ามส่วนสำคัญ ๆ ของวรรณกรรม) ที่ขาดความสนใจทางด้าน Bayesian ไกล) ในแง่ของการควบคุมข้อผิดพลาดบางอย่าง แน่นอนในหลาย ๆ กรณีวิธีการแบบเบย์ - โดยเฉพาะอย่างยิ่งกับนักบวชชั้นสูงที่น่าสงสัยหรือการหดตัวบางอย่างผ่านโมเดลลำดับชั้นจะควบคุมข้อผิดพลาดในระดับที่ไม่สามารถคาดเดาได้ แต่มีการคิดในด้านของผู้ใช้บ่อยมากขึ้น
Björn

3
(+1) ฉันชอบประเด็นนี้มาก ... เนื่องจากเป็นเหตุผลที่ฉันเป็นนักปรัชญาบ่อยครั้ง ... เมื่อเราทำสถิติเพื่อช่วยในการอนุมานแล้วเราต้องการให้การอนุมานของเราแม่นยำยิ่งขึ้น (เช่นข้อผิดพลาดน้อยลง) กว่าการคาดเดาคนตาบอด ในความเป็นจริงถ้าฉันสนใจเกี่ยวกับการอนุมานของฉันจริงหรือเท็จ (ในแง่ของการตรวจสอบโดยการศึกษาติดตาม) แล้วอัตราความผิดพลาดมีความสำคัญมาก ฉันแค่รู้สึกไม่สบายใจกับความน่าจะเป็นแบบเบย์(แต่วิธีการเหล่านั้นมีประโยชน์มากอย่างสมเหตุสมผล "ตัวประมาณค่าแบบปกติ" สำหรับปริมาณเมื่อขนาดตัวอย่างมีขนาดเล็ก ... คิดว่า Agresit-Coull)

ฟังดูเหมือนทฤษฎีการตัดสินใจมากกว่าการเปรียบเทียบแบบเบย์ / การเปรียบเทียบบ่อยครั้ง นอกจากนี้ด้วยวิธี Bayesian คุณไม่จำเป็นต้องกังวลเกี่ยวกับการหยุดกฎ ... ฉันยังเข้าใจว่า Bayes อาจได้รับ "สมดุล" ที่ดีขึ้นระหว่างอัตราข้อผิดพลาดประเภท 1 และ 2 ...
ความน่าจะเป็นทาง

8

ฉันคิดว่าหนึ่งในคำถามที่ยิ่งใหญ่ที่สุดในฐานะนักสถิติคุณต้องถามตัวเองว่าคุณเชื่อหรือไม่หรือต้องการยึดมั่นในหลักการความน่าจะเป็นหรือไม่ หากคุณไม่เชื่อในหลักการความน่าจะเป็นแล้วฉันคิดว่ากระบวนทัศน์ประจำของสถิติอาจมีประสิทธิภาพอย่างมากอย่างไรก็ตามถ้าคุณเชื่อในหลักการโอกาสแล้ว (ฉันเชื่อ) คุณแน่นอนต้องรับกระบวนทัศน์แบบเบย์ในหรือ ที่จะไม่ละเมิดมัน


ในกรณีที่คุณไม่คุ้นเคยหลักการดังกล่าวบอกให้เราทราบดังนี้:

หลักการความน่าจะเป็น : ในการทำการอนุมานหรือตัดสินใจเกี่ยวกับหลังจากข้อมูลถูกสังเกตพบข้อมูลการทดลองที่เกี่ยวข้องทั้งหมดมีอยู่ในฟังก์ชันความน่าจะเป็น : โดยที่สอดคล้องกับข้อมูลที่สังเกตและได้รับการแก้ไขθx

(θ;x)=p(x|θ)
x

นอกจากนี้หากและเป็นสองตัวอย่างคะแนนที่เป็นสัดส่วนกับนั่นคือ มีค่าคงที่เช่นนั้นxy(θ;x)(θ;y)C(x,y)

(θ;x)=C(x,y)(θ;y)for all θ,

ดังนั้นข้อสรุปที่ได้จากและควรเหมือนกัน \xy

โปรดทราบว่าค่าคงที่ด้านบนอาจแตกต่างกันไปสำหรับคู่ที่แตกต่างกันแต่คู่ไม่ขึ้นอยู่กับ\C(x,y)(x,y)C(x,y)θ

ในกรณีพิเศษของ , ความน่าจะเป็นหลักการที่ระบุว่าหากสองจุดตัวอย่างผลในฟังก์ชั่นความน่าจะเป็นเหมือนกันแล้วพวกเขามีข้อมูลเหมือนกันเกี่ยวกับ\แต่หลักการความน่าจะเป็นยังดำเนินต่อไป มันระบุว่าแม้ว่าสองจุดตัวอย่างมีเพียงโอกาสเกิดสัดส่วนแล้วพวกเขามีข้อมูลเกี่ยวกับเทียบเท่า\θ θC(x,y)=1θθ


ตอนนี้หนึ่งในสถิติของ Bayesian คือภายใต้นักบวชที่เหมาะสมกระบวนทัศน์ของ Bayesian ไม่เคยละเมิดหลักการความน่าจะเป็น อย่างไรก็ตามมีสถานการณ์ง่าย ๆ ที่กระบวนทัศน์ของผู้ใช้บ่อยจะละเมิดหลักการความน่าจะเป็น

นี่เป็นตัวอย่างที่ง่ายมากจากการทดสอบสมมติฐาน พิจารณาสิ่งต่อไปนี้:

พิจารณาการทดลองที่มีการทดลองใช้ 12 Bernoulli และพบความสำเร็จ 3 ครั้ง ขึ้นอยู่กับกฎการหยุดเราสามารถอธิบายลักษณะของข้อมูลดังต่อไปนี้:

  • การแจกแจงแบบทวินาม:และข้อมูล:x = 3X|θBin(n=12,θ)x=3
  • การแจกแจงแบบทวินามลบ: และข้อมูล:y = 12Y|θNegBin(k=3,θ)y=12

ดังนั้นเราจะได้ฟังก์ชั่นความน่าจะเป็นดังต่อไปนี้: ซึ่งมีความหมายว่า และด้วยหลักการความน่าจะเป็นเราควรได้รับการอ้างถึงแบบเดียวกันเกี่ยวกับจากความน่าจะเป็น

1(θ;x=3)=(123)θ3(1θ)92(θ;y=12)=(112)θ3(1θ)9
1(θ;x)=C(x,y)2(θ,y)
θ

ทีนี้ลองนึกภาพการทดสอบสมมติฐานต่อไปนี้จากกระบวนทัศน์ประจำ

Ho:θ12versusHa:θ<12

สำหรับแบบจำลองทวินามเรามีดังต่อไปนี้:

p-value=P(X3|θ=12)=(120)(12)12+(121)(12)12+(122)(12)12+(123)(12)12=0.0723

ขอให้สังเกตว่าแต่เงื่อนไขอื่น ๆ ไม่เป็นไปตามหลักการความน่าจะเป็น(123)(12)12=1(12;x=3)

สำหรับโมเดลเชิงลบแบบทวินามเรามีดังต่อไปนี้:

p-value=P(Y12|θ12)=(112)(12)12+(122)(12)12+(132)(12)12+...=0.0375

จากการคำนวณ p-value ข้างต้นเราจะเห็นว่าในรูปแบบทวินามเราจะไม่ปฏิเสธแต่ใช้รูปแบบทวินามเชิงลบที่เราจะปฏิเสธH_oดังนั้นแม้ว่ามีค่า p และการตัดสินใจที่ยึดตามค่า p เหล่านี้จะไม่เหมือนกัน อาร์กิวเมนต์ p-value นี้มักใช้โดย Bayesians กับการใช้ p-values ​​เป็นประจำHoHo1(θ;x)2(θ;y)

ตอนนี้ให้ลองทดสอบสมมติฐานต่อไปนี้อีกครั้ง แต่จากกระบวนทัศน์แบบเบย์

Ho:θ12versusHa:θ<12

สำหรับแบบจำลองทวินามเรามีดังต่อไปนี้:

P(θ12|x)=1/21π(θ|x)dx=1/21θ3(1θ)9π(θ)dθ/01θ3(1θ)9π(θ)dθ

ในทำนองเดียวกันสำหรับโมเดลเชิงลบแบบลบเรามีดังต่อไปนี้:

P(θ12|y)=1/21π(θ|x)dx=1/21θ3(1θ)9π(θ)dθ/01θ3(1θ)9π(θ)dθ

ตอนนี้ใช้กฎการตัดสินใจแบบเบย์เลือกถ้า (หรือบางเกณฑ์อื่น ๆ ) และทำซ้ำเช่นเดียวกันกับปีHoปีP(θ12|x)>12y

อย่างไรก็ตามและเรามาถึงที่ ข้อสรุปเดียวกันและวิธีการนี้จึงเป็นไปตามหลักการความน่าจะเป็นP(θ12|x)=P(θ12|y)


ดังนั้นเพื่อสรุปคำพูดของฉันหากคุณไม่สนใจหลักการความน่าจะเป็น (ถ้าคุณบอกไม่ได้ฉันเป็น Bayesian :))


1
ฉันขอขอบคุณคำตอบ (และอาจใช้เวลานาน) อย่างเห็นได้ชัด แต่ฉันรู้สึกว่าคำตอบนี้เป็นการออกจาก "คำตอบ ... สื่อถึงความสามารถในการเข้าถึงได้มากที่สุด ... "
jsakaluk

1
@ jsakaluk ฉันเดาว่าฉันตั้งใจจะทำอะไรและต้องการให้แน่ใจว่าได้ทำการโต้เถียงกันอยู่ว่าถ้าคุณเต็มใจที่จะมองข้ามบางสิ่งที่นักสถิติประยุกต์จำนวนมากได้รับตลอดเวลานั่นคือหลักการความน่าจะเป็นแล้วใช้ กระบวนทัศน์ที่ใช้บ่อยเป็นทางเลือกที่ง่ายกว่ามากสำหรับกระบวนทัศน์แบบเบย์ อย่างไรก็ตามหากคุณไม่สามารถทำได้คุณจะต้องหาทางเลือกอื่น
RustyStatistician

4
@RustyStatistician หลักการความน่าจะเป็นหลักการสำคัญสำหรับผู้ที่เป็น Likelihoodists ไม่ได้คชกรรมที่ทั้งหมด ฉันโพสต์ลิงก์ในคำตอบของฉัน การเรียกร้องของคุณ "ถ้าคุณเชื่อในหลักการความน่าจะเป็นจากนั้น (ฉันเชื่อว่า) คุณแน่นอนที่สุดที่จะต้องยอมรับกระบวนทัศน์แบบเบย์" เป็นเท็จ
สแตน

@ สแตนฉันเห็นด้วยกับคุณว่าใช่ความเป็นไปได้ที่จะเชื่อในหลักการโอกาสที่แน่นอน แต่ฉันจะพบว่ามันยากมากที่จะเชื่อว่าถ้าคุณถาม Bayesian ใด ๆ หากพวกเขาเชื่อในการยึดมั่นในหลักการความน่าจะเป็นที่พวกเขาจะบอกว่าไม่มีพวกเขาไม่ได้ (นั่นเป็นเพียงความเห็นของฉันที่คุณไม่ต้องเห็นด้วย)
RustyStatistician

2
บทบาทของหลักการความน่าจะเป็น (LP) หลักการ conditionality (CP) และหลักการเศรษฐกิจพอเพียง (SP) ในการอนุมานไม่ได้ simple..this เป็นเพราะหลักการเหล่านี้เกี่ยวข้องกับหลักฐาน (ตามที่นำเสนอโดยข้อมูล) ในขณะที่การอนุมานที่เกี่ยวข้องกับการจะเกินหลักฐาน . สิ่งนี้มีความเสี่ยงเสมอ แต่จำเป็นต้องมีความก้าวหน้า ดูทฤษฎีบทของ Birnbaums (กล่าวถึงที่นี่ ... ฉันไม่เห็นด้วยกับส่วนที่เหลือของบทความ): arxiv.org/abs/1302.5468

6

คุณและฉันเป็นทั้งนักวิทยาศาสตร์และในฐานะนักวิทยาศาสตร์ส่วนใหญ่สนใจคำถามหลักฐาน ด้วยเหตุนี้ฉันจึงคิดว่าแนวทางแบบเบย์เมื่อเป็นไปได้ดีกว่า

วิธีการแบบเบย์ตอบคำถามของเรา: อะไรคือจุดแข็งของหลักฐานสำหรับสมมติฐานหนึ่งเหนืออีกข้อ ในทางกลับกันแนวทางที่ใช้บ่อยไม่ได้: พวกเขารายงานเพียงว่าข้อมูลแปลก ๆ ที่ได้รับจากสมมติฐานหนึ่งข้อ

ที่กล่าวว่า Andrew Gelman, Bayesian ที่มีชื่อเสียงดูเหมือนว่าจะกระตุ้นการใช้ p-values ​​(หรือการตรวจสอบกราฟิกแบบ p-value-like) เพื่อเป็นการตรวจสอบข้อผิดพลาดในแบบจำลองข้อมูลจำเพาะ คุณสามารถดูการพาดพิงถึงวิธีการนี้ในโพสต์บล็อกนี้

ในขณะที่ฉันเข้าใจวิธีการของเขานั้นเป็นกระบวนการที่มีสองขั้นตอน: อย่างแรกเขาถามคำถามแบบเบส์ว่าอะไรคือหลักฐานสำหรับแบบจำลองหนึ่งเหนืออีกแบบหนึ่ง ประการที่สองเขาถามคำถามที่พบบ่อยว่าแบบจำลองที่ต้องการดูที่เป็นไปได้จริงหรือไม่ที่ได้รับข้อมูล ดูเหมือนว่าวิธีการไฮบริดที่เหมาะสมสำหรับฉัน


1
แม้ว่าลิงก์ไปยังบล็อก Gelman จะยังคงใช้ได้ แต่จะไม่เป็น "วันนี้" หลังเที่ยงคืน แก้ไขตามนั้น
Nick Cox

8
ฉันไม่เห็นด้วยอย่างยิ่งกับสัญกรณ์ว่าแนวทางที่ใช้บ่อยไม่ได้วัดหลักฐานและนี่เป็นเพียงในโลกของ Bayesian เท่านั้น คุณกำลังออกจากที่มาของการทดสอบสมมติฐานเช่นการทดสอบ LR, วัดหลักฐานของสมมติฐานหนึ่งกับหลักฐานอื่น ๆ
หน้าผา AB

1
(+1) ถึง @CliffAB - สำหรับทุกคนที่คิดเกี่ยวกับสถิติ "บ่อย" โปรดค้นหา "อัตราส่วนความน่าจะเป็น" "ทฤษฎีบทของ Birnbaum" และบางทีอ่าน Royall เล็กน้อย ... อย่าข้ามไปยังฟาง - ข้อโต้แย้งของชายที่เกี่ยวข้องกับ NHST - ซึ่งโดยทางดูเหมือนจะไม่ได้ขัดขวางความก้าวหน้าทางวิทยาศาสตร์แม้จะมีข้อบกพร่องร้ายแรงที่คาดคะเน .... นั่นเป็นเพราะนักสถิติไม่ใช่โปรแกรม MINITAB ที่ใช้คาร์บอน ... พวกเขาคิดว่า [ใช่การทำสถิติคือ จริง ๆ แล้วเป็นอาชีพเช่นยาหรือเศรษฐศาสตร์หรือกลไกอัตโนมัติ ... คุณไม่สามารถอ่านหนังสือลองสูตรและคาดหวังว่าจะได้ความจริงมาอยู่บนตักของคุณ]

2
@Bey: โดยส่วนตัวฉันเชื่อว่า p-values ​​ได้ลดทอนบางอย่างลงในกระบวนการทางวิทยาศาสตร์ (ในที่นักชีววิทยาถูกบังคับให้กลายเป็นนักสถิติเชิงเวลาในการเผยแพร่เอกสารลดเวลาที่พวกเขาจะเป็นนักชีววิทยา) แต่ฉันไม่ อย่าคิดว่าเป็นทางเลือกสำหรับค่า p แต่อย่างใดลดปัญหานี้! ฉันรู้สึกว่าปัญหาของค่า p ไม่ได้เป็นพื้นฐานทางทฤษฎีของพวกเขา แต่ความสะดวกในการใช้งานโดยไม่ใช่นักสถิติ ความน่าจะเป็นหลัง (ตัวอย่าง) ฉันคิดว่าทำให้ปัญหานั้นแย่ลงมากกว่าดีกว่า
หน้าผา AB

2
@CliffAB ไม่สามารถตกลงกันได้อีก ... ไม่ได้คิดถึงมันจากด้านนั้น .. แต่นั่นเป็นเพียงลักษณะของการเผยแพร่ฉันเดาว่า ... เว้นแต่ว่าแผนกวิจัยจะสามารถมีสถิติพนักงานได้ เครื่องมือทางสถิติใด ๆ ที่สามารถนำไปใช้ในทางที่ผิดโดยผู้ที่ไม่มีความรู้ในการใช้งาน ... เครื่องมือทางสถิติที่น่าสงสารดูเหมือนจะใช้งานง่าย ...

6

โดยส่วนตัวฉันมีปัญหาในการคิดถึงสถานการณ์ที่ต้องการคำตอบบ่อยกว่า Bayesian ความคิดของฉันมีรายละเอียดที่นี่และในบทความบล็อกอื่น ๆ บน fharrell.com เกี่ยวกับปัญหาเกี่ยวกับค่า p และการทดสอบสมมติฐานว่าง ผู้ใช้บ่อยมีแนวโน้มที่จะไม่สนใจปัญหาพื้นฐานบางประการ นี่เป็นเพียงตัวอย่าง:

  • นอกเหนือจากโมเดลเชิงเส้นเกาส์เซียนที่มีความแปรปรวนคงที่และอีกสองสามกรณีค่า p ที่คำนวณได้นั้นมีความแม่นยำที่ไม่ทราบสำหรับชุดข้อมูลและโมเดลของคุณ
  • เมื่อการทดสอบเป็นแบบลำดับหรือปรับตัวมักจะเป็นกรณีที่ค่า p ไม่สามารถคำนวณได้และเราสามารถตั้งค่าระดับโดยรวมเพื่อให้บรรลุα
  • ผู้ถี่ที่ใช้บ่อยดูเหมือนดีใจที่ไม่ปล่อยให้ข้อผิดพลาดประเภทที่ 1 ไปด้านล่างพูดว่า 0.05 ไม่ว่าตอนนี้ขนาดตัวอย่างจะเพิ่มขึ้นก็ตาม
  • ไม่มีใบสั่งยาที่ใช้บ่อยสำหรับวิธีการแก้ไขหลายหลากที่เกิดขึ้นซึ่งนำไปสู่วิธีการแบบเฉพาะกิจ

เกี่ยวกับประเด็นแรกหนึ่งรูปแบบที่ใช้กันทั่วไปคือรูปแบบโลจิสติกไบนารี ความน่าจะเป็นบันทึกของมันไม่ได้เป็นกำลังสองและขีด จำกัด ความเชื่อมั่นส่วนใหญ่และค่า p ที่คำนวณสำหรับรุ่นดังกล่าวนั้นไม่แม่นยำมาก ตรงกันข้ามกับรูปแบบโลจิสติกส์แบบเบย์ซึ่งให้การอนุมานที่แน่นอน

คนอื่น ๆ ได้กล่าวถึงการควบคุมข้อผิดพลาดเป็นเหตุผลสำหรับการใช้การอนุมานบ่อยครั้ง ฉันไม่คิดว่านี่เป็นเหตุผลเพราะข้อผิดพลาดที่พวกเขาอ้างถึงเป็นข้อผิดพลาดในระยะยาวโดยมองเห็นกระบวนการที่การทดสอบทางสถิติหลายพันครั้งทำงาน ผู้พิพากษาที่กล่าวว่า "น่าจะเป็นความเชื่อมั่นที่ผิด ๆ ในระยะยาวในห้องพิจารณาคดีของฉันมีเพียง 0.03" เธอถูกกล่าวหาว่ามีความน่าจะเป็นสูงสุดของการตัดสินใจที่ถูกต้องสำหรับจําเลยในปัจจุบัน ในอีกทางหนึ่งลบความน่าจะเป็นหลังของเอฟเฟกต์คือความน่าจะเป็นของผลเป็นศูนย์หรือย้อนกลับและเป็นความน่าจะเป็นข้อผิดพลาดที่เราต้องการ


2
"ไม่มีใบสั่งยาที่ใช้บ่อยสำหรับวิธีการแก้ไขหลายหลากที่เกิดขึ้นซึ่งนำไปสู่วิธีการแบบเฉพาะกิจ" ในทางกลับกันฉันไม่เคยเห็นชาว Bayesian ทำการแก้ไขหลายหลากเลย Andrew Gelman ภูมิใจประกาศว่าเขาไม่เคยใช้มัน ตัวอย่างเช่นฉันเคยเห็นคนรายงานว่าช่วงเวลาที่น่าเชื่อถือ 95% สำหรับแต่ความน่าเชื่อถือร่วมของช่วงนั้นไม่ใช่ 95% ไม่ชัดเจนว่าจะแก้ไขปัญหานี้ได้อย่างไร คุณมีคำแนะนำหรือตัวอย่างหรือไม่? kθ1,,θkk
พลเรือน

5

หลายคนดูเหมือนจะไม่ตระหนักถึงโรงเรียนปรัชญาแห่งที่สามนั่นก็คือความน่าจะเป็น โอกาสน่าจะเป็นหนังสือ AWF Edwards น่าจะเป็นที่ที่ดีที่สุดในการอ่าน นี่เป็นบทความสั้น ๆ ที่เขาเขียน
Likelihoodism หลีกเลี่ยงค่า p, เช่น Bayesianism, แต่ยังทำให้ค่าของ Bayesian ไม่แน่นอนก่อนหน้านี้ด้วย มีการรักษาภายในที่นี่เช่นกัน


5
มีวิธีความน่าจะเป็นอัลกอริทึมโดย Vovk พัฒนาจากแนวคิดของ Kolmogorov
Aksakal

2
"หลายคนดูเหมือนจะไม่ได้ตระหนักถึงโรงเรียนปรัชญาที่สาม: ความน่าจะเป็น" ฉันไม่คิดว่าประโยคนี้เป็นจริงในปี 2016 ...
ทิม

4
@ ทิมแม้ว่าทุกคนที่ฉันรู้จักจะคุ้นเคยกับบ่อยและ Bayesianism ฉันไม่เคยพบใครที่เคยได้ยินความน่าจะเป็น ผู้ถามดั้งเดิมดูเหมือนจะเป็นเหมือนเพื่อนร่วมงานของฉันที่ได้รับการฝึกฝนด้านการใช้งานบ่อยและมีความสนใจในการเบย์เซียนมากขึ้นเรื่อย ๆ บางทีคนส่วนใหญ่ที่อ่านคำตอบของฉันข้างต้นคิดว่าฉันหมายถึงการประมาณโอกาสสูงสุดหรือการทดสอบสมมติฐานโดยใช้อัตราส่วนความน่าจะเป็น Nope! ฉันแนะนำYudi Pawitanและการบรรยายนี้
สแตน

7
ไม่มีวิธีการใดที่เป็นศาสนาดังนั้นจึงไม่มีอะไรน่าเชื่อพวกเขาเพียงแค่ช่วยแก้ไขปัญหาบางอย่างและแนวทางบางอย่างดีกว่าสำหรับปัญหาบางอย่างและปัญหาอื่น ๆ สำหรับคนอื่น ๆ :)
ทิม

1
(+1) เพื่อกล่าวถึงโรงเรียนที่น่าจะเป็นและสำหรับความคิดเห็นเกี่ยวกับ Pawitan หนังสือของพาวิแทน "ในทุกโอกาส" ขยายกว้างและปรับปรุงอย่างมากด้วยการฝึกฝนทางสถิติ ... ฉันก็รู้เพียงว่า Bayes กับบ่อย ๆ เขาได้ฝึกฝนด้านปรัชญาและระเบียบวิธีมากมายของเบย์บ่อยครั้งที่ "คลาสสิค" และแน่นอนครอบคลุมโรงเรียนโอกาส เป็นหนังสือที่ยอดเยี่ยมสำหรับการเป็นผู้ใช้สถิติที่มีความซับซ้อนยิ่งขึ้น ...

4

หนึ่งในข้อเสียที่ใหญ่ที่สุดของวิธีการสร้างแบบจำลองบ่อยครั้งได้รับเสมอเป็น TrynnaDoStats บันทึกในจุดแรกของเขาความท้าทายที่เกี่ยวข้องกับการกลับโซลูชั่นรูปแบบปิดขนาดใหญ่ เมทริกซ์ผกผันแบบปิดต้องให้เมทริกซ์ทั้งหมดอาศัยอยู่ใน RAM ซึ่งเป็นข้อ จำกัด ที่สำคัญบนแพลตฟอร์ม CPU เดี่ยวที่มีข้อมูลจำนวนมากหรือมีการจัดหมวดหมู่อย่างหนาแน่น วิธีการแบบเบย์สามารถแก้ไขปัญหานี้ได้ด้วยการจำลองการสุ่มจับจากที่ระบุไว้ก่อนหน้านี้ นี่เป็นจุดขายที่ใหญ่ที่สุดแห่งหนึ่งของโซลูชั่นแบบเบย์แม้ว่าจะได้รับคำตอบในราคาที่คุ้มค่าในซีพียูเท่านั้น

Andrew Ainslie และ Ken Train ในกระดาษเมื่อประมาณ 10 ปีที่แล้วที่ฉันได้สูญเสียการอ้างอิงถึงเมื่อเปรียบเทียบกับส่วนผสม จำกัด (ซึ่งเป็นรูปแบบประจำหรือปิด) กับแนวทาง Bayesian เพื่อสร้างแบบจำลองและพบว่าในรูปแบบการทำงานที่หลากหลาย และตัวชี้วัดประสิทธิภาพทั้งสองวิธีให้ผลลัพธ์ที่เท่าเทียมกันเป็นหลัก ที่มีวิธีการแก้ปัญหาแบบเบย์หรือมีความยืดหยุ่นมากขึ้นในกรณีที่ข้อมูลมีทั้งเบาบางและมิติสูงมาก

อย่างไรก็ตามกระดาษนั้นถูกเขียนก่อนอัลกอริทึม "หารและพิชิต" ได้รับการพัฒนาที่ใช้ประโยชน์จากแพลตฟอร์มแบบขนานขนาดใหญ่เช่นดูบทความของ Chen และ Minge สำหรับข้อมูลเพิ่มเติมเกี่ยวกับhttp://dimacs.rutgers.edu/TechnicalReports/TechReports/2012/2012-นี้ 01.pdf

การถือกำเนิดของแนวทางของ D&C นั้นหมายความว่าแม้ปัญหามิติมิติที่มีขนมากที่สุดกระจัดกระจายและสูงที่สุดแนวทาง Bayesian ก็ไม่มีข้อได้เปรียบเหนือวิธีการประจำ ทั้งสองวิธีมีความเท่าเทียมกัน

การพัฒนาที่ค่อนข้างเร็วนี้มีค่าไม่สังเกตในการอภิปรายใด ๆ เกี่ยวกับข้อได้เปรียบในทางปฏิบัติหรือข้อ จำกัด ของทั้งสองวิธี


ฉันคิดว่านี่เป็นส่วนเสริมที่ดีของการสนทนา (+1) แต่ฉันคิดว่ามันยากที่จะติดตาม จริงๆแล้วจริงๆเลื่อนการจัดหมัดต่อไป ... บางทีคุณอาจจัดระเบียบใหม่อีกสักหน่อย? :)
usεr11852

@ user11852 คุณไม่ได้พูดว่าการโพสต์ล้มเหลวในการสื่อสารสิ่งที่มีประโยชน์ในขณะที่คุณพบว่าการพัฒนาของตรรกะไม่เป็นไปตามมาตรฐานการสื่อสารมวลชน เนื่องจากกระทู้นี้ได้ไปที่ "ชุมชน" ฉันไม่เอนเอียง (แรงจูงใจ?) ในการจัดระเบียบใหม่ตามคำแนะนำของคุณ มันสามารถยืนได้อย่างที่เป็น แต่ขอบคุณสำหรับการโหวตและแสดงความคิดเห็น
Mike Hunter

1. ) การผกผันของเมทริกซ์มักจะใช้สำหรับการประเมิน MLE (ซึ่งเป็นวิธีการหนึ่งในหลาย ๆ วิธีที่ใช้บ่อย) แต่ไม่เสมอไป งานของฉันในการประมาณค่า MLE เกี่ยวข้องกับการปรับให้เหมาะสมบ่อยครั้งสูงสุดถึงพารามิเตอร์ (เช่นพื้นที่พารามิเตอร์สามารถเติบโตเชิงเส้นตรงกับขนาดตัวอย่าง) และการผกผันของเมทริกซ์ไม่ใช่ตัวเลือกอย่างแน่นอน... แต่ฉันยังคงเพิ่มโอกาส! 2. ) การผกผันของเมทริกซ์ยังคงเกิดขึ้นตลอดเวลาในสถิติแบบเบย์เช่นตัวอย่างอัปเดตบล็อค n
หน้าผา AB

@CliffAB ฉันกำลังคิดถึงการกลับกันประเภท ANOVA ของเมทริกซ์ของผลิตภัณฑ์ข้าม
Mike Hunter

@ จอห์นสัน: ฉันเห็น แต่ประเด็นของฉันคือการผกผันของเมทริกซ์เป็นวิธีการตั้งฉากกับวิธีการแบบเบส์บ่อย ๆ ทั้งสองค่ายใช้เครื่องมือที่ทำสิ่งที่คล้ายกันมาก (อย่างน้อยก็ในแง่ของค่าใช้จ่ายในการคำนวณ) ในหลาย ๆ วิธี
หน้าผา AB

3

การทดสอบบ่อยครั้งมุ่งเน้นไปที่การปลอมแปลงสมมติฐานว่าง อย่างไรก็ตาม Null Hypothesis Significance Testing (NHST) สามารถทำได้จากมุมมองแบบเบย์เพราะในทุกกรณี NHST เป็นเพียงการคำนวณ P (Observed Effect | Effect = 0) ดังนั้นจึงเป็นการยากที่จะระบุเวลาที่จะต้องดำเนินการ NHST จากมุมมองของผู้ใช้บ่อย

ที่ถูกกล่าวว่าอาร์กิวเมนต์ที่ดีที่สุดสำหรับการดำเนินการ NHST โดยใช้วิธีการบ่อยคือความสะดวกและการเข้าถึง ผู้คนได้รับการสอนสถิติบ่อยครั้ง ดังนั้นจึงง่ายต่อการเรียกใช้ NHST ที่ใช้ประจำเนื่องจากมีแพ็คเกจทางสถิติมากมายที่ทำให้การทำเช่นนี้ง่ายขึ้น ในทำนองเดียวกันการสื่อสารผลลัพธ์ของ NHST เป็นประจำง่ายกว่าเนื่องจากผู้คนคุ้นเคยกับ NHST รูปแบบนี้ ดังนั้นฉันเห็นว่าเป็นอาร์กิวเมนต์ที่ดีที่สุดสำหรับวิธีการที่ใช้บ่อย: การเข้าถึงโปรแกรมสถิติที่จะเรียกใช้พวกเขาและความสะดวกในการสื่อสารของผลลัพธ์ให้เพื่อนร่วมงาน นี่เป็นเพียงแค่วัฒนธรรมดังนั้นข้อโต้แย้งนี้อาจเปลี่ยนแปลงได้หากวิธีการของนักบวชเป็นประจำสูญเสียอำนาจของพวกเขา


5
ความคิดเห็นเกี่ยวกับสิ่งที่ฟิชเชอร์คิดว่าดูเหมือนเกินที่นี่เว้นแต่คุณจะสามารถให้ใบเสนอราคาที่แน่นอน สมมติฐานว่างเป็นอุปกรณ์ที่เป็นส่วนหนึ่งของการทดสอบอย่างมีนัยสำคัญเพื่อพยายามกีดกันนักวิทยาศาสตร์จากการตีความผลเกินจริงจากตัวอย่างเล็ก ๆ ฟิชเชอร์มีความกระตือรือร้นเหมือนคนอื่น ๆ ที่นักวิทยาศาสตร์ควรใช้สถิติเพื่อทำวิทยาศาสตร์ที่ดี เขาเป็นตัวเองที่มีความสำคัญต่อพันธุกรรม
Nick Cox

4
ฉันเห็นด้วยอย่างสมบูรณ์และดังนั้นฉันจึงแก้ไขคำตอบเพื่อลบการเก็งกำไรเกี่ยวกับสภาพจิตใจของชาวประมง
Liz Page-Gould

3

หลายความคิดเห็น:

  • ความแตกต่างพื้นฐานระหว่างสถิติแบบเบย์และนักสถิติประจำคือการแบบเบย์ยินดีที่จะขยายเครื่องมือของความน่าจะเป็นไปสู่สถานการณ์ที่ผู้เล่นแบบประจำไม่ต้องการ

    • โดยเฉพาะอย่างยิ่ง Bayesian ยินดีที่จะใช้ความน่าจะเป็นในการสร้างแบบจำลองความไม่แน่นอนในใจของเธอเองมากกว่าพารามิเตอร์ต่างๆ สำหรับผู้ใช้บ่อยพารามิเตอร์เหล่านี้คือ scalars (แม้ว่า scalars ที่ statistician ไม่ทราบค่าจริง) สำหรับ Bayesian พารามิเตอร์ต่าง ๆ จะถูกแทนด้วยตัวแปรสุ่ม! มันแตกต่างกันมาก ความไม่แน่นอนของคชกรรมพารามิเตอร์ valeus เป็นตัวแทนจากก่อน
  • ในสถิติของเบย์ความหวังก็คือหลังจากที่สังเกตข้อมูลแล้วผู้หลังจะครอบงำก่อนหน้านั้นก่อนหน้านั้นไม่สำคัญ แต่นี่ไม่ใช่กรณี: ผลลัพธ์อาจอ่อนไหวต่อตัวเลือกก่อนหน้า! Bayesians ที่แตกต่างกันกับนักบวชที่แตกต่างกันไม่จำเป็นต้องเห็นด้วยกับคนหลัง

ประเด็นสำคัญที่ต้องจำไว้ก็คือข้อความของนักสถิติประจำคือข้อความที่ Bayesians สองคนสามารถตกลงกันได้โดยไม่คำนึงถึงความเชื่อก่อนหน้าของพวกเขา!

ผู้ที่ไม่ได้แสดงความคิดเห็นเกี่ยวกับนักบวชหรือผู้โพสต์เพียงความน่าจะเป็น

งบของนักสถิติที่มีความถนัดในบางแง่มุมมีความทะเยอทะยานน้อยกว่า แต่คำแถลงที่โดดเด่นยิ่งขึ้นของ Bayesian สามารถพึ่งพาการมอบหมายงานก่อนหน้านี้อย่างมีนัยสำคัญ ในสถานการณ์ที่นักบวชสำคัญและในกรณีที่มีความขัดแย้งกับนักบวชงบการเงินที่มีเงื่อนไข จำกัด ของสถิติที่ใช้บ่อยอาจยืนอยู่บนพื้นดินที่กระชับกว่า


2

เป้าหมายของการวิจัยจำนวนมากไม่ได้ไปสู่ข้อสรุปสุดท้าย แต่เพียงเพื่อให้ได้หลักฐานเพิ่มเติมอีกเล็กน้อยเพื่อเพิ่มความรู้สึกของคำถามในชุมชนในทิศทางเดียว

สถิติแบบเบย์เป็นสิ่งที่ขาดไม่ได้เมื่อคุณต้องการประเมินผลการตัดสินใจหรือข้อสรุปตามหลักฐานที่มีอยู่ การควบคุมคุณภาพจะเป็นไปไม่ได้หากไม่มีสถิติแบบเบย์ ขั้นตอนใด ๆ ที่คุณจำเป็นต้องใช้ข้อมูลบางส่วนแล้วดำเนินการกับมัน (หุ่นยนต์, การเรียนรู้ของเครื่อง, การตัดสินใจทางธุรกิจ) ได้รับประโยชน์จากสถิติของเบย์

แต่นักวิจัยจำนวนมากไม่ได้ทำอย่างนั้น พวกเขากำลังทำการทดลองบางอย่างรวบรวมข้อมูลแล้วบอกว่า "จุดข้อมูลด้วยวิธีนี้" โดยไม่ต้องกังวลมากเกินไปเกี่ยวกับว่าเป็นข้อสรุปที่ดีที่สุดที่ได้รับหลักฐานทั้งหมดที่คนอื่นรวบรวมมา วิทยาศาสตร์อาจเป็นกระบวนการที่ช้าและข้อความเช่น "ความน่าจะเป็นที่รุ่นนี้ถูกต้องคือ 72%!" มักจะคลอดก่อนกำหนดหรือไม่จำเป็น

สิ่งนี้เหมาะสมในวิธีการทางคณิตศาสตร์อย่างง่ายเช่นกันเพราะสถิติผู้ใช้บ่อยมักกลายเป็นทางคณิตศาสตร์เหมือนกับขั้นตอนการอัปเดตของสถิติแบบเบย์ กล่าวอีกนัยหนึ่งในขณะที่สถิติแบบเบย์คือ (รูปแบบก่อนหน้าหลักฐาน) →โมเดลใหม่สถิติที่ใช้บ่อยเป็นเพียงหลักฐานและปล่อยให้ผู้อื่นกรอกข้อมูลในสองส่วนอื่น ๆ


แม้ว่าส่วนใหญ่โพสต์นี้จะน่าสนใจ แต่ก็มีความคิดเห็นที่ไม่ได้รับการสนับสนุนมากมาย โปรดปรึกษาศูนย์ช่วยเหลือของเราเกี่ยวกับประเภทของคำตอบที่คาดหวังในเว็บไซต์นี้
whuber

@ เมื่อไรฉันเห็น ฉันได้เพิ่มการอ้างอิงหนึ่งรายการที่ฉันสามารถจดจำได้จากส่วนบนของหัว แต่ส่วนที่เหลือฉันไม่มีการอ้างอิงดังนั้นหากดูเหมือนว่าไม่ได้รับการสนับสนุนฉันก็สามารถลบได้
โอเว่น

5
ฉันประหลาดใจที่คุณพูดถึงการควบคุมคุณภาพเนื่องจากดูเหมือนว่าพื้นที่ที่การตีความความน่าจะเป็นประจำ (ความถี่สัมพัทธ์มากกว่าการทดลองหลายครั้ง) เป็นเรื่องธรรมดามาก: เนื่องจากโรงงานทำงานอย่างถูกต้องเราจะเห็นโอกาสนี้มากแค่ไหน (หรือมากกว่า) วิดเจ็ตที่ใช้งานไม่ได้? ฉันขอผลักดันให้คุณอธิบายรายละเอียดเกี่ยวกับสิ่งที่ทำให้สถิติแบบเบย์มีประโยชน์อย่างยิ่งสำหรับ QC?
Matt Krause

@MattKrause สมมติว่าเป้าหมายของเราคือจัดส่งวิดเจ็ตที่ชำรุดในอัตรา <1% เรารู้ว่าโรงงานผลิตวิดเจ็ตที่ชำรุดในอัตรา 10% และเรามีการทดสอบที่อัตราความผิดพลาด Type-I และ Type-II คือ s และ 1 / (sqrt (4 - 1 / s ^ 2)) โดยที่ s คือ พารามิเตอร์ความเข้มงวด เราควรใช้อะไรกับความเข้มงวด?
โอเว่น

2
แนวคิดที่ว่าสถิติผู้ใช้บ่อยไม่สามารถรวมข้อมูลจากการศึกษาต่อเนื่องได้ดูเหมือนจะไม่สนใจสาขาการวิเคราะห์อภิมาน
หน้าผา AB

2

การดำเนินการที่แท้จริงของวิธีการแบบเบย์นั้นเป็นเรื่องทางเทคนิคมากกว่าวิธีการแบบผู้ใช้ประจำ โดย "เทคนิคมากขึ้น" ฉันหมายถึงสิ่งต่าง ๆ เช่น: 1) การเลือกนักบวช 2) การเขียนโปรแกรมโมเดลของคุณใน BUGS / JAGS / STAN และ 3) การคิดเกี่ยวกับการสุ่มตัวอย่างและการบรรจบกัน

เห็นได้ชัดว่า # 1 ไม่ได้เป็นตัวเลือกมากนักตามนิยามของ Bayesian แม้ว่าจะมีปัญหาและขั้นตอนบางอย่าง แต่ก็มีค่าเริ่มต้นที่สมเหตุสมผลซ่อนตัวปัญหาไว้จากผู้ใช้ (แม้ว่าสิ่งนี้อาจทำให้เกิดปัญหาได้!)

ไม่ว่าปัญหา # 2 จะขึ้นอยู่กับซอฟต์แวร์ที่คุณใช้หรือไม่ สถิติแบบเบย์มีความโน้มเอียงไปสู่การแก้ปัญหาทั่วไปมากกว่าวิธีการทางสถิติแบบประจำและเครื่องมือเช่น BUGS, JAGS และ STAN เป็นการแสดงออกตามธรรมชาติของสิ่งนี้ อย่างไรก็ตามมีฟังก์ชั่นแบบเบย์ในแพ็คเกจซอฟต์แวร์ต่าง ๆ ที่ดูเหมือนว่าจะทำงานเหมือนกับขั้นตอนทั่วไปบ่อยครั้งดังนั้นจึงไม่เป็นปัญหาเสมอไป (และโซลูชั่นล่าสุดเช่นแพ็คเกจ R rstanarmและbrmsเชื่อมช่องว่างนี้) อย่างไรก็ตามการใช้เครื่องมือเหล่านี้คล้ายกับการเขียนโปรแกรมในภาษาใหม่

โดยปกติแล้วรายการ # 3 จะใช้งานได้เนื่องจากแอปพลิเคชัน Bayesian ส่วนใหญ่ในโลกแห่งความจริงจะใช้การสุ่มตัวอย่าง MCMC (ในทางกลับกันโพรซีเดอร์ที่ใช้ MLE บ่อยครั้งใช้การออพติไมซ์ซึ่งอาจรวมกันเป็นมินิมาในท้องถิ่นหรือไม่มาบรรจบกันเลยและฉันสงสัยว่ามีผู้ใช้กี่คนที่ควรตรวจสอบเรื่องนี้และไม่?)

อย่างที่ฉันพูดในความคิดเห็นฉันไม่แน่ใจว่าอิสรภาพจากนักบวชเป็นประโยชน์ทางวิทยาศาสตร์ แน่นอนว่าสะดวกในหลาย ๆ ด้านและหลายขั้นตอนในกระบวนการตีพิมพ์ แต่ฉันไม่แน่ใจว่ามันจะทำให้วิทยาศาสตร์ดีขึ้น (และในภาพรวมเราทุกคนต้องตระหนักถึงนักบวชของเราในฐานะนักวิทยาศาสตร์หรือเราจะต้องทนทุกข์จากอคติทุกชนิดในการสืบสวนของเราโดยไม่คำนึงถึงวิธีการทางสถิติที่เราใช้)


ในเรื่องที่เกี่ยวกับ (3) โมเดลสถิติแบบดั้งเดิมจำนวนมาก (เช่น glm's) มีความน่าจะเป็นบันทึกแบบเว้าดังนั้นจึงเป็นเรื่องยากมากที่อัลกอริทึมมาตรฐานควรล้มเหลวนอกกรณีมุมที่รุนแรง ในเรื่องที่เกี่ยวกับปัญหาที่ไม่เว้า (เช่น NNs) ในขณะที่สิ่งเหล่านี้ต้องการความกังวลอย่างมากเกี่ยวกับการบรรจบกันที่ไม่เหมาะสม (ซึ่งโดยทั่วไปผู้ใช้เข้าใจ), เหล่านี้ (ไม่บังเอิญ) ยังเป็นปัญหาที่อัลกอริทึม พูดหนึ่งชีวิตของมนุษย์คนหนึ่ง อย่างไรก็ตามโดยทั่วไปแล้วการยืดตัวเพื่อแก้ไข MCMC นั้นน้อยกว่าอัลกอริธึมการปรับให้เหมาะสมที่สุด!
หน้าผา AB

2

แนวคิด : ฉันไม่รู้ ฉันเชื่อว่าสถิติแบบเบย์เป็นวิธีที่มีเหตุผลที่สุดในการคิด แต่ฉันไม่ได้พิสูจน์เหตุผลว่าทำไม

ข้อดีของการใช้บ่อยคือมันง่ายสำหรับคนส่วนใหญ่ในระดับประถมศึกษา แต่สำหรับฉันมันแปลก มันใช้เวลาหลายปีกว่าที่ฉันจะสามารถอธิบายความฉลาดทางสติปัญญาได้ว่าช่วงความมั่นใจคืออะไร แต่เมื่อฉันเริ่มเผชิญกับสถานการณ์จริงแนวคิดที่ใช้บ่อยดูเหมือนจะง่ายและมีความเกี่ยวข้องสูง

ทางสังเกตุ

คำถามที่สำคัญที่สุดที่ฉันพยายามมุ่งเน้นในปัจจุบันคือเพิ่มเติมเกี่ยวกับประสิทธิภาพในทางปฏิบัติ: เวลาทำงานส่วนบุคคลความแม่นยำและความเร็วในการคำนวณ

เวลาทำงานส่วนตัว:สำหรับคำถามพื้นฐานจริง ๆ แล้วฉันแทบจะไม่เคยใช้วิธีการแบบเบย์: ฉันใช้เครื่องมือขั้นพื้นฐานและมักจะชอบการทดสอบแบบ T มากกว่าแบบเบย์ที่จะทำให้ฉันปวดหัว เมื่อฉันต้องการที่จะรู้ว่าฉันดีกว่าแทคแทคเต้มากกว่าแฟนของฉันหรือไม่ฉันจะทำไคสแควร์ :-) ที่จริงแล้วแม้ในการทำงานอย่างจริงจังในฐานะนักวิทยาศาสตร์คอมพิวเตอร์เครื่องมือพื้นฐานบ่อย ๆ เป็นเพียงการประเมินค่าเพื่อตรวจสอบปัญหาและหลีกเลี่ยงข้อสรุปที่ผิดพลาดเนื่องจากการสุ่ม

ความแม่นยำ:ในการเรียนรู้ของเครื่องที่การทำนายสำคัญมากกว่าการวิเคราะห์ไม่มีขอบเขตที่แน่นอนระหว่าง Bayesian และผู้ใช้บ่อย MLE เป็นผู้อนุมัติประจำ: เพียงผู้ประมาณ แต่ regularized MLE (MAP) เป็นวิธีการแบบเบย์บางส่วน: คุณพบโหมดของหลังและคุณไม่สนใจคนหลังที่เหลือ ฉันไม่รู้เหตุผลที่บ่อยๆว่าทำไมจึงต้องใช้การทำให้เป็นมาตรฐาน ในทางปฏิบัติการทำให้เป็นปกตินั้นบางครั้งก็หลีกเลี่ยงไม่ได้เพราะการประมาณค่า MLE แบบดิบมีการติดตั้งมากเกินไปจน 0 เป็นตัวทำนายที่ดีกว่า หากการทำให้เป็นมาตรฐานถูกยอมรับว่าเป็นวิธีการแบบเบย์จริง ๆ แล้วสิ่งนี้เพียงอย่างเดียวก็พิสูจน์ให้เห็นว่า Bayes สามารถเรียนรู้ด้วยข้อมูลที่น้อยลง

ความเร็วในการคำนวณ:วิธีการที่ใช้บ่อยเป็นส่วนใหญ่มักจะเร็วขึ้นและง่ายต่อการคำนวณ และการทำให้เป็นมาตรฐานเป็นวิธีการที่ถูกที่สุดที่จะแนะนำบิตของเบย์ในพวกเขา อาจเป็นเพราะวิธีการแบบเบย์ยังไม่ได้รับการปรับปรุงให้ดีที่สุดเท่าที่จะทำได้ ตัวอย่างเช่นการใช้งาน LDA บางอย่างรวดเร็วในปัจจุบัน แต่พวกเขาต้องทำงานหนักมาก สำหรับการประมาณค่าเอนโทรปีวิธีการขั้นสูงครั้งแรกคือ Bayesian พวกเขาทำงานได้ดี แต่ไม่ช้าก็พบวิธีการที่ใช้บ่อยและใช้เวลาในการคำนวณน้อยกว่า ... สำหรับเวลาในการคำนวณวิธีการที่ใช้กันบ่อย ๆ นั้นดีกว่า มันไม่ใช่เรื่องไร้สาระหากคุณเป็นชาวเบย์ที่จะคิดว่าวิธีการประจำเป็นวิธีการประมาณของวิธีการแบบเบย์


2
"ฉันไม่รู้เหตุผลบ่อยๆว่าทำไม [ถึง] ใช้การทำให้เป็นมาตรฐาน" ง่ายมาก ภายใต้การทดลองซ้ำ ๆ มันแสดงให้เห็นถึงข้อผิดพลาดนอกตัวอย่างน้อย
Cliff AB

2

ปัญหาประเภทหนึ่งที่มีวิธีการตามแบบแผนเป็นประจำโดยเฉพาะอย่างยิ่งการครอบงำแบบเบย์ใด ๆ ก็คือการคาดการณ์ในกรณี M-open

M-open หมายความว่าอย่างไร

M-open หมายความว่าโมเดลจริงที่สร้างข้อมูลไม่ปรากฏในชุดของโมเดลที่เรากำลังพิจารณา ตัวอย่างเช่นถ้าค่าเฉลี่ยที่แท้จริงของเป็นกำลังสองเป็นฟังก์ชันของแต่เราพิจารณาเฉพาะโมเดลที่มีค่าเฉลี่ยฟังก์ชันเชิงเส้นของเราอยู่ใน M-open case กล่าวอีกนัยหนึ่งนางแบบ - สเปคผลในกรณี m- เปิดyxx

ในกรณีส่วนใหญ่นี่เป็นปัญหาใหญ่สำหรับการวิเคราะห์แบบเบย์ ทฤษฎีทั้งหมดที่ฉันรู้นั้นอาศัยรูปแบบการระบุอย่างถูกต้อง แน่นอนว่าในฐานะนักสถิติที่สำคัญเราควรคิดว่าแบบจำลองของเรานั้นผิดพลาดเสมอ นี่เป็นปัญหาทีเดียว ทฤษฎีของเราส่วนใหญ่ขึ้นอยู่กับแบบจำลองที่ถูกต้อง แต่เรารู้ว่ามันไม่เคยเป็น โดยพื้นฐานแล้วเราแค่ข้ามนิ้วของเราโดยหวังว่าโมเดลของเราไม่ถูกต้องเกินไป

เหตุใดวิธีการของผู้ใช้บ่อยจึงจัดการเรื่องนี้ได้ดีกว่า

ไม่ทั้งหมดทำ ตัวอย่างเช่นหากเราใช้เครื่องมือ MLE มาตรฐานสำหรับการสร้างข้อผิดพลาดมาตรฐานหรือการสร้างช่วงการทำนายเราจะไม่ดีไปกว่าการใช้วิธีการแบบเบย์

อย่างไรก็ตามมีเครื่องมือ Frequentist หนึ่งเดียวที่มีจุดประสงค์เพื่อวัตถุประสงค์นี้โดยเฉพาะอย่างยิ่ง: การตรวจสอบข้าม ที่นี่เพื่อประเมินว่าแบบจำลองของเราจะทำนายข้อมูลใหม่ได้ดีเพียงใดเราจะปล่อยข้อมูลบางส่วนเมื่อทำการปรับแบบจำลองและวัดว่าแบบจำลองของเราทำนายข้อมูลที่มองไม่เห็นได้ดีเพียงใด

โปรดทราบว่าวิธีนี้เป็นสิ่งที่ไม่สมบูรณ์อย่างยิ่งกับแบบจำลองมิสสเปคมันเป็นเพียงวิธีการที่เราประเมินว่าแบบจำลองจะทำนายข้อมูลใหม่ได้ดีเพียงใดโดยไม่คำนึงว่าแบบจำลองนั้นถูกต้องหรือไม่

ฉันไม่คิดว่ามันเป็นเรื่องยากเกินไปที่จะยืนยันว่านี้จริงๆการเปลี่ยนแปลงวิธีการสร้างแบบจำลองการคาดการณ์ที่ยากที่จะปรับจากมุมมองของเบส์ (ก่อนที่ควรจะเป็นตัวแทนของความรู้ก่อนก่อนที่ข้อมูลที่ได้เห็นการทำงานของความน่าจะเป็นรูปแบบอื่น ๆ ) ให้เป็นหนึ่ง นั่นเป็นเรื่องง่ายมากที่จะพิสูจน์จากมุมมองของผู้ใช้บ่อย (เราเลือกพารามิเตอร์โมเดล + การทำให้เป็นมาตรฐานที่การสุ่มตัวอย่างซ้ำ ๆ จะทำให้เกิดข้อผิดพลาดจากตัวอย่างที่ดีที่สุด)

สิ่งนี้ได้ปฏิวัติวิธีการอนุมานเชิงทำนายอย่างสมบูรณ์ ฉันไม่คิดว่านักสถิติใด ๆ (หรืออย่างน้อยควร) พิจารณาแบบจำลองการทำนายที่ไม่ได้สร้างหรือตรวจสอบด้วยการตรวจสอบข้ามอย่างจริงจังเมื่อมีให้ (เช่นเราสามารถสรุปการสังเกตที่สมเหตุสมผลไม่ขึ้นกับใคร) สำหรับการสุ่มตัวอย่างอคติ ฯลฯ )

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.