ข้อเสียของการวิเคราะห์แบบเบย์คืออะไร


44

การคัดค้านการใช้วิธีการทางสถิติแบบเบย์ในบริบทใดบ้าง ไม่ฉันไม่ได้หมายถึงความห่วงใยในการเลือกก่อนหน้า ฉันยินดีหากไม่ได้รับคำตอบ


5
คำถามนี้เป็นกรอบโอเค แต่ความเห็นกำลังได้รับถึงแนวของการโต้เถียงและขู่ว่าจะทะลักไปทางด้านที่ผิดของบรรทัดนั้น ระวัง ... นี่ไม่ใช่ที่สำหรับอภิปรายเช่นนี้ สร้างห้องแชทหากคุณต้องการทำเช่นนั้น
whuber

คำตอบ:


40

ฉันจะให้คำตอบคุณ สี่ข้อเสียจริง โปรดทราบว่าสิ่งเหล่านี้ไม่ได้เป็นการคัดค้านที่ควรผลักดันให้มีการวิเคราะห์อยู่บ่อยครั้ง

  1. ทางเลือกก่อน นี่คือการหาเรื่องปกติด้วยเหตุผล แต่ในกรณีของฉันมันไม่ใช่ "นักบวชผู้มีอัตวิสัย!" แต่สิ่งที่เกิดขึ้นก่อนหน้านี้มีเหตุผลที่ดีและแสดงให้เห็นถึงความพยายามที่ดีที่สุดของคุณในการสรุปก่อนหน้านี้เป็นงานที่ดีมากในหลายกรณี ยกตัวอย่างเช่นจุดประสงค์ทั้งหมดของวิทยานิพนธ์ของฉันสามารถสรุปได้ว่าเป็น "นักบวชประเมิน"
  2. มันเข้มข้นมาก โดยเฉพาะอย่างยิ่งสำหรับรุ่นที่เกี่ยวข้องกับตัวแปรมากมาย สำหรับชุดข้อมูลขนาดใหญ่ที่มีการประมาณค่าตัวแปรจำนวนมากอาจมีการคำนวณอย่างเข้มข้นโดยเฉพาะอย่างยิ่งโดยเฉพาะอย่างยิ่งในบางสถานการณ์ที่ข้อมูลไม่สามารถโยนลงในคลัสเตอร์หรือสิ่งอื่นที่คล้ายกันได้ บางวิธีในการแก้ไขปัญหานี้เช่นข้อมูลที่เพิ่มขึ้นมากกว่า MCMC นั้นค่อนข้างท้าทายในทางทฤษฎีอย่างน้อยสำหรับฉัน
  3. การแจกแจงด้านหลังนั้นค่อนข้างยากกว่าที่จะรวมเข้ากับการวิเคราะห์เมตาเว้นแต่ว่ามีการแจกแจงรายละเอียดเชิงพารามิเตอร์ของการแจกแจงแบบสม่ำเสมอ
  4. ขึ้นอยู่กับวารสารที่วิเคราะห์ไว้สำหรับการใช้งาน Bayes โดยทั่วไปหรือการเลือกนักบวชให้คะแนนกระดาษของคุณเพิ่มขึ้นเล็กน้อยซึ่งผู้วิจารณ์สามารถขุดลงไปได้ บางส่วนเป็นผู้คัดค้านผู้วิจารณ์ที่สมเหตุสมผล แต่บางคนก็เกิดจากธรรมชาติของ Bayes และผู้คนที่คุ้นเคยในบางสาขาอยู่กับมันอย่างไร

สิ่งเหล่านี้ไม่ควรหยุดคุณ แน่นอนสิ่งเหล่านี้ไม่ได้หยุดฉันและหวังว่าการวิเคราะห์แบบเบย์จะช่วยได้อย่างน้อยหมายเลข 4


2
# 1 สิ่งนี้ควรจะเป็นการวิเคราะห์ขั้นแรก ในศิลปะการตรวจสอบไฟ ในวิทยาศาสตร์การตรวจสอบไฟเชิงปริมาณ Bayesians ไม่ควรขอโทษเกี่ยวกับเรื่องนี้ หากข้อมูลมีความถี่เข้าใกล้ราวกับว่าพวกเขาเป็นอาดัมและเอวา - ดี บทที่ 1 ของปริญญาเอกของฉันคือการวิเคราะห์อภิมาน (แม้ว่าบ่อยครั้ง). Whoopdeedoo นั่นคือวิธีที่ควรจะเป็น # 2 กฎของมัวร์ฉันได้พบกับการสนทนาสั้น ๆ และการสนทนาโดยใช้ XKCD กับกลุ่มคอมพิวเตอร์ประสิทธิภาพสูงในท้องถิ่นสามารถช่วยได้มาก # 3 การวิเคราะห์ Meta ดูดทั้งสองวิธี ฉันจะสนับสนุนการวิเคราะห์ mega แบบบังคับซึ่งก็คือมอบข้อมูลของคุณเมื่อคุณเผยแพร่
rosser

7
@rosser ความคิดบางอย่าง # 1 ควรมีการตรวจสอบที่มีประสิทธิภาพและใช่ว่าควรเป็นขั้นตอนที่หนึ่ง แต่การวิเคราะห์แบบเบย์ที่เหมาะสมซึ่งควบคุมการรบกวนอย่างเหมาะสมนั้นจำเป็นต้องมีการทบทวนอย่างเต็มรูปแบบในเชิงปริมาณของตัวแปรทุกตัวที่จะรวมอยู่ในแบบจำลอง นั่นไม่ใช่งานเล็ก ๆ # 2 ทั้งนี้ขึ้นอยู่กับกฎของมัวร์เป็นความคิดที่ไม่ดี ก่อนอื่นกำไรที่ได้รับส่วนใหญ่อยู่ในระบบมัลติคอร์ / GPU ต้องการซอฟต์แวร์ที่เขียนขึ้นและปัญหาที่เกิดขึ้นจากการประมวลผลแบบขนาน รุ่น GLM เดียวที่ทำกับ MCMC อาจไม่ใช่แบบนั้น ต่อ ...
Fomite

6
@rosser และอาจมีบางครั้งที่ HPC ไม่จำเป็นต้องเป็นคำตอบ ตัวอย่างเช่นฉันทำงานในพื้นที่ที่ข้อตกลงการใช้ข้อมูลและที่คล้ายกันมักจะป้องกันไม่ให้ข้อมูลถูกเก็บไว้ในสิ่งต่าง ๆ นอกเหนือจากระบบที่มีความปลอดภัยสูง คลัสเตอร์โลคัล ... ไม่ใช่อย่างนั้น และในที่สุดกฎหมายของมัวร์ก็ดีเท่ากับงบประมาณฮาร์ดแวร์ของคุณมาก สำหรับ # 3 และ meta-analysis ฉันมักจะไม่เห็นด้วย แต่ยิ่งไปกว่านั้นมันยังคงมีปัญหาจนถึงจุดที่ระบบข้อมูลแบบเปิดทั้งหมดกลายเป็นบรรทัดฐาน
Fomite

ตกลงฉันคุยโว # 3 แต่ก่อนหน้านี้คุณมีความแตกต่างกันมากแค่ไหนในการทำนายผล? srsly? การวิเคราะห์ความไวแสดงความแตกต่างอย่างมากหรือไม่?
rosser

1
@Rosser มันอาจขึ้นอยู่กับลักษณะของการทำนายของคุณและความสัมพันธ์กับการเปิดเผยและผลลัพธ์ แต่เพื่อที่จะทำการวิเคราะห์ความอ่อนไหวใครบางคนจะต้องมีตัวแปรเหล่านั้นทั้งหมดมาก่อน บางทีฉันอาจจะเพิ่มมันเป็นบิตด้านวิทยานิพนธ์ของฉัน ฉันยังพบการเลือกใช้ความแข็งแกร่งของ Bayes แต่สมมติว่ามีนักบวชที่ไม่รู้เรื่องเกี่ยวกับตัวแปรที่ "ฉันไม่สามารถจะรู้ได้" มีปัญหา
Fomite

16

ฉันเป็นคนเบย์โดยความชอบ แต่โดยทั่วไปแล้วเป็นผู้ปฏิบัติบ่อยครั้ง สาเหตุของการทำแบบนี้คือการทำการวิเคราะห์แบบเบย์แบบเต็มรูปแบบอย่างถูกต้อง (แทนที่จะเป็นวิธีการแก้ปัญหา MAP) สำหรับประเภทของปัญหาที่ฉันสนใจนั้นมีความยุ่งยากและมีความซับซ้อนมาก บ่อยครั้งที่การวิเคราะห์แบบเบย์เต็มรูปแบบจำเป็นต้องเห็นประโยชน์ของวิธีการนี้มากกว่าการเทียบเท่าแบบประจำ

สำหรับฉันการแลกเปลี่ยนเป็นตัวเลือกระหว่างวิธีการแบบเบย์ที่มีแนวคิดที่สง่างามและเข้าใจง่าย แต่ยากที่จะนำไปใช้ในทางปฏิบัติและวิธีการที่ใช้บ่อยซึ่งเป็นแนวคิดที่น่าอึดอัดใจและบอบบาง (ลองอธิบายวิธีตีความการทดสอบสมมติฐานอย่างถูกต้องหรือ เหตุใดจึงไม่มีความน่าจะเป็น 95% ที่มูลค่าที่แท้จริงตั้งอยู่ในช่วงความมั่นใจ 95%) แต่สิ่งเหล่านี้เหมาะสำหรับการใช้งาน "ตำรา" ที่แก้ปัญหาได้ง่าย

ม้าสำหรับหลักสูตร


11

จากจุดปฏิบัติอย่างหมดจดในมุมมองของผมไม่ได้เป็นแฟนของวิธีการที่ต้องใช้จำนวนมากของการคำนวณ (ฉันคิดของกิ๊บส์ตัวอย่างและ MCMC มักใช้ในกรอบคชกรรม แต่นี้ยังนำไปใช้เช่นบูตเทคนิคในการวิเคราะห์ frequentist) เหตุผลที่การดีบั๊กใด ๆ (การทดสอบการนำไปใช้งานการดูความทนทานด้วยสมมติฐานและอื่น ๆ ) นั้นต้องอาศัยการจำลองของมอนติคาร์โลและคุณจะอยู่ในสภาพแวดล้อมการคำนวณที่รวดเร็ว ฉันชอบเทคนิคการวิเคราะห์พื้นฐานที่รวดเร็วและกำหนดได้แม้ว่าจะเป็นเพียงค่าประมาณเท่านั้น

นี่เป็นข้อคัดค้านที่ใช้งานได้จริงแน่นอน: เนื่องจากทรัพยากรการคำนวณที่ไม่มีที่สิ้นสุดการคัดค้านนี้จะหายไป และใช้ได้กับวิธีการย่อยของ Bayesian เท่านั้น นอกจากนี้ยังมีการตั้งค่ามากขึ้นให้เวิร์กโฟลว์ของฉัน


1
จนถึงตอนนี้ฉันได้ยิน 1. กฎของมัวร์ 2. ความอดทนอย่างหนัก +/- และ 3. ความไม่รู้ ต้องบอกว่าสิ่งเหล่านี้ไม่น่าเชื่อ เบย์ดูเหมือนจะเป็นกระบวนทัศน์ที่เหนือกว่า ยกตัวอย่าง ... ทำไมการศึกษา GWAS ถึงไม่ได้วิเคราะห์ a-la Bayes พวกเขาสามารถป้องกันไม่ให้โยน 99.999% ของข้อมูลออกไปได้หรือไม่?
rosser

1
ตรงกันข้าม: MCMC สามารถสอนให้เขียนโค้ดได้เร็วขึ้นและเรียนรู้จากความเจ็บปวดจากการรอให้การจำลองเสร็จสิ้น นี่เป็นประสบการณ์ของฉันในการสร้างแบบจำลอง: ถ้าใช้เวลานานในการรันฉันอาจได้รับประโยชน์จากการเรียนรู้วิธีสร้างรหัสให้เร็วขึ้น
Iterator

9

บางครั้งมีวิธีการแก้ปัญหาแบบ "คลาสสิค" ที่เรียบง่ายและเป็นธรรมชาติซึ่งในกรณีนี้วิธีการแบบเบย์อันหรูหรา (โดยเฉพาะอย่างยิ่งกับ MCMC) จะเกินความจริง

นอกจากนี้ในปัญหาประเภทการเลือกตัวแปรมันอาจจะตรงไปตรงมาและชัดเจนกว่านี้เพื่อพิจารณาสิ่งที่น่าจะเป็นโทษ อาจมีรูปแบบก่อนหน้านี้ที่ให้วิธีการแบบเบย์เทียบเท่า แต่วิธีที่ก่อนหน้านั้นสอดคล้องกับประสิทธิภาพการทำงานขั้นสุดท้ายสามารถชัดเจนน้อยกว่าความสัมพันธ์ระหว่างการลงโทษและประสิทธิภาพ

ในที่สุดวิธีการ MCMC มักจะต้องใช้ผู้เชี่ยวชาญทั้งในการประเมินการรวมกัน / การผสมและเพื่อให้เข้าใจถึงผลลัพธ์


9

ฉันค่อนข้างใหม่กับวิธีการแบบเบย์ แต่สิ่งหนึ่งที่ทำให้ฉันรู้สึกแย่คือในขณะที่ฉันเข้าใจเหตุผลของนักบวช (เช่นวิทยาศาสตร์เป็นความพยายามสะสมดังนั้นสำหรับคำถามส่วนใหญ่มีประสบการณ์ / ความคิดก่อนหน้าจำนวนหนึ่งที่ควรแจ้งให้คุณทราบ การตีความข้อมูล) ฉันไม่ชอบวิธีการแบบเบย์ที่บังคับให้คุณผลักดันตัวตนไปสู่จุดเริ่มต้นของการวิเคราะห์ทำให้เกิดผลลัพธ์สุดท้ายขึ้นมา ฉันเชื่อว่านี่เป็นปัญหาด้วยเหตุผลสองประการ: 1) ผู้อ่านที่มีความรอบรู้น้อยกว่าจะไม่สนใจแม้แต่นักบวช 2) เว้นแต่ว่าข้อมูลดิบนั้นมีอยู่มันเป็นเรื่องยากสำหรับผู้อ่านที่จะใส่กรอบผลลัพธ์ใหม่ให้กับนักบวชส่วนตัว นี่คือเหตุผลที่ฉันชอบอัตราส่วนความน่าจะเป็น

(นักวิจารณ์ที่ชาญฉลาดจะทราบว่าแม้อัตราความน่าจะเป็นคือ "เกิดขึ้น" ในแง่ที่ว่ามันเกิดขึ้นกับการทำให้เป็นพารามิเตอร์ของแบบจำลองที่นำมาเปรียบเทียบ; อย่างไรก็ตามนี่เป็นคุณลักษณะที่ใช้ร่วมกันโดยวิธีการทั้งหมด


9
ปัญหาการสนทนาของนักสถิติประจำคือความเป็นตัวตนอยู่ที่นั่น แต่มันไม่ได้พูดถึงเลย ปัญหา (ในทางปฏิบัติ) ที่มีอัตราส่วนความน่าจะเป็นคือพวกเขาอยู่บนพื้นฐานของการปรับความเหมาะสมของโอกาสและด้วยเหตุนี้จึงไม่สนใจความจริงที่ว่าอาจมีวิธีแก้ปัญหาอื่น ๆ ที่มีโอกาสน้อยกว่าเล็กน้อย นั่นคือสิ่งที่ปัจจัย Bayes มีประโยชน์ แต่มันก็เป็น "ม้าสำหรับหลักสูตร" เสมอ
Dikran Marsupial

6

ทฤษฎีการตัดสินใจเป็นทฤษฎีพื้นฐานที่สถิติดำเนินการ ปัญหาคือหาขั้นตอนที่ดี (ในบางแง่มุม) สำหรับการตัดสินใจจากข้อมูล อย่างไรก็ตามมีตัวเลือกขั้นตอนที่ชัดเจนน้อยมากในแง่ของการลดการสูญเสียที่คาดหวังดังนั้นเกณฑ์อื่น ๆ จะต้องเรียกให้เลือกระหว่างพวกเขา การเลือกโพรซีเดอร์ที่เป็น Bayes สำหรับบางอันก่อนหน้านั้นเป็นหนึ่งในเกณฑ์เหล่านี้ แต่อาจไม่ได้เป็นอย่างที่คุณต้องการเสมอไป Minimax อาจมีความสำคัญมากกว่าในบางกรณีหรือไม่ลำเอียง

ใครก็ตามที่ยืนยันว่าผู้ใช้บ่อยผิดหรือ Bayesians หรือผิดนั้นส่วนใหญ่จะเปิดเผยความไม่รู้ทางสถิติ


5

บางครั้งฉันต้องการที่จะให้ความรู้เพิ่มเติมเกี่ยวกับวิธีการแบบเบย์ในการสร้างแบบจำลองเพื่อให้ผ่านความเข้าใจคร่าวๆของฉัน (ฉันได้เขียนโค้ดตัวอย่างกิ๊บส์ในงานหลักสูตรบัณฑิตศึกษา แต่ไม่เคยทำอะไรจริงเลย) ระหว่างที่ฉันคิดว่าเอกสารของ Brian Dennis บางคนได้รับการกระตุ้นและหวังว่าฉันจะได้พบเพื่อนชาว Bayesian (คนที่ไม่ได้อยู่ในตู้เสื้อผ้า) เพื่ออ่านเอกสารและได้ยินความเห็นของพวกเขา ดังนั้นนี่คือเอกสารที่ฉันอ้างถึง แต่คำพูดที่ฉันจำได้เสมอคือ

การเป็นเบย์หมายความว่าไม่ต้องพูดว่าคุณผิด

http://faculty.washington.edu/skalski/classes/QERM597/papers/Dennis_1996.pdf http://classes.warnercnr.colostate.edu/nr575/files/2011/01/Lele-and-Dennis-2009.pdf


1
กระดาษแผ่นแรก (ยังไม่ได้อ่านที่สอง) ดูเหมือนจะเพิ่มเติมเกี่ยวกับวิธีการ Bayes ปฏิบัติกับทฤษฎี ในแบบจำลองการปฏิบัติไม่ได้รับการตรวจสอบอย่างเข้มงวดเท่าที่ควร แต่ในทางทฤษฎีสถิติแบบเบย์มีสิ่งอำนวยความสะดวกการตรวจสอบแบบจำลองที่เหนือกว่าเรียกว่า "หลักฐาน" โดย Jaynes ซึ่งเป็นตัวเป็นตนในส่วนของ P (D | model) ของกฎ Bayes ด้วยคุณสามารถเปรียบเทียบความเหมาะสมของแบบจำลองสิ่งที่คุณสามารถทำได้เพียงสังเกตุในสถิติบ่อยครั้ง ปัญหาของหลักสูตรคือว่าหลักฐานที่เป็นเรื่องยากในการคำนวณเพื่อคนส่วนใหญ่ไม่สนใจมันและคิดว่าหลังเป็นทุกปัจจัยสำคัญ (ต่อ)
cespinoza

2
จุด 2 ลองใช้ googling "skilling nested sampling" และคุณจะพบกระดาษในวิธี MCMC สำหรับการคำนวณหลักฐาน (มีวิธีการตรวจสอบรูปแบบอื่น ๆ ที่ไม่มีหลักฐานเช่นกัน: Gelman ตรวจสอบแบบจำลองของเขาโดยการสุ่มตัวอย่างจากการคาดการณ์หลังและเปรียบเทียบว่า (มองเห็นหรืออย่างอื่น) กับข้อมูลจริง) บางคนถึงกับแนะนำว่า พื้นที่ของแบบจำลองของตัวเองเพื่อทำให้ด้อยกว่า อีกสิ่งหนึ่งที่เราเห็นบนขอบฟ้าก็คืออ่าวแบบไม่มีพารามิเตอร์ซึ่งแก้ปัญหาได้ด้วยการอนุญาตให้ใช้แบบจำลองที่หลากหลายกว่าแบบจำลองแบบพารามิเตอร์แบบดั้งเดิม
cespinoza

5
นอกจากนี้ฉันขอแนะนำให้คุณดูvideolectures.net/mlss09uk_jordan_bfwayโดย Michael I. Jordan ศาสตราจารย์ที่เบิร์กลีย์ซึ่งค่อนข้างสมดุลในมุมมองของเขาเกี่ยวกับ Bayes vs Freq "สงคราม". ฉันไม่สามารถแสดงความคิดเห็นในช่วงครึ่งหลังของกระดาษ b / c แรกฉันไม่รู้การอ้างอิงทางนิเวศวิทยาใด ๆ ฉันจะอ่านอันที่สองในภายหลัง
cespinoza

1
@cespinoza: ฉันกำลังคิดเกี่ยวกับวิธีการทำงาน กระดาษกล่าวว่า Bayesian จะไม่ดูส่วนที่เหลือ (เช่นการเปรียบเทียบแบบจำลองการส่งออกไปยังข้อมูลจริง) และบางทีคนแบบ Bayesian อาจละทิ้งหลักการนี้ได้ แต่ผู้ปฏิบัติงานอย่าง Gelman จะเปรียบเทียบผลลัพธ์แบบจำลอง ฉันไม่รู้มากพอที่จะไปไกลกว่านี้ แต่ความประทับใจของฉันต่อเอกสารก็คือพวกเขาตั้งค่า "ในหลักการ" ผู้ชายฟางเพื่อโจมตี
Wayne

1
เพียงแค่เพิ่มว่า Bayesian ที่ไม่ได้ตรวจสอบส่วนที่เหลือเป็นสถิติที่ไม่ดี โดยปกติแล้ววิธีการแบบเบย์จะใช้กับรุ่น "หยาบและพร้อม" และก่อนหน้า การตรวจสอบสิ่งที่เหลืออยู่เป็นวิธีหนึ่งในการดูว่าคุณมีความรู้เพียงพอในรุ่นก่อนหน้าและโมเดล มันจับมือกันด้วยการตรวจสอบว่าทฤษฎีใดที่มีแบบจำลองของคุณและสิ่งที่เคยมีมาก่อน
ความน่าจะเป็นทาง

5

อะไรคือปัญหาที่เปิดกว้างในสถิติแบบเบย์จากรายการจดหมายข่าวรายไตรมาสของ ISBA 5 ปัญหาเกี่ยวกับสถิติแบบเบย์จากผู้นำที่แตกต่างกันในภาคสนามอันดับที่ 1 ความน่าเบื่อหน่าย "การเลือกแบบจำลองและการทดสอบสมมติฐาน"


3
ทำไมน่าเบื่อ! นี่เป็นวิธีการทางสถิติที่ใช้บ่อยที่สุด
ซีอาน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.