ทำไมสถิติแบบเบย์ไม่เป็นที่นิยมสำหรับการควบคุมกระบวนการทางสถิติ?


18

ความเข้าใจของฉันเกี่ยวกับการถกเถียงกันอย่างเบยส์ vs บ่อยเป็นสถิติที่บ่อย:

  • มีวัตถุประสงค์ (หรืออ้างว่าเป็น)
  • หรืออย่างน้อยก็ไม่เอนเอียง
  • นักวิจัยที่แตกต่างกันดังนั้นการใช้สมมติฐานที่แตกต่างกันยังคงสามารถรับผลการเปรียบเทียบเชิงปริมาณได้

ในขณะที่สถิติแบบเบย์

  • อ้างว่าทำการคาดคะเน "ดีกว่า" (เช่นการสูญเสียต่ำกว่าที่คาด) เนื่องจากสามารถใช้ความรู้เดิม (ท่ามกลางเหตุผลอื่น ๆ )
  • ต้องการตัวเลือก "เฉพาะกิจ" น้อยลงแทนที่ด้วยตัวเลือกก่อนหน้า / แบบจำลองที่ (อย่างน้อยในหลักการ) มีการตีความในโลกแห่งความเป็นจริง

ระบุว่าฉันจะคาดหวังว่าสถิติแบบเบย์จะได้รับความนิยมอย่างมากใน SPC: ถ้าฉันเป็นเจ้าของโรงงานที่พยายามควบคุมคุณภาพกระบวนการของฉัน ถ้าฉันสามารถลดได้เพราะฉันมีความรู้ล่วงหน้ามากกว่า / คู่แข่งที่ดีกว่าของฉันดียิ่งขึ้น

แต่ในทางปฏิบัติทุกสิ่งที่ฉันได้อ่านเกี่ยวกับ SPC ดูเหมือนจะเป็นประจำอย่างแน่นอน (เช่นไม่มีการแจกแจงก่อนหน้าการประมาณค่าพารามิเตอร์ทั้งหมดตัวเลือก Ad-hoc จำนวนมากเกี่ยวกับขนาดตัวอย่างค่า p ฯลฯ )

ทำไมถึงเป็นอย่างนั้น? ฉันเห็นได้ว่าทำไมสถิติบ่อยครั้งจึงเป็นตัวเลือกที่ดีกว่าในปี 1960 เมื่อ SPC ใช้ปากกาและกระดาษ แต่ทำไมไม่มีใครลองใช้วิธีการอื่นตั้งแต่นั้นมา


2
ฉันคิดว่าสถิติแบบเบย์เป็นกล้อง Digital SLP ของฉันในขณะที่กล้อง iPhone เป็นประจำ ฉันซื้อทั้งคู่มาบ้าง แต่ใช้ DSLR น้อยกว่า 5% ของรูปถ่ายในขณะที่วางโทรศัพท์ 95% เพราะเป็นเรื่องง่ายสะดวกและพกพาสะดวกและมีเวลาให้ตามคุณภาพ (ตามทักษะ DSLR ของฉัน) เช่นเดียวกับการรวมไพรเออร์และเชนการทำงานในเฮย์สฉันต้องหาสมดุลที่เหมาะสมของระยะเวลาเปิดรูรับแสงความยาวและพารามิเตอร์อื่น ๆ Iphone ยอดนิยม
Ram Sharma

@ RamSharma คุณควรโพสต์นั้นเป็นคำตอบ! ฉันชอบดีกว่ามีดเชฟของฉัน
shadowtalker

คำตอบ:


18

คำเตือนฉันเขียนคำตอบนี้เมื่อนานมาแล้วด้วยความคิดที่น้อยมากที่ฉันพูดถึง ฉันไม่สามารถลบได้เพราะเป็นที่ยอมรับ แต่ฉันไม่สามารถยืนอยู่ข้างหลังเนื้อหาส่วนใหญ่ได้


นี่เป็นคำตอบที่ยาวมากและฉันหวังว่ามันจะมีประโยชน์ในทางใดทางหนึ่ง SPC ไม่ใช่พื้นที่ของฉัน แต่ฉันคิดว่าความคิดเห็นเหล่านี้เป็นเรื่องทั่วไปพอที่จะนำไปใช้ที่นี่

ฉันขอยืนยันว่าประโยชน์ที่ได้รับการอ้างถึงมากที่สุด - ความสามารถในการรวมความเชื่อก่อนหน้า - เป็นข้อได้เปรียบที่อ่อนแอที่ถูกนำไปใช้ / สาขาเชิงประจักษ์ นั่นเป็นเพราะคุณต้องคำนวณปริมาณของคุณก่อน แม้ว่าฉันสามารถพูดได้ว่า "ดีระดับ z เป็นไปไม่ได้แน่นอน" ฉันทำไม่ได้สำหรับชีวิตของฉันที่จะบอกคุณว่าจะเกิดอะไรขึ้นด้านล่าง z หากผู้เขียนไม่ได้เริ่มเผยแพร่ข้อมูลดิบของพวกเขาใน droves การคาดเดาที่ดีที่สุดของฉันสำหรับนักบวชนั้นเป็นช่วงเวลาที่มีเงื่อนไขจากการทำงานก่อนหน้านี้

โดยทั่วไปเทคนิคของเบย์ (อย่างน้อยก็ในระดับแนวคิด) นั้นยอดเยี่ยมสำหรับเมื่อคุณมีสมมติฐาน / ความคิด / โมเดลที่แข็งแกร่งและต้องการนำไปใช้กับข้อมูลจากนั้นดูว่าคุณผิดหรือผิดอย่างไร แต่บ่อยครั้งที่คุณไม่ต้องการดูว่าคุณถูกต้องเกี่ยวกับรูปแบบเฉพาะสำหรับกระบวนการทางธุรกิจของคุณหรือไม่ มีโอกาสมากขึ้นที่คุณไม่มีโมเดลและกำลังมองหาเพื่อดูว่ากระบวนการของคุณกำลังทำอะไรอยู่ คุณไม่ต้องการที่จะผลักดันข้อสรุปของคุณไปรอบ ๆ คุณต้องการข้อมูลของคุณที่จะผลักดันข้อสรุปของคุณ หากคุณมีข้อมูลเพียงพอนั่นคือสิ่งที่จะเกิดขึ้นต่อไป แต่ในกรณีนั้นทำไมต้องกังวลกับข้อมูลก่อนหน้า บางทีนั่นอาจเป็นเรื่องที่สงสัยและเสี่ยงเกินไป แต่ฉันไม่เคยได้ยินชื่อนักธุรกิจที่มองโลกในแง่ดีที่ประสบความสำเร็จเช่นกัน ไม่มีวิธีใดที่จะบอกปริมาณความไม่แน่นอนของคุณเกี่ยวกับความเชื่อของคุณและคุณจะไม่เสี่ยงต่อการเกิดความมั่นใจในสิ่งที่ผิด ดังนั้นคุณตั้ง uninformative ก่อนและข้อได้เปรียบจะหายไป

สิ่งนี้น่าสนใจในกรณี SPC เนื่องจากการตลาดดิจิทัลกระบวนการทางธุรกิจของคุณไม่ได้อยู่ในสภาวะที่ไม่สามารถคาดเดาได้ ความประทับใจของฉันคือกระบวนการทางธุรกิจมีแนวโน้มที่จะเปลี่ยนแปลงโดยเจตนาและเพิ่มขึ้นเรื่อย ๆ นั่นคือคุณมีเวลานานในการสร้างนักบวชที่ดีและปลอดภัย แต่จำไว้ว่านักบวชล้วนเกี่ยวกับการเผยแพร่ความไม่แน่นอน กระทำกัน Bayesianism มีความได้เปรียบที่ว่ามันอคติแพร่กระจายความไม่แน่นอนทั่วลึกซ้อนกันกระบวนการสร้างข้อมูล สำหรับฉันแล้วสิ่งที่สถิติของ Bayesian นั้นดีสำหรับฉัน และหากคุณกำลังมองหาความน่าเชื่อถือของกระบวนการของคุณนอกเหนือจากการตัด 1-in-20 "นัยสำคัญ" ดูเหมือนว่าคุณต้องการบัญชีสำหรับความไม่แน่นอนให้มากที่สุด

ดังนั้นโมเดลของ Bayesian อยู่ที่ไหน ก่อนอื่นพวกเขาใช้ยาก. ในการพูดอย่างตรงไปตรงมาฉันสามารถสอน OLS ให้กับวิศวกรเครื่องกลได้ใน 15 นาทีและให้เขาบีบการถดถอยและทดสอบ t-in ใน Matlab ในอีก 5 เพื่อใช้ Bayes ฉันต้องตัดสินใจก่อนว่าแบบที่ฉันเหมาะสม จากนั้นดูว่ามีห้องสมุดแบบสำเร็จรูปสำหรับภาษาที่ บริษัท ของฉันรู้จักหรือไม่ ถ้าไม่ฉันต้องใช้ BUGS หรือ Stan และจากนั้นฉันต้องเรียกใช้แบบจำลองเพื่อให้ได้คำตอบพื้นฐานและใช้เวลาประมาณ 15 นาทีสำหรับเครื่อง 8-core i7 มากสำหรับการสร้างต้นแบบอย่างรวดเร็ว และอย่างที่สองตามเวลาที่คุณได้รับคำตอบคุณใช้เวลาในการเข้ารหัสและรอสองชั่วโมงเท่านั้นเพื่อให้ได้ผลลัพธ์เดียวกันกับที่คุณใช้กับเอฟเฟกต์แบบสุ่มบ่อยครั้งพร้อมข้อผิดพลาดมาตรฐานแบบคลัสเตอร์ บางทีนี่อาจเป็นเรื่องที่น่าเกรงขามและไม่ถูกต้องและฉันก็ไม่เข้าใจ SPC เลย

ผมเปรียบเสมือน Bayesianism จะมากดที่มีคุณภาพสูงพ่อครัว stockpot และกระทะ Sautee ; frequentism เป็นเหมือนห้องครัวเต็มรูปแบบของเครื่องมือในฐานะที่เป็นการกระทำ-On-โทรทัศน์เช่น slicers กล้วยและหม้อพาสต้าที่มีรูในฝาสำหรับการระบายน้ำได้ง่าย หากคุณเป็นพ่อครัวที่มีประสบการณ์มากมายในครัว - แน่นอนว่าในห้องครัวของคุณมีความรู้ที่สำคัญซึ่งสะอาดและเป็นระเบียบและคุณรู้ว่าทุกอย่างอยู่ที่ไหน - คุณสามารถทำสิ่งที่น่าอัศจรรย์ด้วยการเลือกขนาดเล็กของคุณ เครื่องมือสุดหรูคุณภาพสูง หรือคุณสามารถใช้เครื่องมือ ad-hoc * เล็ก ๆ น้อย ๆ ที่แตกต่างกันซึ่งต้องใช้ทักษะเป็นศูนย์ในการทำอาหารที่เรียบง่ายไม่เลวเลยครึ่งและมีรสชาติพื้นฐานสองอย่างที่ได้รับมา คุณเพิ่งกลับถึงบ้านจากเหมืองข้อมูลและคุณต้องการผลลัพธ์ คุณปรุงอาหารอะไร

* เบส์เป็นเพียงเป็น Ad-hoc แต่น้อยโปร่งใสดังนั้น ไวน์มีปริมาณเท่าใดใน coq au vin ของคุณ? ไม่มีความคิดคุณมองมันเพราะคุณเป็นมืออาชีพ หรือคุณไม่สามารถบอกความแตกต่างระหว่าง Pinot Grigio และ Pinot Noir ได้ แต่สูตรแรกของ Epicurious ที่บอกให้ใช้สีแดง 2 ถ้วยนั่นคือสิ่งที่คุณจะทำ อันไหนมากกว่า "ad-hoc?"


1
+1, คำตอบที่ดี ฉันอยากรู้: คุณสามารถเพิ่มย่อหน้าเกี่ยวกับขนาดตัวอย่างขนาดเล็ก / แบบปรับตัวได้หรือไม่ ใน SPC ขนาดตัวอย่าง 3-5 ดูเหมือนจะเป็นเรื่องธรรมดา และหากซอฟต์แวร์ SPC สามารถบอกช่างหลังจาก 2 ตัวอย่างว่าต้องการตัวอย่างอีก 3 ตัวอย่างจริงหรือไม่นั่นเป็นคุณสมบัติที่ยอดเยี่ยม ด้วยแบบจำลองแบบเบย์นั้นแทบจะไม่เป็นเรื่องง่าย: กำหนดค่าใช้จ่ายสำหรับการวัดผลบวกปลอมและ -negatives จากนั้นประเมินค่าใช้จ่ายที่คาดหวังจากการวัดอื่นเทียบกับการหยุด ในสถิติบ่อยคุณจะต้องจัดการกับผลกฎการหยุดแปลก ๆ (คุณสามารถสอนเหล่านั้นกับฉันใน 15 นาที?)
nikie

1
สำหรับขนาดของกลุ่มตัวอย่างปัญหาและผมจะได้กล่าวถึงนี้ถ้าฉันได้รู้จักกลุ่มตัวอย่างพบว่ามีขนาดเล็กคือมีน้อยมากสังเกตประมาณการของคุณจะมากความไวต่อการเลือกของคุณก่อน คุณไม่สามารถได้รับเลือดจากหินดังนั้นมันจึงเป็นการแลกเปลี่ยน: ไม่ว่าคุณจะล้นเหลือกับผู้ประเมินบ่อย ๆ แต่ทำได้โดยมีข้อสันนิษฐานน้อย ๆ หรือคุณรวมความรู้ของคุณเอง โดยพื้นฐานแล้วพอดีกับข้อมูลที่คุณมีต่อหน้าคุณและ "ข้อมูล" ที่คุณมีอยู่ในหัว คุณได้รับอนุญาตให้มีเครื่องแบบก่อนหน้าในหัวของคุณ
shadowtalker

1
โดยทั่วไปเบย์ทำให้นักวิเคราะห์ใช้ภาระสมองมากขึ้นในช่วงแรก โดยส่วนตัวฉันคิดว่าการเกลียดชังความคิดเรื่องการตั้งค่าไพรเออร์เป็นสัญญาณที่บ่งบอกว่าคุณก) ขี้เกียจเกินไปหรือข) ไม่เข้าใจวิธีการทำงานของสถิติอย่างแท้จริง ฉันบอกว่ามันยากที่จะหาจำนวนนักบวชในคำตอบของฉัน จริง ๆ แล้วฉันไม่เห็นด้วยกับสิ่งนั้นในทางปฏิบัติ สิ่งหนึ่งที่คุณสามารถทำได้คือวาดเส้นโค้งบนหน้ากระดาษและถามตัวเองว่า "ฉันคาดหวังว่าข้อมูลของฉันจะเป็นอย่างนั้นหรือ" ถ้าไม่เริ่มปรับแต่งเส้นโค้ง และถ้าคุณไม่สามารถตัดสินใจได้ว่าจะติดโหมดไหน
shadowtalker

2
คำถามหนึ่ง (ไม่ได้หมายความว่าจะเป็นคนใจร้อน): คุณรู้หรือไม่ว่ามีวรรณกรรมเกี่ยวกับ (เชิงปริมาณ) ที่ชักชวนความเชื่อก่อนหน้าใช่ไหม? รวมถึงความเชื่อที่เผยแพร่การสัมภาษณ์จากผู้เชี่ยวชาญและความเชื่อที่ไม่ใช่ผู้เชี่ยวชาญและความเชื่อในตนเอง เหตุผลที่ฉันถามคือฉันเคยได้ยินคำร้องเรียนนี้มาก่อน แต่ผู้เขียนข้อร้องเรียนดังกล่าวคิดว่าการคัดค้านของพวกเขาคือจุดสิ้นสุดของการอภิปรายมากกว่าที่จะเริ่มต้นการสอบสวน
Alexis

1
@CliffAB น่าสนใจ ... ฉันยังไม่ได้อ่านวรรณกรรมอย่างลึกซึ้ง (เบอร์นาร์โด, Kaas, Garthwaite ... จากหลายทศวรรษหลัง) ... แต่นั่นเป็นวิทยาศาสตร์ที่คุ้มค่าสำหรับคุณ: ความเชื่อก่อนหน้านี้แตกต่างกันแจ้งให้ทราบว่า ;)
Alexis

5

ในความเห็นที่ต่ำต้อยของฉันสถิติแบบเบย์ได้รับผลกระทบจากข้อบกพร่องบางอย่างที่ขัดแย้งกับการใช้งานอย่างแพร่หลาย (ใน SPC แต่ในภาคการวิจัยอื่น ๆ เช่นกัน):

  1. มันเป็นเรื่องยากกว่าที่จะได้รับการประเมินเทียบกับคู่บ่อยของมัน (ส่วนที่กว้างที่สุดของชั้นเรียนเกี่ยวกับสถิตินำมาใช้วิธีการบ่อยครั้งโดยวิธีการมันจะน่าสนใจที่จะตรวจสอบว่านี่คือสาเหตุหรือผลกระทบของความนิยมที่ จำกัด )

  2. บ่อยครั้งที่สถิติแบบเบย์กำหนดตัวเลือกเกี่ยวกับวิธีการต่าง ๆ ในการจัดการกับปัญหาเดียวกัน (เช่นก่อนที่ดีที่สุด?) ไม่ใช่แค่คลิกและดู (อย่างไรก็ตามวิธีการนี้ไม่ควรได้รับการสนับสนุนภายใต้กรอบบ่อยครั้งเช่นกัน)

  3. สถิติแบบเบย์มีบางหัวข้อที่จัดการได้ยากโดยนักสถิติที่มีประสบการณ์น้อย (เช่นนักบวชที่ไม่เหมาะสม )

  4. มันต้องมีการวิเคราะห์ความไว (มักจะหลีกเลี่ยงภายใต้กรอบบ่อย) และข้อยกเว้นสำหรับบางหัวข้อเช่นการวิเคราะห์ข้อมูลที่ขาดหายไป

  5. มันมีซอฟแวร์เพียงตัวเดียว (ที่สามารถดาวน์โหลดได้) ที่สามารถดาวน์โหลดได้ฟรีสำหรับการคำนวณ

  6. มันต้องใช้เวลามากกว่าที่จะเป็นนักวิจัยอิสระกับ Bayesian มากกว่าด้วยเครื่องมือที่ใช้บ่อย


6
คำตอบที่ดี แต่ฉันไม่เห็นด้วยกับประเด็นที่ 5: ฉันสามารถนึกถึงซอฟต์แวร์ (ฟรี) ที่แตกต่างกันมากมายสำหรับการวิเคราะห์แบบเบย์: WinBUGS, OpenBUGS, JAGS, Stan, PyMC ... และฉันแน่ใจว่ามีอีกมาก สิ่งที่ฉันจะพูดคือซอฟต์แวร์เหล่านี้มีช่วงการเรียนรู้ที่สูงชันและต้องการโปรแกรมและความรู้ทางสถิติในปริมาณที่เหมาะสม
COOLSerdash

COOLSerdash นั้นถูกต้องและฉันยินดีต้อนรับทั้งคำชี้แจงและความคิดเห็น การขาดความครอบคลุมของฉันในการแสดงรายการซอฟต์แวร์การวิเคราะห์แบบเบย์อาจมาจากความคุ้นเคย (หลวม) ของฉันกับ WinBugs เท่านั้น
คาร์โล Lazzaro

@CarloLazzaro ฉันเห็นด้วยกับประเด็นของ COOLSerdash เกี่ยวกับ # 5 เช่นกัน: ตั้งแต่วันที่ 14, แพคเกจสถิติส่วนตัวที่ได้รับใบอนุญาตยังเป็นกระแสหลัก Stata ในขณะนี้ได้รวมแบบจำลอง Bayesian และการประมาณค่าในแพ็คเกจวานิลลา ฉันคิดว่าความพร้อมใช้งานการคำนวณแบบเบย์จะเพิ่มขึ้นเท่านั้น แต่ประเด็นอื่น ๆ ของคุณมีความสำคัญและควรช่วยแจ้งวาระการประชุมของผู้เสนอแบบเบย์
Alexis

@Alexis: เป็นผู้ใช้ Stata ฉันมีความสุขกับรสชาติเบย์ที่ผ่านมาค่อนข้างมาก ตามความคิดทั่วไปฉันจะรับรองการเรียนรู้วิธีการทั้งแบบประจำและแบบเบย์ในระหว่างชั้นเรียนสถิติที่มหาวิทยาลัย
Carlo Lazzaro

3

เหตุผลหนึ่งคือสถิติของ Bayesian นั้นไม่ได้อยู่ในกระแสหลักจนกระทั่งประมาณปี 1990 เมื่อฉันศึกษาสถิติในช่วงปี 1970 มันเกือบจะเป็นเรื่องนอกรีต (ไม่ใช่ทุกที่ แต่ในหลักสูตรบัณฑิตศึกษาส่วนใหญ่) ไม่ได้ช่วยว่าปัญหาที่น่าสนใจส่วนใหญ่จะยากนัก เป็นผลให้เกือบทุกคนที่สอนสถิติวันนี้ (และทบทวนบทความสำหรับวารสารและหลักสูตรการออกแบบ) ได้รับการฝึกฝนเป็นผู้ฝึกสอนบ่อยครั้ง สิ่งต่าง ๆ เริ่มเปลี่ยนไปในราวปี 1990 ด้วยความนิยมของวิธีการมาร์คอฟเชนมอนติคาร์โล (MCMC) ซึ่งค่อย ๆ ค้นหาวิธีของพวกเขาเป็นแพ็กเกจเช่น SAS และ Stata โดยส่วนตัวแล้วฉันคิดว่าพวกเขาจะพบเห็นได้ทั่วไปมากขึ้นใน 10 ปีแม้ว่าในแอปพลิเคชันพิเศษ (SPC) พวกเขาอาจไม่ได้เปรียบมากนัก

กลุ่มหนึ่งที่ให้การวิเคราะห์แบบเบย์มีอยู่อย่างกว้างขวางมากขึ้นคือกลุ่มที่พัฒนาแพ็คเกจ STAN (mc-stan.org)


ยินดีต้อนรับสู่เว็บไซต์ของเรา! เพียงแค่ทราบว่าเป็น "Stata" มากกว่า "STATA" - ฉันใช้ผิดฐานของผู้ใช้ Stata เมื่อฉันพิมพ์ด้วยตัวเอง! (ฉันคิดว่ามันเหมือน SAS, SPSS ฯลฯ แต่ดูเหมือนจะไม่ ... )
Silverfish
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.