รายการสถานการณ์ที่วิธีการแบบเบย์นั้นง่ายกว่าใช้งานได้จริงหรือสะดวกกว่า


63

มีการถกเถียงกันมากมายในสถิติระหว่าง Bayesians และผู้ใช้บ่อย ฉันมักจะพบสิ่งเหล่านี้ค่อนข้างวาง (แม้ว่าฉันคิดว่ามันจะตายลง) ในทางกลับกันฉันได้พบกับคนหลายคนที่มองปัญหาอย่างจริงจังโดยบอกว่าบางครั้งมันสะดวกกว่าที่จะทำการวิเคราะห์เป็นประจำและบางครั้งมันก็ง่ายกว่าที่จะทำการวิเคราะห์แบบเบย์ ฉันพบว่ามุมมองนี้ใช้งานได้จริงและสดชื่น

มันเกิดขึ้นกับฉันว่ามันจะมีประโยชน์หากมีรายการของกรณีดังกล่าว เพราะมีการวิเคราะห์ทางสถิติมากเกินไปและเพราะฉันคิดว่ามันเป็นเรื่องปกติในทางปฏิบัติมากขึ้นในการทำการวิเคราะห์แบบประจำ (การเข้ารหัส t-test ใน WinBUGS นั้นมีความเกี่ยวข้องมากกว่าการเรียกใช้ฟังก์ชันเดียวเพื่อดำเนินการเวอร์ชันที่ใช้บ่อยใน R ตัวอย่างเช่น) จะเป็นการดีถ้ามีรายการของสถานการณ์ที่วิธีการแบบเบย์นั้นง่ายกว่าใช้งานได้จริงและ / หรือสะดวกกว่าวิธีที่ใช้เป็นประจำ


(สองคำตอบที่ฉันไม่สนใจคือ: 'เสมอ' และ 'ไม่เคย' ฉันเข้าใจว่าผู้คนมีความคิดเห็นที่ดี แต่โปรดอย่าออกอากาศพวกเขาที่นี่ถ้ากระทู้นี้กลายเป็นสถานที่สำหรับการทะเลาะวิวาทย่อยฉันอาจจะลบ มันเป้าหมายของฉันที่นี่คือการพัฒนาทรัพยากรที่จะเป็นประโยชน์สำหรับนักวิเคราะห์ที่มีงานต้องทำไม่ใช่ขวานที่จะบด)

ผู้คนสามารถแนะนำมากกว่าหนึ่งกรณีได้ แต่โปรดใช้คำตอบแยกต่างหากเพื่อให้แต่ละสถานการณ์สามารถประเมิน (โหวต / อภิปราย) เป็นรายบุคคล คำตอบควรรายการ: (1) สิ่งที่ธรรมชาติของสถานการณ์ที่เป็นและ (2) ทำไมวิธีคชกรรมง่ายในกรณีนี้ บางรหัส (พูดใน WinBUGS) แสดงให้เห็นว่าการวิเคราะห์จะทำอย่างไรและทำไมรุ่น Bayesian จึงใช้งานได้ดีกว่านั้นจะเหมาะ แต่ฉันคาดหวังว่าจะยุ่งยากเกินไป หากสามารถทำได้อย่างง่ายดายฉันจะขอบคุณ แต่โปรดระบุเหตุผลว่าทำไมทั้งสองวิธี

ในที่สุดฉันรู้ว่าฉันไม่ได้กำหนดความหมายสำหรับวิธีการหนึ่งที่จะ 'ง่ายกว่า' อีกวิธีหนึ่ง ความจริงก็คือฉันไม่แน่ใจว่าสิ่งใดที่ควรมีความหมายสำหรับวิธีการหนึ่งที่จะนำไปปฏิบัติได้มากกว่าวิธีอื่น ฉันเปิดรับข้อเสนอแนะต่าง ๆ เพียงระบุการตีความของคุณเมื่อคุณอธิบายว่าทำไมการวิเคราะห์แบบเบย์จึงสะดวกกว่าในสถานการณ์ที่คุณพูดคุย


7
การสร้างแบบจำลองหลายระดับนั้นง่ายสำหรับชาวเบย์โดยเฉพาะอย่างยิ่งแนวคิด
ความเป็นไปได้ทางการเงิน

ผู้ถามอาจไม่ชอบสิ่งนี้ แต่ไม่มีการคิดและทำความเข้าใจเกี่ยวกับสิ่งที่การอนุมานหรือวิธีการสร้างแบบจำลองกำลังทำอยู่จริง ๆ และวิธีตีความพวกเขา มันมีเหตุผลเล็กน้อยที่จะแสวงหาซึ่งง่ายกว่าเมื่อพวกเขาบรรลุเป้าหมายที่แตกต่างกัน

1
ฉันสบายดีที่มีคำแนะนำให้คิดอย่างชัดเจนเกี่ยวกับสิ่งที่คุณพยายามทำและวิธีการทำงานของการวิเคราะห์ @Mayo ฉันได้รับคำแนะนำนั้นเอง ;-) ฉันยังคุ้นเคยกับความคิดที่ว่าการวิเคราะห์แบบเบย์ & บ่อยครั้งทำให้สมมติฐานต่าง ๆ เกี่ยวกับธรรมชาติของความน่าจะเป็น อย่างไรก็ตามตามที่ฉันทราบในคำถามฉันได้พบกับคนหลายคน (เช่นสถิติของปริญญาเอกที่เข้าใจปัญหาค่อนข้างดี) ที่บอกว่ามีบางครั้งที่พวกเขามีความคล้ายคลึงกันมากพอและที่ 1 สะดวกกว่า คำตอบอื่น ๆ แสดงให้เห็นว่ามันเป็นไปได้ที่จะให้ตัวอย่างเช่น ฉันชอบที่จะเห็นกรณีเพิ่มเติมใด ๆ ที่คุณรู้จัก
gung - Reinstate Monica

แค่อยากรู้อยากเห็น - เมื่อคุณพูดว่า "การวิเคราะห์เป็นประจำมีประโยชน์มากกว่า" คุณกำลังพูดถึงซอฟต์แวร์ - เช่นใช้lm ()ใน R ใช้งานง่ายกว่าหรือไม่ หรือมีอย่างอื่นอีกไหม
ความน่าจะเป็นทาง

@proisabilityislogic เป็นหลัก ตัวอย่างของฉันใช้t.test()เมื่อเทียบกับการเขียนโปรแกรม Bayesian t-test ใน WinBUGS ซึ่งต้องการรหัสเพิ่มเติมจำนวนมาก บางทีแทนที่จะเป็น "ปฏิบัติมากขึ้น" ฉันควรจะพูดว่า 'ง่ายขึ้น'
gung - Reinstate Monica

คำตอบ:


26

(1)ในบริบทที่ฟังก์ชันความน่าจะเป็นที่ดื้อดึง (อย่างน้อยตัวเลข) การใช้วิธีการแบบเบย์โดยวิธีการคำนวณแบบเบย์โดยประมาณ (ABC) ได้สร้างความได้เปรียบเหนือคู่แข่งบางรายเช่นคอมโพสิตโอกาส ( 1 , 2 ) หรือโอกาสเชิงประจักษ์เพราะมีแนวโน้มที่จะใช้งานได้ง่ายขึ้น (ไม่จำเป็นต้องแก้ไข) เนื่องจากนี้การใช้งานของเอบีซีได้กลายเป็นที่นิยมในพื้นที่ที่มันเป็นเรื่องธรรมดาที่จะเจอโอกาสเกิดยากเช่นชีววิทยา , พันธุศาสตร์และนิเวศวิทยา ที่นี่เราสามารถพูดถึงมหาสมุทรของตัวอย่าง

ตัวอย่างของโอกาสที่ดื้อดึงคือ

  • กระบวนการที่วางซ้อน คอคส์และสมิ ธ (1954)เสนอแบบจำลองในบริบทของสรีรวิทยาซึ่งประกอบด้วยกระบวนการจุดยอดนิยมยกตัวอย่างเช่นลองพิจารณาช่วงเวลาระหว่างพัลส์ไฟฟ้าที่สังเกตที่สมองบางส่วนที่ถูกปล่อยออกมาจากเซลล์ประสาทหลาย ๆ ตัวในช่วงระยะเวลาหนึ่ง ตัวอย่างนี้มีการสังเกตที่ไม่ใช่ของ iid ซึ่งทำให้ยากต่อการสร้างโอกาสที่สอดคล้องกันทำให้การประมาณค่าพารามิเตอร์ที่เกี่ยวข้องซับซ้อนขึ้น A (บางส่วน) วิธีการแก้ปัญหา frequentist ถูกเสนอเร็ว ๆ นี้ในงานวิจัยนี้ การดำเนินการตามวิธีการที่เอบีซียังได้รับการศึกษาเมื่อเร็ว ๆ นี้และจะสามารถพบได้ที่นี่N

  • พันธุศาสตร์ประชากรเป็นอีกตัวอย่างหนึ่งของแบบจำลองที่นำไปสู่โอกาสที่ดื้อดึง ในกรณีนี้ intractability มีลักษณะที่แตกต่าง: โอกาสจะแสดงในแง่ของหนึ่งหลายมิติ (บางครั้งของมิติ ) ซึ่งจะใช้เวลาไม่กี่ทศวรรษที่ผ่านมาเพียงเพื่อประเมินไว้ที่จุดเดียว พื้นที่นี้อาจเป็นสำนักงานใหญ่ของ ABC1000+


1
พวกนี้ยอดเยี่ยมมาก! คุณสามารถแบ่งพวกเขาออกเป็น 2 คำตอบ (เพื่อที่ฉันจะสามารถโหวตคุณสองครั้งได้ ขอบคุณ
gung - Reinstate Monica

2
@Procrastinator คุณช่วยอธิบายเพิ่มเติมหน่อยได้ไหมว่าทำไมในบริบทบางอย่าง ระบุว่าคุณพูดถึงชีววิทยาพันธุศาสตร์และนิเวศวิทยาฉันคิดว่ามันเชื่อมโยงกับการพึ่งพาที่ซับซ้อนระหว่างพารามิเตอร์ ฉันคิดว่านี่จะเป็นประโยชน์อย่างยิ่งสำหรับผู้ที่ไม่คุ้นเคยกับการวิเคราะห์แบบเบย์ (ซึ่งฉันเป็น) โดยเฉพาะอย่างยิ่งเนื่องจากหน้าวิกิพีเดียใน ABC ที่คุณเชื่อมโยงไปนั้นไม่ได้มีบริบทมากมาย ขอบคุณ
แอนทอน Vernet

15

เมื่อซอฟต์แวร์ Bayesian ดีขึ้นปัญหา "ง่ายต่อการใช้" จึงกลายเป็นข้อสงสัย ซอฟต์แวร์ Bayesian ได้รับการจัดทำในรูปแบบที่ง่ายขึ้น กรณีล่าสุดในจุดที่อยู่ห่างจากบทความเรื่องการประมาณค่าแบบเบย์แทนการทดสอบที เว็บไซต์ต่อไปนี้มีลิงก์ไปยังบทความและซอฟต์แวร์: http://www.indiana.edu/~kruschke/BEST/

ข้อความที่ตัดตอนมาจากการแนะนำบทความ:

... บางคนมีความรู้สึกว่าข้อสรุปจากวิธี NHST และ Bayesian มีแนวโน้มที่จะเห็นด้วยในสถานการณ์ที่เรียบง่ายเช่นการเปรียบเทียบของสองกลุ่ม:“ ดังนั้นหากคำถามหลักที่คุณสนใจสามารถแสดงในรูปแบบที่คล้อยตามการทดสอบพูด ไม่จำเป็นต้องลองใช้เครื่องจักร Bayesian แบบเต็มรูปแบบเพื่อแก้ไขปัญหาให้ง่าย” (Brooks, 2003, p. 2694) บทความนี้แสดงให้เห็นว่าในทางตรงกันข้ามการประมาณค่าพารามิเตอร์แบบเบย์ให้ข้อมูลที่สมบูรณ์กว่าการทดสอบ NHST t และข้อสรุปของมันอาจแตกต่างจากการทดสอบ NHST t การตัดสินใจบนพื้นฐานของการประมาณค่าพารามิเตอร์แบบเบย์นั้นดีกว่าการพิจารณาจาก NHST ไม่ว่าการตัดสินใจที่ได้จากสองวิธีนั้นจะเห็นด้วยหรือไม่ก็ตาม


10
ฉันรวบรวมคำตอบของคุณอย่างใดอย่างหนึ่งเสมอหรือ 'จะเป็นเสมอในไม่ช้า' นี่คือคำตอบของพรรคพวกเบย์
gung - Reinstate Monica

3
และนี่คือการใช้งานจาวาสคริปต์ออนไลน์ของ Kruschke ที่ดีที่สุด การวิเคราะห์แบบเบส์ในเบราว์เซอร์ :) sumsar.net/best_online
Rasmus Bååth

13

(2)โมเดลความแข็งแรงของความเครียด การใช้แบบจำลองความเค้น - ความเครียดเป็นที่นิยมในด้านความน่าเชื่อถือ แนวคิดพื้นฐานประกอบด้วยการประมาณค่าพารามิเตอร์โดยที่และเป็นตัวแปรสุ่ม ที่น่าสนใจคือการคำนวณความน่าจะเป็นของโปรไฟล์นี้ค่อนข้างยาก (โดยทั่วไปคือตัวเลข) ยกเว้นตัวอย่างของเล่นบางอย่างเช่นเลขชี้กำลังหรือกรณีปกติ ด้วยเหตุนี้จึงจำเป็นต้องพิจารณาวิธีแก้ปัญหาแบบเฉพาะกิจเช่นความเป็นไปได้ในเชิงประจักษ์ ( ดูθ=P(X<Y)XY) หรือช่วงความเชื่อมั่นซึ่งการก่อสร้างนั้นยากเช่นกันในกรอบทั่วไป ในทางกลับกันการใช้วิธี Bayesian นั้นง่ายมากหากคุณมีตัวอย่างของการแจกแจงด้านหลังของพารามิเตอร์ของการแจกแจงของและจากนั้นคุณสามารถแปลงให้เป็นตัวอย่างหลังของthetaXYθ

ให้เป็นตัวแปรสุ่มที่มีความหนาแน่นและการจัดจำหน่ายที่ได้รับตามลำดับโดยและxi_1) ในทำนองเดียวกันให้เป็นตัวแปรสุ่มที่มีความหนาแน่นและการจัดจำหน่ายที่ได้รับตามลำดับและxi_2) แล้วก็Xf(x;ξ1)F(x;ξ1)Yg(y;ξ2)G(y;ξ2)

()θ=F(y;ξ1)g(y;ξ2)dy.

โปรดทราบว่าพารามิเตอร์นี้เป็นหน้าที่ของพารามิเตอร์xi_2) ในกรณีเลขยกกำลังและปกตินี้สามารถแสดงในรูปแบบปิด ( ดู ) แต่นี่ไม่ใช่กรณีทั่วไป (ดูบทความนี้สำหรับตัวอย่าง) สิ่งนี้จะทำให้การคำนวณโปรไฟล์มีความเป็นไปได้ที่จะเกิดและทำให้การอนุมานช่วงเวลาแบบคลาสสิกกับพารามิเตอร์นี้ ปัญหาหลักสามารถสรุปได้ดังนี้ "พารามิเตอร์ที่น่าสนใจคือฟังก์ชั่นที่ไม่รู้จัก / ซับซ้อนของโมเดล - พารามิเตอร์ดังนั้นเราจึงไม่สามารถหา reparameterisation ที่เกี่ยวข้องกับพารามิเตอร์ที่น่าสนใจ"θ(ξ1,ξ2)θ

จากมุมมองแบบเบย์สิ่งนี้ไม่ใช่ปัญหาที่ระบุว่าหากเรามีตัวอย่างจากการกระจายหลังของจากนั้นเราก็สามารถใส่ตัวอย่างเหล่านี้ลงในเพื่อรับตัวอย่างหลัง ofและระบุการอนุมานช่วงเวลาสำหรับพารามิเตอร์นี้( ) θ(ξ1,ξ2)()θ


4
+1 ทั้งคำตอบของคุณ - นี่เป็นตัวอย่างที่น่าสนใจ คุณดูเหมือนจะสันนิษฐานว่าวิธีแก้ปัญหาที่พบบ่อยจะต้องเป็นไปตามความน่าจะเป็น แต่ดูเหมือนว่าจะไม่สนใจวิธีการที่ไม่ใช่พารามิเตอร์ ในกรณีพิเศษนี้วิธีการที่ใช้บ่อย ๆ แบบไม่ใช้พารามิเตอร์ของบทที่ 5 ในหนังสือที่คุณเชื่อมโยงกับฉันอย่างน้อยก็ใช้งานง่ายเหมือนวิธีเบย์
MånsT

@ MånsTจุดที่ดี แท้จริงแล้วคำตอบนี้มุ่งเน้นไปที่การอนุมานแบบเบย์กับความน่าจะเป็น ฉันเขียนคำตอบเมื่อไม่นานมานี้เกี่ยวกับวิธีแก้ปัญหาแบบไม่พารามิเตอร์ของปัญหาซึ่งตามที่คุณชี้ให้เห็นนั้นเป็นเรื่องง่ายเหมือนวิธีการแบบเบย์

@ MånsT & Procrastinator ฉันก็โหวตขึ้นมาแล้ว ไม่ชัดเจนสำหรับฉันว่า "ง่ายที่สุด" ควรหมายถึงอะไรในบริบทของคำถามนี้ / ความคิดเห็นที่เกิดขึ้นกับฉันตลอดหลายปีที่ผ่านมา ส่วนใหญ่ฉันต้องการยกเว้นคำตอบที่นักวิเคราะห์มีตำแหน่งทางทฤษฎีว่าดีกว่าเสมอสำหรับเหตุผลที่ไม่เกี่ยวข้องกับสถานการณ์ แน่นอนว่าตำแหน่งนี้สามารถป้องกันได้และมีหลายสถานที่ในอินเทอร์เน็ตเพื่อดูข้อโต้แย้งดังกล่าว (รวมถึงบางส่วนใน CV) แต่ b / c ของที่ฉันคิดว่ามันน่าสนใจที่จะมีสถานที่ที่คนแสดงรายการกรณีที่พวกเขา จะใช้อีก & ทำไม
gung - Reinstate Monica

13

ฉันได้รับการฝึกฝนในสถิติบ่อยครั้ง (จริง ๆ แล้วด้านเศรษฐศาสตร์) แต่ฉันไม่เคยมีท่าทีต่อการเผชิญหน้าแบบเบย์เนื่องจากมุมมองของฉันคือแหล่งที่มาทางปรัชญาของการต่อสู้ "มหากาพย์" นี้ถูกเข้าใจผิดตั้งแต่แรก (ฉันได้ออกอากาศ) มุมมองของฉันที่นี่ ) ในความเป็นจริงฉันวางแผนที่จะฝึกตัวเองในแนวทางเบย์ในอนาคตอันใกล้

ทำไม? เพราะหนึ่งในแง่มุมของสถิติบ่อยครั้งที่ทำให้ฉันหลงใหลในความพยายามทางคณิตศาสตร์และแนวคิดในขณะเดียวกันก็สร้างปัญหาให้ฉันได้มากที่สุดนั่นคือ asymptotics ขนาดตัวอย่าง อย่างน้อยในสาขาเศรษฐศาสตร์แทบจะไม่มีบทความที่จริงจังในวันนี้อ้างว่าตัวประมาณแบบต่าง ๆ มักใช้ในเศรษฐมิติบ่อย ๆ มีคุณสมบัติ "ตัวอย่างเล็ก ๆ " ที่เป็นที่ต้องการที่เราต้องการจากตัวประมาณ พวกเขาทั้งหมดพึ่งพาคุณสมบัติแบบอะซิโทติกเพื่อปรับการใช้งาน การทดสอบส่วนใหญ่ที่ใช้มีคุณสมบัติที่ต้องการเพียง asymptotically ... แต่เราไม่ได้อยู่ใน "z-land / t-land" อีกต่อไป: เครื่องมือที่ซับซ้อน (และน่ากลัว) ทั้งหมดของการประมาณและการอนุมานที่ทันสมัย บางครั้งจำเป็นต้องมีตัวอย่าง laaaaaaaaa ... ตัวอย่าง aaaarge เพื่อให้คุณสมบัติเชิงซีโมติกที่มีค่าเหล่านี้เกิดขึ้นและมีผลต่อการประมาณการที่ได้มาจากตัวประมาณดังที่ได้รับการพิสูจน์จากการจำลองต่างๆ ความหมายของการสังเกตนับหมื่น - แม้ว่าพวกเขาจะเริ่มใช้งานได้ในบางสาขาของกิจกรรมทางเศรษฐกิจ (เช่นตลาดแรงงานหรือตลาดการเงิน) มีคนอื่น ๆ (เช่นเศรษฐกิจมหภาค) ที่พวกเขาจะไม่ทำ (อย่างน้อยในช่วงชีวิตของฉัน) และฉันก็ค่อนข้างจะใส่ใจเพราะมันทำให้ผลลัพธ์ที่ได้มาอย่างแท้จริงไม่แน่นอน (ไม่ใช่แค่สุ่ม)

เศรษฐมิติแบบเบย์สำหรับกลุ่มตัวอย่างขนาดเล็กไม่ได้ขึ้นอยู่กับผลเชิงซีมโทติค "แต่พวกเขาต้องใช้ความคิดส่วนตัวมาก่อน !" คือการตอบสนองตามปกติ ... ที่เรียบง่ายในทางปฏิบัติคำตอบของฉันคือต่อไปนี้:. "ถ้าปรากฏการณ์อายุและการศึกษามาก่อนก่อนที่จะถูกประเมินจากข้อมูลที่ผ่านมาหากเป็นปรากฏการณ์ใหม่โดยสิ่งอื่นหากไม่ได้ โดยข้อโต้แย้งอัตนัยเราสามารถเริ่มต้นการสนทนาเกี่ยวกับเรื่องนี้ ?


5
นี่เป็นมุมมองที่คุ้มค่า แต่โปรดทราบว่ามีวิธีการที่ใช้บ่อยซึ่งไม่ต้องพึ่งพา asymptotics มากนักเช่นการจำลองของ Monte Carlo การทดสอบการบูตและการทดสอบการเปลี่ยนแปลง
gung - Reinstate Monica

1
และถ้าใครพยายามที่จะได้รับสิ่งที่ดีที่สุดจากทั้งสองโลก? ความพยายาม: Bartels, Christian (2017): การใช้ความรู้เดิมในการทดสอบบ่อยครั้ง figshare doi.org/10.6084/m9.figshare.4819597.v3สืบค้นแล้ว: 17 18, 10 พฤษภาคม 2017 (GMT)
36160

13

นี่คือการตอบกลับล่าช้า แต่ฉันหวังว่ามันจะเพิ่มอะไรบางอย่าง ฉันได้รับการฝึกอบรมด้านการสื่อสารโทรคมนาคมซึ่งส่วนใหญ่เราใช้วิธีการแบบเบย์

นี่เป็นตัวอย่างง่ายๆ: สมมติว่าคุณสามารถส่งสัญญาณที่เป็นไปได้สี่สัญญาณคือ +5, +2.5, -2.5 และ -5 โวลต์ สัญญาณหนึ่งจากชุดนี้ถูกส่ง แต่สัญญาณเสียหายโดยสัญญาณรบกวนแบบเกาส์เมื่อถึงเวลาสิ้นสุดการรับ ในทางปฏิบัติสัญญาณจะถูกลดทอนเช่นกัน แต่เราจะวางปัญหานี้เพื่อความเรียบง่าย คำถามคือ: หากคุณอยู่ที่จุดสิ้นสุดการรับคุณจะออกแบบเครื่องตรวจจับที่บอกคุณว่าสัญญาณใดสัญญาณหนึ่งในขั้นต้นได้อย่างไร

ปัญหานี้ชัดเจนอยู่ในโดเมนของการทดสอบสมมติฐาน อย่างไรก็ตามคุณไม่สามารถใช้ค่า p เนื่องจากการทดสอบที่สำคัญสามารถปฏิเสธสมมติฐานที่เป็นไปได้ทั้งสี่และคุณรู้ว่าสัญญาณเหล่านี้อย่างใดอย่างหนึ่งถูกส่งจริง เราสามารถใช้วิธี Neyman-Pearson ในการออกแบบตัวตรวจจับตามหลักการ แต่วิธีนี้ใช้ได้ผลดีที่สุดสำหรับสมมุติฐานแบบไบนารี สำหรับสมมติฐานหลายรายการมันจะเงอะงะเกินไปเมื่อคุณจำเป็นต้องจัดการกับข้อ จำกัด จำนวนสำหรับความน่าจะเป็นสัญญาณเตือนที่ผิดพลาด ทางเลือกง่าย ๆ คือการทดสอบสมมติฐานเบย์ สัญญาณใด ๆ เหล่านี้อาจถูกเลือกให้ส่งได้ดังนั้นสัญญาณก่อนหน้านี้จึงเป็นสิ่งที่สวมใส่ได้ ในกรณีที่สวมใส่ได้วิธีดังกล่าวจะลดลงเพื่อเลือกสัญญาณที่มีความเป็นไปได้สูงสุด วิธีนี้สามารถให้การตีความทางเรขาคณิตที่ดี: เลือกสัญญาณที่ใกล้เคียงกับสัญญาณที่ได้รับมากที่สุด สิ่งนี้นำไปสู่การแบ่งพื้นที่การตัดสินใจลงในขอบเขตการตัดสินใจจำนวนหนึ่งเช่นถ้าสัญญาณที่ได้รับนั้นตกอยู่ในภูมิภาคใดภูมิภาคหนึ่งจากนั้นจะมีการตัดสินใจว่าสมมติฐานที่เกี่ยวข้องกับภูมิภาคการตัดสินใจนั้นเป็นจริง ดังนั้นการออกแบบเครื่องตรวจจับจึงเป็นเรื่องง่าย


4
ขอบคุณที่แบ่งปันประสบการณ์กับเรา ยินดีต้อนรับสู่เว็บไซต์ของเรา!
whuber

4

ดังนั้นการทดสอบทางสถิติที่เรียกว่า 'Frequentist' มักจะเทียบเท่ากับหลักการแบบเบย์ที่ซับซ้อนกว่าภายใต้สมมติฐานบางประการ เมื่อสมมติฐานเหล่านี้มีผลบังคับใช้ทั้งสองวิธีจะให้ผลเหมือนกันดังนั้นจึงปลอดภัยที่จะใช้ง่ายขึ้นในการใช้การทดสอบเป็นประจำ วิธีการแบบเบย์นั้นปลอดภัยกว่าโดยทั่วไปเนื่องจากมีการตั้งสมมติฐานอย่างชัดเจน แต่ถ้าคุณรู้ว่าสิ่งที่คุณทำแบบทดสอบบ่อยครั้งนั้นดีพอ ๆ กับวิธีแบบเบย์


1
ขอบคุณ คุณทราบว่าการทดสอบเป็นประจำคือ "โดยทั่วไปจะใช้ง่ายกว่า" คุณรู้สถานการณ์ที่เฉพาะเจาะจงเมื่อไม่ได้เป็นกรณี (ถ้า F เป็นเพียง "โดยทั่วไป" ง่ายขึ้นจะต้องมีบางกรณีดังกล่าว) สำหรับปัจจุบันเราสามารถตั้งสำรองปัญหาซึ่งวิธีการจะเป็น "ความปลอดภัยมากขึ้น" และเพียงแค่มีสมาธิในเรื่องง่ายที่จะนำไปใช้เป็นส่วนหนึ่ง
gung - Reinstate Monica

4

(ฉันจะลองสิ่งที่ฉันคิดว่าจะเป็นคำตอบที่ธรรมดาที่สุด)

สมมติว่าคุณมีสถานการณ์ที่มีตัวแปรหลายตัวและคำตอบเดียวและคุณรู้ดีว่าตัวแปรตัวใดตัวหนึ่งควรเกี่ยวข้องกับการตอบสนอง แต่ไม่มากเกี่ยวกับตัวอื่น ๆ

ในสถานการณ์เช่นนี้หากคุณต้องทำการวิเคราะห์การถดถอยแบบหลายมาตรฐานความรู้ก่อนหน้านี้จะไม่ถูกนำมาพิจารณา เมตาดาต้า - วิเคราะห์อาจจะดำเนินการในภายหลังซึ่งอาจน่าสนใจในการส่องแสงว่าผลลัพธ์ในปัจจุบันสอดคล้องกับผลการวิจัยอื่น ๆ และอาจช่วยให้การประเมินแม่นยำยิ่งขึ้นเล็กน้อย (โดยรวมถึงความรู้เดิม ณ จุดนั้น) แต่วิธีการดังกล่าวไม่อนุญาตให้สิ่งที่ทราบเกี่ยวกับตัวแปรนั้นมีอิทธิพลต่อการประมาณการของตัวแปรอื่น ๆ

อีกทางเลือกหนึ่งคือมันเป็นไปได้ที่จะเขียนโค้ดและปรับให้เหมาะสมฟังก์ชั่นของคุณเองที่จะแก้ไขความสัมพันธ์กับตัวแปรที่เป็นปัญหาและค้นหาค่าพารามิเตอร์สำหรับตัวแปรอื่น ๆ ที่เพิ่มความน่าจะเป็นของข้อมูลที่ได้รับการ จำกัด ปัญหาคือที่นี่ในขณะที่ตัวเลือกแรกไม่ได้ จำกัด การประมาณการเบต้าอย่างเพียงพอ แต่วิธีการนี้จะ จำกัด มากกว่า

อาจเป็นไปได้ที่คณะลูกขุนจะใช้อัลกอริธึมบางอย่างที่จะจัดการกับสถานการณ์ให้เหมาะสมยิ่งขึ้นสถานการณ์เช่นนี้ดูเหมือนจะเป็นตัวเลือกที่เหมาะสมที่สุดสำหรับการวิเคราะห์แบบเบย์ ทุกคนที่ไม่ได้ต่อต้านแนวคิดแบบเบย์อย่างดื้อรั้นควรเต็มใจลองในกรณีเช่นนี้


2

พื้นที่ของการวิจัยในซึ่งวิธีการแบบเบย์ตรงไปตรงมามากและวิธีการ frequentist จะยากมากที่จะปฏิบัติตามคือการที่ดีที่สุดการออกแบบ

x(1)βx(2)β

βx(i)β^ββ^x(i)β

ββxx

จากมุมมองของเบย์ปัญหานี้ง่ายมาก

  1. β
  2. x
  3. x
  4. ทำซ้ำขั้นตอนที่ 2 และ 3 จนกระทั่งได้ความแม่นยำที่ต้องการ

x


2

บางทีหนึ่งในกรณีที่ตรงไปตรงมาและเป็นเรื่องธรรมดาที่สุดที่วิธีการแบบเบย์นั้นง่ายกว่าคือการหาปริมาณความไม่แน่นอนของพารามิเตอร์

ในคำตอบนี้ฉันไม่ได้หมายถึงการตีความช่วงความเชื่อมั่นกับช่วงเวลาที่น่าเชื่อถือ ในขณะนี้สมมติว่าผู้ใช้ได้ดีโดยใช้วิธีใดวิธีหนึ่ง

ด้วยที่กล่าวไว้ในกรอบ Bayesian มันตรงไปข้างหน้า; มันคือความแปรปรวนเล็กน้อยของคนหลังสำหรับพารามิเตอร์แต่ละตัวที่น่าสนใจ สมมติว่าคุณสามารถสุ่มตัวอย่างจากผู้โพสต์ด้านหลังจากนั้นนำตัวอย่างของคุณมาคำนวณความแปรปรวนของคุณ ทำ!

ในกรณีผู้ใช้บ่อยนี้มักจะตรงไปตรงมาในบางกรณีและมันเป็นความเจ็บปวดที่แท้จริงเมื่อมันไม่ ถ้าเรามีตัวอย่างจำนวนมากเทียบกับพารามิเตอร์จำนวนน้อย (และใครจะรู้ว่าใหญ่แค่ไหนก็ใหญ่พอ) เราสามารถใช้ทฤษฎี MLE เพื่อให้ได้ CI อย่างไรก็ตามเกณฑ์เหล่านั้นไม่ได้ถืออยู่เสมอโดยเฉพาะอย่างยิ่งสำหรับกรณีที่น่าสนใจ (เช่นแบบจำลองเอฟเฟกต์ผสม) บางครั้งเราสามารถใช้ bootstrapping แต่บางครั้งเราทำไม่ได้! ในกรณีที่เราทำไม่ได้อาจเป็นเรื่องยากที่จะได้รับการประเมินข้อผิดพลาดและมักต้องใช้ความฉลาดเล็กน้อย (เช่นสูตรของกรีนวูดสำหรับการหาค่า SE สำหรับเส้นโค้ง Kaplan Meier) "การใช้ความฉลาด" ไม่ได้เป็นสูตรที่เชื่อถือได้เสมอไป!

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.