เหตุผลของ Bayesian สำหรับการวิเคราะห์สิทธิพิเศษดำเนินการเร็วกว่าการวิเคราะห์อื่น ๆ


26

พื้นหลังและตัวอย่างเชิงประจักษ์

ฉันมีสองการศึกษา ฉันทำการทดลอง (การศึกษา 1) แล้วทำซ้ำ (การศึกษา 2) ในการศึกษา 1 ฉันพบปฏิสัมพันธ์ระหว่างสองตัวแปร ในการศึกษา 2 ปฏิสัมพันธ์นี้เป็นไปในทิศทางเดียวกัน แต่ไม่มีนัยสำคัญ นี่คือบทสรุปสำหรับโมเดลของ Study 1:

Coefficients:
                        Estimate Std. Error t value Pr(>|t|)    
(Intercept)              5.75882    0.26368  21.840  < 2e-16 ***
condSuppression         -1.69598    0.34549  -4.909 1.94e-06 ***
prej                    -0.01981    0.08474  -0.234  0.81542    
condSuppression:prej     0.36342    0.11513   3.157  0.00185 ** 

และรูปแบบการศึกษา 2:

Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
(Intercept)           5.24493    0.24459  21.444   <2e-16 ***
prej                  0.13817    0.07984   1.731   0.0851 .  
condSuppression      -0.59510    0.34168  -1.742   0.0831 .  
prej:condSuppression  0.13588    0.11889   1.143   0.2545  

แทนที่จะพูดว่า "ฉันเดาว่าฉันไม่มีอะไรเลยเพราะฉันไม่สามารถทำซ้ำได้" "สิ่งที่ฉันทำคือรวมชุดข้อมูลทั้งสองแล้วสร้างตัวแปรจำลองสำหรับการศึกษาข้อมูลที่มาจากนั้นจึงเรียกใช้การโต้ตอบ อีกครั้งหลังจากควบคุมการศึกษาตัวแปรจำลอง การโต้ตอบนี้มีความสำคัญแม้หลังจากควบคุมแล้วและฉันพบว่าการโต้ตอบแบบสองทางนี้ระหว่างเงื่อนไขและไม่ชอบ / prej ไม่ผ่านการรับรองโดยการโต้ตอบสามทางกับตัวแปรจำลองการศึกษา

แนะนำการวิเคราะห์แบบเบย์

ฉันมีคนแนะนำว่านี่เป็นโอกาสที่ดีในการใช้การวิเคราะห์แบบเบย์: ในการศึกษา 2 ฉันมีข้อมูลจากการศึกษา 1 ที่ฉันสามารถใช้เป็นข้อมูลก่อนหน้าได้! ด้วยวิธีนี้การศึกษา 2 ได้ทำการปรับปรุงแบบเบย์จากผลการเรียนสแควร์สแควร์ธรรมดาในผลการศึกษา 1 ดังนั้นฉันกลับไปวิเคราะห์รูปแบบการเรียน 2 อีกครั้งโดยใช้ข้อมูลที่มีค่าสัมประสิทธิ์: สัมประสิทธิ์ทั้งหมดมี ปกติก่อนที่ค่าเฉลี่ยคือค่าประมาณในการศึกษา 1 และค่าเบี่ยงเบนมาตรฐานเป็นข้อผิดพลาดมาตรฐานในการศึกษา 1

นี่คือบทสรุปของผลลัพธ์:

Estimates:
                       mean    sd      2.5%    25%     50%     75%     97.5%
(Intercept)             5.63    0.17    5.30    5.52    5.63    5.74    5.96
condSuppression        -1.20    0.20   -1.60   -1.34   -1.21   -1.07   -0.80
prej                    0.02    0.05   -0.08   -0.01    0.02    0.05    0.11
condSuppression:prej    0.34    0.06    0.21    0.30    0.34    0.38    0.46
sigma                   1.14    0.06    1.03    1.10    1.13    1.17    1.26
mean_PPD                5.49    0.11    5.27    5.41    5.49    5.56    5.72
log-posterior        -316.40    1.63 -320.25 -317.25 -316.03 -315.23 -314.29

ดูเหมือนว่าตอนนี้เรามีหลักฐานที่ชัดเจนสำหรับการโต้ตอบจากการวิเคราะห์การศึกษา 2 สิ่งนี้เห็นด้วยกับสิ่งที่ฉันทำเมื่อฉันเพียงแค่วางข้อมูลทับซ้อนกันและวิ่งแบบจำลองที่มีหมายเลขการศึกษาเป็นตัวแปรจำลอง

Counterfactual: เกิดอะไรขึ้นถ้าฉันวิ่งไปเรียน 2 ก่อน?

นั่นทำให้ฉันคิดว่าจะเกิดอะไรขึ้นถ้าฉันเรียกใช้การศึกษา 2 ก่อนแล้วจึงใช้ข้อมูลจากการศึกษา 1 เพื่อปรับปรุงความเชื่อของฉันในการศึกษา 2 ฉันทำสิ่งเดียวกันข้างต้น แต่ในทางกลับกัน: ฉันวิเคราะห์ข้อมูลการศึกษา 1 อีกครั้งโดยใช้การประมาณค่าสัมประสิทธิ์กำลังสองน้อยที่สุดสามัญและส่วนเบี่ยงเบนมาตรฐานจากการศึกษา 2 เป็นวิธีการก่อนหน้าและค่าเบี่ยงเบนมาตรฐานสำหรับการวิเคราะห์ข้อมูลการศึกษา 1 ผลสรุปคือ:

Estimates:
                          mean    sd      2.5%    25%     50%     75%     97.5%
(Intercept)                5.35    0.17    5.01    5.23    5.35    5.46    5.69
condSuppression           -1.09    0.20   -1.47   -1.22   -1.09   -0.96   -0.69
prej                       0.11    0.05    0.01    0.08    0.11    0.14    0.21
condSuppression:prej       0.17    0.06    0.05    0.13    0.17    0.21    0.28
sigma                      1.10    0.06    0.99    1.06    1.09    1.13    1.21
mean_PPD                   5.33    0.11    5.11    5.25    5.33    5.40    5.54
log-posterior           -303.89    1.61 -307.96 -304.67 -303.53 -302.74 -301.83

อีกครั้งเราเห็นหลักฐานของการมีปฏิสัมพันธ์อย่างไรก็ตามสิ่งนี้อาจไม่จำเป็น โปรดทราบว่าการประเมินจุดสำหรับการวิเคราะห์แบบเบย์ทั้งคู่ไม่ได้อยู่ในช่วงเวลาที่น่าเชื่อถือ 95% สำหรับอีกฝ่ายหนึ่ง สองช่วงเวลาที่น่าเชื่อถือจากการวิเคราะห์แบบเบย์มีการทับซ้อนกันมากกว่าการซ้อนทับ

อะไรคือการให้เหตุผลแบบเบย์สำหรับความสำคัญของเวลา?

คำถามของฉันคืออะไร: อะไรคือเหตุผลที่ Bayesians มีเพื่อเคารพลำดับเหตุการณ์ของวิธีการรวบรวมและวิเคราะห์ข้อมูล? ฉันได้รับผลลัพธ์จากการศึกษา 1 และใช้พวกเขาเป็นนักบวชที่ให้ข้อมูลในการศึกษา 2 เพื่อให้ฉันใช้การศึกษา 2 เพื่อ "ปรับปรุง" ความเชื่อของฉัน แต่ถ้าเราสมมติว่าผลลัพธ์ที่ฉันได้รับมาจากการแจกแจงแบบสุ่มที่มีเอฟเฟกต์ประชากรจริงแล้วทำไมฉันถึงได้รับสิทธิพิเศษผลลัพธ์จากการศึกษา 1 อะไรคือเหตุผลสำหรับการใช้ผลการศึกษา 1 ในฐานะนักการศึกษา 2 แทนการใช้ผลการศึกษา 2 ในฐานะนักการศึกษา 1? ลำดับที่ฉันรวบรวมและคำนวณการวิเคราะห์นั้นสำคัญหรือไม่ ดูเหมือนจะไม่เหมาะกับฉัน - อะไรคือเหตุผลของ Bayesian สำหรับเรื่องนี้? ทำไมฉันจึงควรเชื่อว่าการประเมินจุดนั้นใกล้เคียงกับ. 34 มากกว่าที่จะเป็น. 17 เพียงเพราะฉันวิ่งการศึกษา 1 ก่อน?


ตอบสนองต่อคำตอบของนักวิทยาศาสตร์

Kodiologist ตั้งข้อสังเกต:

จุดที่สองของคะแนนเหล่านี้ไปสู่การออกเดินทางครั้งสำคัญที่คุณทำจากการประชุมแบบเบย์ คุณไม่ได้ตั้งค่าก่อนหน้าแล้วจึงปรับให้เหมาะกับทั้งสองแบบในแบบเบย์ คุณพอดีกับนางแบบหนึ่งคนในแบบที่ไม่ใช่แบบเบย์แล้วใช้มันเพื่อเป็นเกียรติแก่รุ่นอื่น หากคุณใช้วิธีการทั่วไปคุณจะไม่เห็นการพึ่งพาตามลำดับที่คุณเห็นที่นี่

จะอยู่ที่นี่ผมพอดีกับรูปแบบการศึกษาที่ 1 และ 2 การศึกษาที่ทุกค่าสัมประสิทธิ์การถดถอยมีก่อน5) ตัวแปรเป็นตัวแปรหุ่นสภาพทดลองรหัส 0 หรือ 1; ตัวแปรเช่นเดียวกับผลที่ทั้งสองวัดบนตาชั่ง 7 จุดตั้งแต่ 1 ถึง 7 ดังนั้นฉันคิดว่ามันเป็นทางเลือกที่ยุติธรรมของก่อน โดยการปรับขนาดข้อมูลมันจะหายากมากที่จะเห็นค่าสัมประสิทธิ์ที่ใหญ่กว่าสิ่งที่แนะนำก่อนหน้านี้N(0,5)condprej

การประมาณค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานของการประมาณการเหล่านั้นใกล้เคียงกับในการถดถอยแบบ OLS ศึกษา 1:

Estimates:
                       mean     sd       2.5%     25%      50%      75%      97.5% 
(Intercept)             5.756    0.270    5.236    5.573    5.751    5.940    6.289
condSuppression        -1.694    0.357   -2.403   -1.925   -1.688   -1.452   -0.986
prej                   -0.019    0.087   -0.191   -0.079   -0.017    0.040    0.150
condSuppression:prej    0.363    0.119    0.132    0.282    0.360    0.442    0.601
sigma                   1.091    0.057    0.987    1.054    1.088    1.126    1.213
mean_PPD                5.332    0.108    5.121    5.259    5.332    5.406    5.542
log-posterior        -304.764    1.589 -308.532 -305.551 -304.463 -303.595 -302.625

และการศึกษา 2:

Estimates:
                       mean     sd       2.5%     25%      50%      75%      97.5% 
(Intercept)             5.249    0.243    4.783    5.082    5.246    5.417    5.715
condSuppression        -0.599    0.342   -1.272   -0.823   -0.599   -0.374    0.098
prej                    0.137    0.079   -0.021    0.084    0.138    0.192    0.287
condSuppression:prej    0.135    0.120   -0.099    0.055    0.136    0.214    0.366
sigma                   1.132    0.056    1.034    1.092    1.128    1.169    1.253
mean_PPD                5.470    0.114    5.248    5.392    5.471    5.548    5.687
log-posterior        -316.699    1.583 -320.626 -317.454 -316.342 -315.561 -314.651

เนื่องจากค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานเหล่านี้มีค่ามากกว่าหรือน้อยกว่าประมาณการ OLS ผลของคำสั่งซื้อดังกล่าวยังคงเกิดขึ้น ถ้าฉันปลั๊กอินสถิติสรุปหลังจากการศึกษา 1 ลงในนักวิเคราะห์เมื่อศึกษา 2 ฉันสังเกตหลังสุดท้ายที่แตกต่างกว่าเมื่อวิเคราะห์การศึกษา 2 ก่อนแล้วใช้สถิติสรุปหลังเหล่านั้นเป็นนักวิเคราะห์การศึกษา 1

แม้ว่าฉันจะใช้วิธีการแบบเบย์และส่วนเบี่ยงเบนมาตรฐานสำหรับสัมประสิทธิ์การถดถอยเป็นนักบวชแทนที่จะเป็นค่าประมาณที่ใช้บ่อยฉันก็ยังคงสังเกตเห็นผลการเรียงลำดับเดียวกัน ดังนั้นคำถามยังคงอยู่: อะไรคือเหตุผลของ Bayesian สำหรับการศึกษาที่ได้รับสิทธิพิเศษก่อน


2
"ฉันจะยังคงอยู่ในสถานการณ์เดียวกันดังนั้นคำถามยังคงอยู่: อะไรคือเหตุผลของ Bayesian สำหรับการศึกษาที่ได้รับสิทธิพิเศษก่อน" - หือ? คุณรู้สึกยังไงกับการเรียนที่ 1 คุณสามารถใส่สองโมเดลตามที่คุณอธิบายไว้ที่นี่หรือในลำดับตรงกันข้ามและการประเมินขั้นสุดท้ายของคุณเช่นสัมประสิทธิ์ประชากรจริงสำหรับprejควรเป็นแบบเดียวกันทั้งสองเว้นแต่ว่าฉันเข้าใจผิดเกี่ยวกับกระบวนการของคุณ
ประสาทวิทยา

@ Kodiologist ฉันแก้ไขเพื่อความชัดเจนรวมถึงเพิ่มเติมเกี่ยวกับขั้นตอน
ทำเครื่องหมายสีขาว

1
แล้วเมทริกซ์ความแปรปรวนร่วมและข้อผิดพลาดล่ะ? คุณจะต้องใช้หลังทั้งหมดร่วมกันเป็นใหม่ของคุณก่อน
Scortchi - Reinstate Monica

@ Scortchi bingo— นั่นคือคำตอบที่ถูกต้องฉันคิดว่าและนั่นคือสิ่งที่คำตอบของ unutbu ทำให้ฉันเชื่อ สิ่งที่ฉันทำคือการอัปเดตเวอร์ชันหยาบจริง ๆ : ฉันบันทึกสถิติสรุปไม่ใช่คนหลังร่วมทั้งหมด นั่นหมายถึงคำถาม: มีวิธีที่จะรวมหลังร่วมกันทั้งหมดเป็นก่อนในrstanarmหรือสแตน? ดูเหมือนว่ามีการถามคำถามนี้ที่นี่มาก่อน: stats.stackexchange.com/questions/241690/…
ทำเครื่องหมายสีขาว

1
หากคุณเริ่มต้นด้วย Gaussian priors (& เอกราช?) สำหรับค่าสัมประสิทธิ์และค่า inverse-gamma สำหรับความแปรปรวนคุณก็จะมีค่า inverse-gamma ปกติมาก่อน ค้นหาสมการการอัพเดท
Scortchi - Reinstate Monica

คำตอบ:


22

ทฤษฎีบทของเบย์กล่าวว่าposteriorค่าเท่ากับprior * likelihoodหลังจากการลดขนาด (ความน่าจะเป็นเท่ากับ1) การสังเกตแต่ละครั้งมีสิ่งlikelihoodที่สามารถใช้เพื่ออัปเดตpriorและสร้างใหม่posterior:

posterior_1 = prior * likelihood_1
posterior_2 = posterior_1 * likelihood_2
...
posterior_n = posterior_{n-1} * likelihood_n

ดังนั้น

posterior_n = prior * likelihood_1 * ... * likelihood_n

commutativity ของการคูณหมายถึงการปรับปรุงสามารถทำได้ในลำดับใด ดังนั้นถ้าคุณเริ่มต้นด้วยก่อนที่เดียวที่คุณสามารถผสมสังเกตจากการศึกษาที่ 1 และ 2 การศึกษาในการสั่งซื้อใด ๆ posteriorที่ใช้สูตรของเบย์และมาถึงที่สุดท้ายเหมือนกัน


1
ทำให้รู้สึกที่สมบูรณ์แบบ ดังนั้นสิ่งนี้ชี้ให้เห็นถึงเหตุผลที่เป็นไปได้สำหรับความคลาดเคลื่อนที่เป็นอยู่: วิธีที่ฉันวิเคราะห์ของฉัน (เสียบหลังสรุปสถิติลงในข้อโต้แย้งก่อนหน้าสำหรับการศึกษาครั้งต่อไป) ไม่ใช่วิธีการอัพเดต นั่นคือ: ฉันจำเป็นต้องพิจารณาทั้งหมดของหลังไม่เพียง แต่เสียบสถิติสรุปจากมันเข้ากับนักวิเคราะห์ที่ตามมา แก้ไข?
ทำเครื่องหมายสีขาว

4
@ MarkWhite ถูกต้อง การกระจายหลังจากการวิเคราะห์ครั้งแรกของคุณควรเป็นนักบวชของคุณในครั้งที่สอง
Kodiologist

4
@ กุมารแพทย์และสถิติสรุปเกี่ยวกับด้านหลัง! = ผู้ด้านหลัง
มาร์คไวท์

@ MarkWhite ถูกต้อง
ประสาทวิทยา

22

ก่อนอื่นฉันควรชี้ให้เห็นว่า:

  1. p
  2. คุณใส่ความเชื่อมั่นอย่างมากในผลลัพธ์ของการศึกษา 1 โดยการแปลสิ่งที่คุณค้นพบจากตัวอย่างนั้นไปยังนักบวชโดยตรง โปรดจำไว้ว่าสิ่งที่ไม่ควรทำก่อนหน้านี้เป็นเพียงภาพสะท้อนของสิ่งที่ค้นพบ มันจำเป็นต้องเข้ารหัสความเชื่อที่มีมาก่อนทั้งหมดของคุณรวมถึงความเชื่อของคุณก่อนการค้นพบก่อนหน้านี้ หากคุณยอมรับว่าการศึกษา 1 เกี่ยวข้องกับข้อผิดพลาดในการสุ่มตัวอย่างรวมถึงความไม่แน่นอนที่เข้าใจง่ายอื่น ๆ เช่นความไม่แน่นอนของแบบจำลองคุณควรใช้แบบอนุรักษ์นิยมมากกว่านี้มาก่อน

จุดที่สองของคะแนนเหล่านี้ไปสู่การออกเดินทางครั้งสำคัญที่คุณทำจากการประชุมแบบเบย์ คุณไม่ได้ตั้งค่าก่อนหน้าแล้วจึงปรับให้เหมาะกับทั้งสองแบบในแบบเบย์ คุณพอดีกับนางแบบหนึ่งคนในแบบที่ไม่ใช่แบบเบย์แล้วใช้มันเพื่อเป็นเกียรติแก่รุ่นอื่น หากคุณใช้วิธีการทั่วไปคุณจะไม่เห็นการพึ่งพาตามลำดับที่คุณเห็นที่นี่


1. ฉันจะติดตามผลลัพธ์เชิงลบด้วยแบบจำลองอื่นได้อย่างไร คุณหมายถึงอะไรโดย "ผลลัพธ์เชิงลบ" เท่าที่อัตราความผิดพลาด Type-wide การศึกษาเหล่านี้เป็นงานวิจัยสองงานที่แยกกันดำเนินการหลายสัปดาห์นอกเหนือจากกัน ฉันเชื่อว่าในการทำการวิเคราะห์ข้อมูลเชิงสำรวจดังนั้นฉันไม่เคยคิดว่าค่า p ในทางปฏิบัตินั้น "ถูกต้อง" หรือว่าเราควรคาดหวังว่าพวกเขาจะ "ถูกต้องทั้งหมด" หากผู้คนทำการทดสอบที่พวกเขาคิดล่วงหน้าเราจะพลาดการค้นพบครั้งยิ่งใหญ่ที่เกิดขึ้นโดยบังเอิญ - และเราจะต้องสูญเสียข้อมูลเป็นจำนวนมาก
Mark White

2
p

1
2. ใช่ แต่คุณจะจบลงด้วยนักบวชที่แตกต่างกันสำหรับการศึกษา 2 ซึ่งไม่ได้จบลงด้วยการให้ความเชื่อมั่นในความคิดที่ว่าการศึกษาที่ 1 นั้นถูกต้อง
Kodiologist

1
1. ปัญหาไม่ใช่ว่าคุณรวบรวมข้อมูลเพิ่มเติมและวิเคราะห์ แต่คุณวิเคราะห์ข้อมูลใหม่จากการศึกษาทั้งสอง (ด้วยแบบจำลองรวมกับตัวทำนายใหม่) เนื่องจากคุณได้รับผลลัพธ์เชิงลบในครั้งแรกที่คุณวิเคราะห์ชุดข้อมูลที่สอง ฉันไม่เคยเห็นเหตุผลที่จะเชื่อว่าการทดสอบความสำคัญมีประโยชน์จริง ๆ แต่ส่วนใหญ่ของคนที่เชื่อว่ามันดูเหมือนจะคิดว่าทฤษฎีบททั้งหมดเกี่ยวกับการทดสอบความสำคัญคือสิ่งที่สนับสนุนประโยชน์ของมันและทฤษฎีบทเช่นทฤษฎีบททั้งหมดต้องการ สถานที่บางแห่งเพื่อให้ได้ข้อสรุป
Kodiologist

1
@Kodiologist - หากคุณไม่คิดว่าการทดสอบความสำคัญนั้นมีประโยชน์มากนักคุณจะสงสัยว่า (เช่น) นักวิจัยที่สรุปว่าคนส่วนใหญ่มีดวงตาสีฟ้าเพราะทุกคนในกลุ่มตัวอย่างที่สองทำเช่นนั้น?
Obie 2.0

4

ฉันคิดว่าฉันอาจสร้างชุดของกราฟที่มีปัญหาแตกต่างกัน แต่มีสไตล์เก๋เพื่อแสดงให้คุณเห็นว่าทำไมมันอาจเป็นอันตรายได้จากวิธีของผู้ใช้ประจำไปจนถึงวิธีเบส์และทำไมการใช้สถิติสรุปจึงสามารถสร้างปัญหาได้

แทนที่จะใช้ตัวอย่างของคุณซึ่งเป็นหลายมิติฉันจะตัดมันลงไปในมิติเดียวด้วยการศึกษาสองงานที่มีขนาดคือสามการสังเกตและสามการสังเกต

1π11+(xθ)2.

ฉันใช้มันเพราะทฤษฎีบทขีด จำกัด กลางใช้ไม่ได้, มันขาดสถิติเพียงพอ, การสังเกตอย่างมากเป็นเรื่องธรรมดา, ความไม่เสมอภาคของ Chebychev ไม่ได้เก็บไว้ ฉันใช้มันเพราะมันทำให้เป็นตัวอย่างที่ดีโดยไม่ต้องทำงานมากเกินไปในปัญหา

{5,1,4}{1.5,1,.5}±669σ±3σ

ความหนาแน่นหลังของทั้งสองการศึกษาแยกเป็น โปสเตอร์แยกต่างหากแบบเบย์

เห็นได้ชัดว่าการสรุปสถิติจากตัวอย่างหนึ่งอาจทำให้เข้าใจผิดอย่างไม่น่าเชื่อ หากคุณคุ้นเคยกับการมองเห็นความหนาแน่นที่ดีไม่ได้เปลี่ยนรูปแบบที่กำหนดชัดเจนและตั้งชื่อแล้วก็สามารถออกไปข้างนอกได้อย่างรวดเร็วด้วยเครื่องมือแบบเบย์ ไม่มีการแจกแจงแบบระบุชื่อ แต่คุณสามารถอธิบายได้อย่างชัดเจนด้วยสถิติสรุปหากคุณไม่ได้ดูด้วยสายตา การใช้สถิติสรุปอาจเป็นปัญหาหากคุณจะใช้เพื่อสร้างสถิติใหม่ก่อน

การกระจายความเชื่อมั่นของผู้ใช้บ่อยสำหรับตัวอย่างทั้งสองเท่ากัน เนื่องจากสเกลเป็นที่รู้จักพารามิเตอร์ที่ไม่รู้จักเท่านั้นคือค่ามัธยฐาน สำหรับขนาดตัวอย่างสามค่ามัธยฐานคือ MVUE ในขณะที่การแจกแจงโคชีไม่มีค่าเฉลี่ยหรือความแปรปรวน แต่การแจกแจงตัวอย่างของค่ามัธยฐานนั้น มีประสิทธิภาพน้อยกว่าตัวประมาณโอกาสสูงสุด แต่ไม่ต้องใช้ความพยายามในการคำนวณ สำหรับตัวอย่างขนาดใหญ่วิธีการของ Rothenberg คือ MVUE และมีวิธีแก้ปัญหาตัวอย่างขนาดกลางเช่นกัน

สำหรับการแจกแจงความถี่คุณจะได้รับ การกระจายความมั่นใจของผู้ใช้บ่อย

Pr(x|θ)Pr(θ|x)

การแจกแจงของผู้ใช้บ่อยจะเป็นการทำซ้ำขนาดไม่ จำกัด จำนวนสามครั้งและแสดงการกระจายที่ จำกัด สำหรับการแจกแจงค่ามัธยฐานตัวอย่าง การกระจายแบบเบย์ให้ดังนั้นมันขึ้นอยู่กับตัวอย่างที่สังเกตได้เท่านั้นและไม่สนใจคุณสมบัติที่ดีหรือไม่ดีที่ตัวอย่างนี้อาจมี อันที่จริงตัวอย่างนั้นผิดปกติสำหรับวิธีการแบบเบย์และอาจมีการหยุดชั่วคราวเพื่อสร้างการอนุมานเกี่ยวกับมัน นี่คือเหตุผลที่คนหลังกว้างมากตัวอย่างผิดปกติ วิธีการของผู้ใช้บ่อยคือการควบคุมสำหรับตัวอย่างที่ผิดปกติในขณะที่เบย์ไม่ได้เป็น สิ่งนี้จะสร้างตัวพิมพ์ที่ผิดเพี้ยนที่ความแน่นอนที่เพิ่มเข้ามาของพารามิเตอร์สเกลแคบลงโซลูชันของผู้ใช้บ่อยx

หลังร่วมกันเป็นผลิตภัณฑ์ของทั้งสอง posteriors และโดยการเชื่อมโยงของการคูณมันไม่สำคัญว่าคำสั่งที่คุณใช้ ข้อต่อและแยกโปสเตอร์สายตาหลังร่วมกันคือ

เห็นได้ชัดว่าหากคุณกำหนดการแจกจ่ายง่าย ๆ บนโปสเตอร์และใช้สถิติสรุปของพวกเขาคุณน่าจะได้รับคำตอบที่แตกต่างออกไป ความจริงมันอาจเป็นคำตอบที่แตกต่างกันมาก หากมีการใช้พื้นที่ที่น่าเชื่อถือ 70% สำหรับการศึกษาหนึ่งภูมิภาคก็จะส่งผลให้เกิดภูมิภาคที่น่าเชื่อถือ การดำรงอยู่ของช่วงเวลาที่ไม่ได้เชื่อมต่อเกิดขึ้นในวิธีการแบบเบย์บางครั้ง กราฟฟิคของช่วงความหนาแน่นสูงสุดและช่วงความหนาแน่นต่ำสุดสำหรับการศึกษาหนึ่งคือHDR กับ LDR

คุณจะสังเกตเห็นว่า HDR ถูกทำลายโดยเศษไม้ของพื้นที่ซึ่งอยู่นอกชุดที่น่าเชื่อถือ

ในขณะที่ปัญหาเหล่านี้มักจะหายไปในกลุ่มใหญ่ด้วยการถดถอย แต่ขอยกตัวอย่างให้คุณเห็นถึงความแตกต่างอย่างเป็นธรรมชาติในวิธีการของเบย์และวิธีการเป็นประจำจะจัดการกับตัวแปรที่ขาดหายไปในการถดถอย

พิจารณาการถดถอยที่สร้างขึ้นอย่างดีด้วยตัวแปรที่ขาดหายไปหนึ่งอย่างคือสภาพอากาศ ให้เราสมมติว่าลูกค้าทำตัวแตกต่างกันในวันที่ฝนตกและวันที่มีแดด หากความแตกต่างนั้นเพียงพอก็สามารถมีโหมดหลังแบบเบย์สองโหมดได้อย่างง่ายดาย โหมดหนึ่งแสดงถึงพฤติกรรมที่มีแดดและอีกฝนตก คุณไม่รู้ว่าทำไมคุณมีสองโหมด อาจเป็นสถิติหรืออาจเป็นจุดข้อมูลที่ขาดหายไป แต่ตัวอย่างของคุณผิดปกติหรือแบบจำลองของคุณมีตัวแปรที่ละเว้น

ทางออกของผู้ใช้บ่อยจะเฉลี่ยทั้งสองรัฐและอาจวางสายการถดถอยลงในภูมิภาคที่ไม่มีพฤติกรรมของลูกค้าเกิดขึ้นจริง แต่โดยเฉลี่ยแล้วมีพฤติกรรมสองประเภท มันจะมีอคติลดลงด้วย ปัญหาอาจได้รับการติดในการวิเคราะห์ของเหลือโดยเฉพาะอย่างยิ่งหากมีความแตกต่างใหญ่ในความแตกต่างที่แท้จริง แต่มันอาจไม่ มันอาจเป็นหนึ่งในภาพแปลก ๆ ของสิ่งตกค้างที่จะปรากฏในการตรวจสอบข้ามเป็นครั้งคราว

ความจริงที่ว่าคุณมีผู้โพสต์ที่ต่างกันสองตัวจากข้อมูลเดียวกันหมายความว่าคุณไม่ได้คูณสองตัวเข้าด้วยกันโดยตรง ไม่ว่าคุณจะสร้างด้านหลังจากวิธีแก้ปัญหาแบบผู้ใช้ประจำซึ่งไม่ได้แมปแบบหนึ่งต่อหนึ่งกับหลังแบบ Bayesian หรือคุณสร้างก่อนหน้านี้จากสถิติสรุปและฟังก์ชันความน่าจะเป็นไม่สมมาตรซึ่งเป็นเรื่องปกติ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.