พื้นหลังและตัวอย่างเชิงประจักษ์
ฉันมีสองการศึกษา ฉันทำการทดลอง (การศึกษา 1) แล้วทำซ้ำ (การศึกษา 2) ในการศึกษา 1 ฉันพบปฏิสัมพันธ์ระหว่างสองตัวแปร ในการศึกษา 2 ปฏิสัมพันธ์นี้เป็นไปในทิศทางเดียวกัน แต่ไม่มีนัยสำคัญ นี่คือบทสรุปสำหรับโมเดลของ Study 1:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.75882 0.26368 21.840 < 2e-16 ***
condSuppression -1.69598 0.34549 -4.909 1.94e-06 ***
prej -0.01981 0.08474 -0.234 0.81542
condSuppression:prej 0.36342 0.11513 3.157 0.00185 **
และรูปแบบการศึกษา 2:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.24493 0.24459 21.444 <2e-16 ***
prej 0.13817 0.07984 1.731 0.0851 .
condSuppression -0.59510 0.34168 -1.742 0.0831 .
prej:condSuppression 0.13588 0.11889 1.143 0.2545
แทนที่จะพูดว่า "ฉันเดาว่าฉันไม่มีอะไรเลยเพราะฉันไม่สามารถทำซ้ำได้" "สิ่งที่ฉันทำคือรวมชุดข้อมูลทั้งสองแล้วสร้างตัวแปรจำลองสำหรับการศึกษาข้อมูลที่มาจากนั้นจึงเรียกใช้การโต้ตอบ อีกครั้งหลังจากควบคุมการศึกษาตัวแปรจำลอง การโต้ตอบนี้มีความสำคัญแม้หลังจากควบคุมแล้วและฉันพบว่าการโต้ตอบแบบสองทางนี้ระหว่างเงื่อนไขและไม่ชอบ / prej ไม่ผ่านการรับรองโดยการโต้ตอบสามทางกับตัวแปรจำลองการศึกษา
แนะนำการวิเคราะห์แบบเบย์
ฉันมีคนแนะนำว่านี่เป็นโอกาสที่ดีในการใช้การวิเคราะห์แบบเบย์: ในการศึกษา 2 ฉันมีข้อมูลจากการศึกษา 1 ที่ฉันสามารถใช้เป็นข้อมูลก่อนหน้าได้! ด้วยวิธีนี้การศึกษา 2 ได้ทำการปรับปรุงแบบเบย์จากผลการเรียนสแควร์สแควร์ธรรมดาในผลการศึกษา 1 ดังนั้นฉันกลับไปวิเคราะห์รูปแบบการเรียน 2 อีกครั้งโดยใช้ข้อมูลที่มีค่าสัมประสิทธิ์: สัมประสิทธิ์ทั้งหมดมี ปกติก่อนที่ค่าเฉลี่ยคือค่าประมาณในการศึกษา 1 และค่าเบี่ยงเบนมาตรฐานเป็นข้อผิดพลาดมาตรฐานในการศึกษา 1
นี่คือบทสรุปของผลลัพธ์:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.63 0.17 5.30 5.52 5.63 5.74 5.96
condSuppression -1.20 0.20 -1.60 -1.34 -1.21 -1.07 -0.80
prej 0.02 0.05 -0.08 -0.01 0.02 0.05 0.11
condSuppression:prej 0.34 0.06 0.21 0.30 0.34 0.38 0.46
sigma 1.14 0.06 1.03 1.10 1.13 1.17 1.26
mean_PPD 5.49 0.11 5.27 5.41 5.49 5.56 5.72
log-posterior -316.40 1.63 -320.25 -317.25 -316.03 -315.23 -314.29
ดูเหมือนว่าตอนนี้เรามีหลักฐานที่ชัดเจนสำหรับการโต้ตอบจากการวิเคราะห์การศึกษา 2 สิ่งนี้เห็นด้วยกับสิ่งที่ฉันทำเมื่อฉันเพียงแค่วางข้อมูลทับซ้อนกันและวิ่งแบบจำลองที่มีหมายเลขการศึกษาเป็นตัวแปรจำลอง
Counterfactual: เกิดอะไรขึ้นถ้าฉันวิ่งไปเรียน 2 ก่อน?
นั่นทำให้ฉันคิดว่าจะเกิดอะไรขึ้นถ้าฉันเรียกใช้การศึกษา 2 ก่อนแล้วจึงใช้ข้อมูลจากการศึกษา 1 เพื่อปรับปรุงความเชื่อของฉันในการศึกษา 2 ฉันทำสิ่งเดียวกันข้างต้น แต่ในทางกลับกัน: ฉันวิเคราะห์ข้อมูลการศึกษา 1 อีกครั้งโดยใช้การประมาณค่าสัมประสิทธิ์กำลังสองน้อยที่สุดสามัญและส่วนเบี่ยงเบนมาตรฐานจากการศึกษา 2 เป็นวิธีการก่อนหน้าและค่าเบี่ยงเบนมาตรฐานสำหรับการวิเคราะห์ข้อมูลการศึกษา 1 ผลสรุปคือ:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.35 0.17 5.01 5.23 5.35 5.46 5.69
condSuppression -1.09 0.20 -1.47 -1.22 -1.09 -0.96 -0.69
prej 0.11 0.05 0.01 0.08 0.11 0.14 0.21
condSuppression:prej 0.17 0.06 0.05 0.13 0.17 0.21 0.28
sigma 1.10 0.06 0.99 1.06 1.09 1.13 1.21
mean_PPD 5.33 0.11 5.11 5.25 5.33 5.40 5.54
log-posterior -303.89 1.61 -307.96 -304.67 -303.53 -302.74 -301.83
อีกครั้งเราเห็นหลักฐานของการมีปฏิสัมพันธ์อย่างไรก็ตามสิ่งนี้อาจไม่จำเป็น โปรดทราบว่าการประเมินจุดสำหรับการวิเคราะห์แบบเบย์ทั้งคู่ไม่ได้อยู่ในช่วงเวลาที่น่าเชื่อถือ 95% สำหรับอีกฝ่ายหนึ่ง สองช่วงเวลาที่น่าเชื่อถือจากการวิเคราะห์แบบเบย์มีการทับซ้อนกันมากกว่าการซ้อนทับ
อะไรคือการให้เหตุผลแบบเบย์สำหรับความสำคัญของเวลา?
คำถามของฉันคืออะไร: อะไรคือเหตุผลที่ Bayesians มีเพื่อเคารพลำดับเหตุการณ์ของวิธีการรวบรวมและวิเคราะห์ข้อมูล? ฉันได้รับผลลัพธ์จากการศึกษา 1 และใช้พวกเขาเป็นนักบวชที่ให้ข้อมูลในการศึกษา 2 เพื่อให้ฉันใช้การศึกษา 2 เพื่อ "ปรับปรุง" ความเชื่อของฉัน แต่ถ้าเราสมมติว่าผลลัพธ์ที่ฉันได้รับมาจากการแจกแจงแบบสุ่มที่มีเอฟเฟกต์ประชากรจริงแล้วทำไมฉันถึงได้รับสิทธิพิเศษผลลัพธ์จากการศึกษา 1 อะไรคือเหตุผลสำหรับการใช้ผลการศึกษา 1 ในฐานะนักการศึกษา 2 แทนการใช้ผลการศึกษา 2 ในฐานะนักการศึกษา 1? ลำดับที่ฉันรวบรวมและคำนวณการวิเคราะห์นั้นสำคัญหรือไม่ ดูเหมือนจะไม่เหมาะกับฉัน - อะไรคือเหตุผลของ Bayesian สำหรับเรื่องนี้? ทำไมฉันจึงควรเชื่อว่าการประเมินจุดนั้นใกล้เคียงกับ. 34 มากกว่าที่จะเป็น. 17 เพียงเพราะฉันวิ่งการศึกษา 1 ก่อน?
ตอบสนองต่อคำตอบของนักวิทยาศาสตร์
Kodiologist ตั้งข้อสังเกต:
จุดที่สองของคะแนนเหล่านี้ไปสู่การออกเดินทางครั้งสำคัญที่คุณทำจากการประชุมแบบเบย์ คุณไม่ได้ตั้งค่าก่อนหน้าแล้วจึงปรับให้เหมาะกับทั้งสองแบบในแบบเบย์ คุณพอดีกับนางแบบหนึ่งคนในแบบที่ไม่ใช่แบบเบย์แล้วใช้มันเพื่อเป็นเกียรติแก่รุ่นอื่น หากคุณใช้วิธีการทั่วไปคุณจะไม่เห็นการพึ่งพาตามลำดับที่คุณเห็นที่นี่
จะอยู่ที่นี่ผมพอดีกับรูปแบบการศึกษาที่ 1 และ 2 การศึกษาที่ทุกค่าสัมประสิทธิ์การถดถอยมีก่อน5) ตัวแปรเป็นตัวแปรหุ่นสภาพทดลองรหัส 0 หรือ 1; ตัวแปรเช่นเดียวกับผลที่ทั้งสองวัดบนตาชั่ง 7 จุดตั้งแต่ 1 ถึง 7 ดังนั้นฉันคิดว่ามันเป็นทางเลือกที่ยุติธรรมของก่อน โดยการปรับขนาดข้อมูลมันจะหายากมากที่จะเห็นค่าสัมประสิทธิ์ที่ใหญ่กว่าสิ่งที่แนะนำก่อนหน้านี้cond
prej
การประมาณค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานของการประมาณการเหล่านั้นใกล้เคียงกับในการถดถอยแบบ OLS ศึกษา 1:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.756 0.270 5.236 5.573 5.751 5.940 6.289
condSuppression -1.694 0.357 -2.403 -1.925 -1.688 -1.452 -0.986
prej -0.019 0.087 -0.191 -0.079 -0.017 0.040 0.150
condSuppression:prej 0.363 0.119 0.132 0.282 0.360 0.442 0.601
sigma 1.091 0.057 0.987 1.054 1.088 1.126 1.213
mean_PPD 5.332 0.108 5.121 5.259 5.332 5.406 5.542
log-posterior -304.764 1.589 -308.532 -305.551 -304.463 -303.595 -302.625
และการศึกษา 2:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.249 0.243 4.783 5.082 5.246 5.417 5.715
condSuppression -0.599 0.342 -1.272 -0.823 -0.599 -0.374 0.098
prej 0.137 0.079 -0.021 0.084 0.138 0.192 0.287
condSuppression:prej 0.135 0.120 -0.099 0.055 0.136 0.214 0.366
sigma 1.132 0.056 1.034 1.092 1.128 1.169 1.253
mean_PPD 5.470 0.114 5.248 5.392 5.471 5.548 5.687
log-posterior -316.699 1.583 -320.626 -317.454 -316.342 -315.561 -314.651
เนื่องจากค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานเหล่านี้มีค่ามากกว่าหรือน้อยกว่าประมาณการ OLS ผลของคำสั่งซื้อดังกล่าวยังคงเกิดขึ้น ถ้าฉันปลั๊กอินสถิติสรุปหลังจากการศึกษา 1 ลงในนักวิเคราะห์เมื่อศึกษา 2 ฉันสังเกตหลังสุดท้ายที่แตกต่างกว่าเมื่อวิเคราะห์การศึกษา 2 ก่อนแล้วใช้สถิติสรุปหลังเหล่านั้นเป็นนักวิเคราะห์การศึกษา 1
แม้ว่าฉันจะใช้วิธีการแบบเบย์และส่วนเบี่ยงเบนมาตรฐานสำหรับสัมประสิทธิ์การถดถอยเป็นนักบวชแทนที่จะเป็นค่าประมาณที่ใช้บ่อยฉันก็ยังคงสังเกตเห็นผลการเรียงลำดับเดียวกัน ดังนั้นคำถามยังคงอยู่: อะไรคือเหตุผลของ Bayesian สำหรับการศึกษาที่ได้รับสิทธิพิเศษก่อน
rstanarm
หรือสแตน? ดูเหมือนว่ามีการถามคำถามนี้ที่นี่มาก่อน: stats.stackexchange.com/questions/241690/…
prej
ควรเป็นแบบเดียวกันทั้งสองเว้นแต่ว่าฉันเข้าใจผิดเกี่ยวกับกระบวนการของคุณ