การวิเคราะห์แบบเบส์ของตารางฉุกเฉิน: วิธีการอธิบายขนาดผลกระทบ


9

ฉันกำลังทำงานผ่านตัวอย่างในการวิเคราะห์ข้อมูล Doing Bayesianของ Kruschke โดยเฉพาะการวิเคราะห์ความแปรปรวนแบบปัวซองในพัวซอง 22 ซึ่งเขานำเสนอเป็นทางเลือกแทนการทดสอบไคสแควร์เป็นประจำสำหรับความเป็นอิสระสำหรับตารางฉุกเฉิน

ฉันสามารถดูวิธีที่เราได้รับข้อมูลเกี่ยวกับการโต้ตอบที่เกิดขึ้นบ่อยหรือน้อยกว่าที่คาดไว้ถ้าตัวแปรนั้นเป็นอิสระ (เช่นเมื่อ HDI ไม่รวมศูนย์)

คำถามของฉันคือฉันจะคำนวณหรือตีความขนาดผลกระทบในกรอบงานนี้ได้อย่างไร ยกตัวอย่างเช่น Kruschke เขียน "การรวมกันของดวงตาสีฟ้ากับผมสีดำเกิดขึ้นน้อยกว่าที่คาดถ้าสีตาและสีผมเป็นอิสระ" แต่เราจะอธิบายความแข็งแกร่งของความสัมพันธ์นั้นได้อย่างไร? ฉันจะรู้ได้อย่างไรว่าการโต้ตอบใดที่รุนแรงกว่าการโต้ตอบอื่น ๆ หากเราทำการทดสอบไคสแควร์ของข้อมูลเหล่านี้เราอาจคำนวณCramér V เป็นเครื่องวัดขนาดเอฟเฟกต์โดยรวม ฉันจะแสดงขนาดลักษณะพิเศษในบริบทเบย์นี้ได้อย่างไร

นี่คือตัวอย่างที่มีในตัวเองจากหนังสือ (เขียนในR) ในกรณีที่คำตอบถูกซ่อนจากฉันในสายตาธรรมดา ...

df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", 
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))

df

         Blue Brown Green Hazel
Black      20    68     5    15
Blond      94     7    16    10
Brunette   84   119    29    54
Red        17    26    14    14

นี่คือผลลัพธ์ที่ออกมาบ่อยครั้งพร้อมการวัดขนาดเอฟเฟกต์ (ไม่ใช่ในหนังสือ):

vcd::assocstats(df)
                    X^2 df P(> X^2)
Likelihood Ratio 146.44  9        0
Pearson          138.29  9        0

Phi-Coefficient   : 0.483 
Contingency Coeff.: 0.435 
Cramer's V        : 0.279

นี่คือผลลัพธ์ของ Bayesian ที่มี HDIs และความน่าจะเป็นของเซลล์ (โดยตรงจากหนังสือ):

# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R", 
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")

# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))

# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))

และนี่คือพล็อตหลังของแบบจำลองเลขชี้กำลังของปัวซองที่ใช้กับข้อมูล:

ป้อนคำอธิบายรูปภาพที่นี่

และแปลงของการกระจายหลังเกี่ยวกับความน่าจะเป็นของเซลล์โดยประมาณ:

ป้อนคำอธิบายรูปภาพที่นี่

คำตอบ:


1

ตามดัชนี Kruschke กล่าวถึงขนาดผลสองครั้งเท่านั้นและทั้งสองครั้งอยู่ในบริบทของตัวแปรที่ทำนายการวัด แต่มีบิตนี้บนหน้า 601:

หากผู้วิจัยมีความสนใจในการละเมิดของความเป็นอิสระแล้วที่น่าสนใจคือในขนาดของ{RC} โมเดลนี้สะดวกมากสำหรับจุดประสงค์นี้เนื่องจากสามารถตรวจสอบความแตกต่างของการโต้ตอบโดยพลการได้βrc

ดังนั้นฉันจึงรวบรวมว่าเป็นพารามิเตอร์ในการตีความ Letเท่ากับผลรวมของผลิตภัณฑ์ทั้งหมดของสัมประสิทธิ์และองค์ประกอบ x ที่สอดคล้องกันของพวกเขาไม่รวมและ{1,2} ตั้งแต่และ S เมื่อ = 1,จะเติบโตหรือหดตัวโดยใช่ไหม?β1,2Sβ1,2x1,2yiPois(λi)λi=eβ1,2x1,2+S=eβ1,2x1,2eSx1,2λieβ1,2


1

วิธีหนึ่งในการศึกษาขนาดของเอฟเฟกต์ในแบบจำลอง ANOVA คือการดูค่าเบี่ยงเบนมาตรฐาน "ประชากรสุดยอด" และ "ประชากร จำกัด " คุณมีตารางสองทางดังนั้นนี่คือ 3 ส่วนประกอบความแปรปรวน (2 เอฟเฟกต์หลักและ 1 การโต้ตอบ) นี่คือการวิเคราะห์ mcmc คุณคำนวณค่าเบี่ยงเบนมาตรฐานสำหรับแต่ละเอฟเฟกต์สำหรับแต่ละตัวอย่าง mcmc

sk=1dk1j=1dk(βk,jβ¯k)2

โดยที่ทำดัชนี "แถว" ของตาราง ANOVA boxplots อย่างง่ายของตัวอย่าง mcmc ของ vsค่อนข้างให้คำแนะนำเกี่ยวกับขนาดของเอฟเฟกต์kskk

Andrew Gelman สนับสนุนวิธีการนี้ ดูบทความ 2005 ของเขา "การวิเคราะห์ความแปรปรวน: ทำไมมันจึงสำคัญกว่าที่เคย"


กระดาษที่มีอยู่ที่นี่
ฌอนอีสเตอร์

คำตอบทั้งสองนี้ดูมีแนวโน้มมากขอบคุณ คุณคุ้นเคยกับRการแสดงวิธีการตั้งโปรแกรมหรือไม่?
Ben

@seaneaster - ขอบคุณที่เพิ่มลิงค์ @ben การคำนวณเหล่านี้เป็นเรื่องง่ายในอาร์อย่างไรก็ตามฉันไม่แน่ใจว่าตัวอย่างแบบฟอร์มของคุณเป็นอย่างไรคุณควรจะสามารถใช้งานsd ()ร่วมกับหนึ่งในฟังก์ชั่น "นำไปใช้" สำหรับ boxplots boxplot ()เหล่านี้เป็นเรื่องง่ายที่จะได้รับคนขั้นพื้นฐานที่มี
ความน่าจะเป็นทางการ

ขอบคุณคุณสามารถสาธิตการใช้ข้อมูลตัวอย่างและรหัสในคำถามของฉันได้ไหม
Ben

กล่าวโดยย่อไม่เพราะฉันไม่เข้าใจรหัสที่คุณโพสต์ - ฉันไม่เห็นวิธีการจัดระเบียบข้อมูล และอย่างที่ฉันพูดนี่ไม่ใช่การวิเคราะห์ที่ยากที่จะทำด้วยตัวเอง วิธีนี้กำลังคำนวณการวัดอย่างง่าย (ค่าเบี่ยงเบนมาตรฐาน) นอกจากนี้การเข้ารหัส R ไม่ใช่ส่วนหนึ่งของคำถามของคุณคุณถามถึงวิธีสรุปการวิเคราะห์ตารางความเป็นไปได้
ความน่าจะเป็นทางการ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.