ความแตกต่างระหว่าง d ของโคเฮนกับเฮดเจดสำหรับการวัดขนาดเอฟเฟกต์


19

สำหรับการวิเคราะห์ขนาดเอฟเฟ็กต์ฉันสังเกตเห็นว่ามีความแตกต่างระหว่าง d ของ Cohen, g ของ Hedges และ Hedges 'g *

  • ปกติแล้วเมทริกทั้งสามนี้คล้ายกันมากหรือไม่
  • อะไรจะเป็นกรณีที่พวกเขาจะให้ผลลัพธ์ที่แตกต่างกัน?
  • นอกจากนี้ยังเป็นเรื่องของการตั้งค่าที่ฉันใช้หรือรายงานด้วย?

1
ในกรณีที่มีประโยชน์สำหรับสูตรตอบคำถามที่มีศักยภาพอยู่ที่นี่: en.wikipedia.org/wiki/Effect_size
Jeromy Anglim

การจำลองใน R ที่มีความแตกต่าง n1, n2, s1, s2 และความแตกต่างของประชากรจะทำให้การออกกำลังกายที่ดี ใคร?
Jeromy Anglim

1
วัสดุนี้ยังได้รับการคุ้มครองที่นี่: อะไรคือความแตกต่างระหว่างพุ่มไม้กรัมและโคเฮนง
gung - Reinstate Monica

คำตอบ:


18

ทั้งความแปรปรวนกลุ่ม g ของโคเฮน d และ Hedges บนสมมติฐานของความแปรปรวนประชากรเท่ากัน แต่กลุ่มที่ใช้ n - 1 สำหรับแต่ละตัวอย่างแทนที่จะเป็น n ซึ่งให้การประมาณที่ดีกว่าโดยเฉพาะขนาดตัวอย่างที่เล็กลง ทั้ง d และ g ค่อนข้างมีอคติในเชิงบวก แต่เพียงเล็กน้อยสำหรับกลุ่มตัวอย่างที่มีขนาดปานกลางหรือใหญ่กว่า อคติลดลงโดยใช้ g * d โดย Glass ไม่ถือว่าผลต่างเท่ากันดังนั้นจึงใช้ sd ของกลุ่มควบคุมหรือกลุ่มเปรียบเทียบพื้นฐานเป็นเครื่องมือสร้างมาตรฐานสำหรับความแตกต่างระหว่างสองวิธี

ขนาดเอฟเฟกต์เหล่านี้และขนาดเอฟเฟกต์ที่ไม่ใช่พารามิเตอร์ของ Cliff และขนาดอื่น ๆ ที่กล่าวถึงในรายละเอียดในหนังสือของฉัน:

Grissom, RJ, & Kim, J, J. (2005) ขนาดผลสำหรับการวิจัย: แนวทางปฏิบัติที่กว้างขวาง Mahwah, NJ: Erlbaum


8

เพื่อความเข้าใจของฉัน g ของ Hedges เป็นรุ่นที่ค่อนข้างแม่นยำกว่าของ Cohen's d (พร้อมพูล SD) ที่เราเพิ่มปัจจัยแก้ไขสำหรับตัวอย่างเล็ก ๆ โดยทั่วไปแล้วมาตรการทั้งสองตกลงกันเมื่อข้อสันนิษฐานเกี่ยวกับความรักร่วมเพศไม่ได้ละเมิด แต่เราอาจพบสถานการณ์ที่ไม่ได้เป็นเช่นนี้ดูตัวอย่างเช่น McGrath & Meyer, ระเบียบวิธีทางจิตวิทยาปี 2006, 11 (4) : 386-401 ( pdf ) เอกสารอื่น ๆ มีการระบุไว้ในตอนท้ายของการตอบของฉัน

โดยทั่วไปแล้วฉันพบว่าในการศึกษาทางจิตวิทยาหรือชีวการแพทย์เกือบทุกครั้งนี่คือรายงานของโคเฮน สิ่งนี้อาจมาจากกฎง่ายๆสำหรับการตีความขนาด (โคเฮน, 1988) ฉันไม่รู้เกี่ยวกับกระดาษเมื่อเร็ว ๆ นี้ที่พิจารณา g ของ Hedges (หรือ Cliff delta เป็นทางเลือกที่ไม่ใช่พารามิเตอร์) Bruce Thompson มีเวอร์ชั่น APA ที่แก้ไขแล้วตามขนาดของเอฟเฟกต์

Googling เกี่ยวกับการศึกษา Monte Carlo เกี่ยวกับการวัดขนาดของเอฟเฟ็กต์ฉันพบบทความนี้ซึ่งน่าสนใจ (ฉันอ่านนามธรรมและการตั้งค่าการจำลองเท่านั้น): ช่วงความเชื่อมั่นที่แข็งแกร่งสำหรับขนาดของเอฟเฟ็กต์: การศึกษาเปรียบเทียบ และผลต่างแบบแปรปรวน (pdf)

เกี่ยวกับความคิดเห็นที่ 2 ของคุณMBESSแพ็คเกจ R รวมถึงสาธารณูปโภคต่าง ๆ สำหรับการคำนวณ ES (เช่นsmdและฟังก์ชั่นที่เกี่ยวข้อง)

การอ้างอิงอื่น ๆ

  1. Zakzanis, KK (2001) สถิติที่จะบอกความจริงความจริงทั้งหมดและไม่มีอะไรนอกจากความจริง: สูตรตัวอย่างตัวอย่างตัวเลขและการตีความแบบฮิวริสติกของการวิเคราะห์ขนาดของเอฟเฟกต์สำหรับนักวิจัยด้านจิตวิทยาประสาท จดหมายเหตุของประสาทวิทยาคลินิก , 16 (7), 653-667 ( pdf )
  2. Durlak, JA (2009) วิธีการเลือกคำนวณและตีความขนาดเอฟเฟกต์ วารสารจิตวิทยาเด็ก ( pdf )

2
ผู้ใช้ที่ไม่ระบุชื่อต้องการเพิ่มคำจำกัดความของhomoscedasticityต่อไปนี้สำหรับผู้ที่อาจไม่คุ้นเคยกับคำศัพท์: "คุณสมบัติของชุดของตัวแปรสุ่มที่แต่ละตัวแปรมีความแปรปรวนแน่นอน"
gung - Reinstate Monica

5

ดูเหมือนว่าเมื่อมีคนพูดว่าโคเฮนพวกเขาส่วนใหญ่หมายถึง:

d=x¯1x¯2s

ที่ไหนsเป็นสำรองส่วนเบี่ยงเบนมาตรฐาน

s=(x1x¯1)2+(x2x¯2)2n1+n22

มีตัวประมาณค่าอื่น ๆ สำหรับส่วนเบี่ยงเบนมาตรฐานที่รวมเป็นกลุ่มซึ่งอาจเป็นที่พบบ่อยที่สุดนอกเหนือจากที่กล่าวมาข้างต้น:

s=(x1x¯1)2+(x2x¯2)2n1+n2

โน้ตที่นี่จะไม่สอดคล้องกันอย่างน่าทึ่ง แต่บางครั้งคนบอกว่าที่s(เช่นn1+n2เวอร์ชั่น) รุ่นที่เรียกว่าโคเฮนdและจองชื่อ Hedge ของgสำหรับรุ่นที่ใช้s (เช่นกับการแก้ไขของ Bessel รุ่น n1 + n2−2) นี่เป็นเรื่องแปลกที่โคเฮนได้อธิบายทั้งตัวประมาณค่าเบี่ยงเบนมาตรฐาน (เช่นเวอร์ชันsบนหน้า 67, โคเฮน, 1977) ก่อนที่เฮดเจสเขียนเกี่ยวกับพวกเขา (เฮดจ์, 1981)

เวลาอื่น g ของ Hedge ถูกสงวนไว้เพื่ออ้างถึงเวอร์ชันที่แก้ไขอคติของความแตกต่างเฉลี่ยที่เป็นมาตรฐานที่ Hedges พัฒนาขึ้น Hedges (1981) แสดงให้เห็นว่า d ของ Cohen นั้นเอนเอียงไปทางเหนือ (กล่าวคือค่าที่คาดหวังสูงกว่าค่าพารามิเตอร์ที่เป็นจริง) โดยเฉพาะอย่างยิ่งในกลุ่มตัวอย่างขนาดเล็กและเสนอปัจจัยการแก้ไขเพื่อแก้ไขอคติของ Cohen:

G ของ Hedges (ตัวประมาณที่ไม่เอนเอียง):

g=d(Γ(df/2)df/2Γ((df1)/2))
df=n1+n22Γ

อย่างไรก็ตามปัจจัยการแก้ไขนี้มีความซับซ้อนในการคำนวณอย่างมากดังนั้น Hedges จึงให้การประมาณเล็กน้อยที่คำนวณได้ว่าในขณะที่ยังคงลำเอียงเล็กน้อยนั้นเป็นสิ่งที่ดีสำหรับวัตถุประสงค์ที่เป็นไปได้เกือบทั้งหมด:

g

g=d(134(df)1)
df=n1+n22

(มีพื้นเพมาจาก Hedges, 1981, รุ่นนี้จาก Borenstein, Hedges, Higgins, & Rothstein, 2011, p. 27)

gg

n>20

อ้างอิง:

Borenstein, M. , Hedges, LV, Higgins, JP, & Rothstein, HR (2011) การวิเคราะห์ Meta เบื้องต้น West Sussex, สหราชอาณาจักร: John Wiley & Sons.

โคเฮน, J. (1977) การวิเคราะห์พลังงานเชิงสถิติสำหรับพฤติกรรมศาสตร์ (2nd ed.) Hillsdale, NJ, US: Lawrence Erlbaum Associates, Inc.

พุ่มไม้เลเวล (1981) ทฤษฎีการกระจายของตัวประมาณขนาดผลกระทบและตัวประมาณที่เกี่ยวข้อง วารสารสถิติการศึกษา, 6 (2), 107-128 ดอย: 10.3102 / 10769986006002107

พุ่มไม้เลเวล Olkin ฉัน (2528) วิธีการทางสถิติสำหรับการวิเคราะห์อภิมาน San Diego, CA: สื่อวิชาการ


3

หากคุณเพียงแค่พยายามที่จะเข้าใจความหมายพื้นฐานของ Hedges 'g เช่นเดียวกับฉันคุณอาจพบว่ามีประโยชน์:

ขนาดของการป้องกันความเสี่ยงอาจถูกตีความโดยใช้แบบแผนของโคเฮน (1988 [2]) ที่มีขนาดเล็ก (0.2), ขนาดกลาง (0.5), และขนาดใหญ่ (0.8) [1]

คำจำกัดความของพวกเขาสั้นและชัดเจน:

Hedges 'g เป็นการเปลี่ยนแปลงของ d ของ Cohen ที่แก้ไขอคติเนื่องจากขนาดตัวอย่างขนาดเล็ก (Hedges & Olkin, 1985) [1] เชิงอรรถ

ฉันขอขอบคุณผู้เชี่ยวชาญด้านสถิติที่แก้ไขสิ่งนี้เพื่อเพิ่มคำเตือนสำคัญใด ๆ ลงในข้อเรียกร้องขนาดเล็ก (0.2) (0.5) และใหญ่ (0.8) เพื่อช่วย nonexperts หลีกเลี่ยงการตีความหมายเลขเฮดจ์ที่ใช้ในการวิจัยทางสังคมศาสตร์และจิตวิทยา

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ผลของการบำบัดโดยใช้สติที่มีต่อความวิตกกังวลและภาวะซึมเศร้า: รีวิว Meta-Analytic Review Stefan G. Hofmann, Alice T. Sawyer, แอชลีย์เอ. วิตต์และไดอาน่าโอ J Consult Clin Psychol 2553 เมษายน; 78 (2): 169–183 ดอย: 10.1037 / a0018555

[2] โคเฮนเจการวิเคราะห์พลังงานเชิงสถิติสำหรับวิทยาศาสตร์เชิงพฤติกรรม ฉบับที่ 2 Erlbaum; Hillsdale, นิวเจอร์ซีย์: 1988 (อ้างถึงใน [1])


4
+1 Re: small-medium-large, เป็น pass ครั้งที่ 1, ถ้าคุณไม่มีความรู้หรือบริบทใด ๆ เลยขนาดเสื้อยืดเหล่านี้ก็โอเค แต่ในความเป็นจริงแล้วเอฟเฟกต์ขนาดเล็กหรือใหญ่จะแตกต่างกันไปตามระเบียบหรือหัวข้อ . ยิ่งกว่านั้นเพียงเพราะเอฟเฟกต์คือ 'ใหญ่' ไม่ได้แปลว่ามันสำคัญจริง ๆ หรือมีความหมายในทางทฤษฎี
gung - Reinstate Monica

1

โปสเตอร์อื่น ๆ ได้กล่าวถึงประเด็นเรื่องความเหมือนและความแตกต่างระหว่าง g และ d เพื่อเพิ่มในเรื่องนี้นักวิชาการบางคนรู้สึกว่าค่าขนาดของเอฟเฟ็กต์ที่โคเฮนเสนอนั้นใจกว้างเกินไปที่จะนำไปสู่การตีความผลกระทบที่อ่อนแอเกินไป พวกเขายังไม่เชื่อมโยงกับการนำไปสู่ความเป็นไปได้ที่นักวิชาการอาจแปลงไปมาเพื่อให้ได้ขนาดเอฟเฟกต์ที่แปลได้ดีกว่า เฟอร์กูสัน (2009, ผู้เชี่ยวชาญด้านจิตวิทยา: การวิจัยและการปฏิบัติ) แนะนำให้ใช้ค่าต่อไปนี้สำหรับการตีความสำหรับ g:

.41 ตามขั้นต่ำที่แนะนำสำหรับ "ความสำคัญในทางปฏิบัติ" 1.15 ผลปานกลาง 2.70 ผลดี

เห็นได้ชัดว่ามีความเข้มงวดมากขึ้น / ยากที่จะประสบความสำเร็จและมีการทดลองทางสังคมศาสตร์ไม่มากที่จะได้รับผลกระทบที่รุนแรง ... ซึ่งน่าจะเป็นอย่างไร


0

Bruce Thompson เตือนเกี่ยวกับการใช้โคเฮน (0.2) น้อย (0.5) ปานกลางและ (0.8) ใหญ่ โคเฮนไม่เคยตั้งใจให้สิ่งเหล่านี้ถูกใช้เพื่อการตีความที่เข้มงวด ขนาดผลกระทบทั้งหมดจะต้องตีความตามบริบทของวรรณกรรมที่เกี่ยวข้อง หากคุณกำลังวิเคราะห์ขนาดผลกระทบที่เกี่ยวข้องที่รายงานในหัวข้อของคุณและพวกเขาคือ (0.1) (0.3) (0.24) และคุณสร้างผลกระทบจาก (0.4) นั่นอาจเป็น "ใหญ่" ในทางกลับกันหากวรรณกรรมที่เกี่ยวข้องทั้งหมดมีผลกระทบของ (0.5) (0.6) (0.7) และคุณมีผลกระทบจาก (0.4) อาจถือว่ามีขนาดเล็ก ฉันรู้ว่านี่เป็นตัวอย่างที่ไม่สำคัญ แต่สำคัญมาก ฉันเชื่อว่า ธ อมป์สันเคยกล่าวไว้ในกระดาษว่า "เราแค่โง่ในเมตริกที่แตกต่างกัน" เมื่อเปรียบเทียบการตีความขนาดของเอฟเฟกต์กับวิธีที่นักวิทยาศาสตร์สังคมตีความตีความค่า p ในเวลานั้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.