สามารถคำนวณค่า p สำหรับการทดสอบความสัมพันธ์ของ Pearson จากค่าสัมประสิทธิ์สหสัมพันธ์และขนาดตัวอย่างได้หรือไม่?


12

ข้อมูลประกอบ:ฉันอ่านบทความหนึ่งที่ผู้เขียนรายงานความสัมพันธ์ของเพียร์สัน 0.754 จากขนาดตัวอย่าง 878 ผล p-value สำหรับการทดสอบความสัมพันธ์คือ "สองดาว" อย่างมีนัยสำคัญ (เช่น p <0.01) อย่างไรก็ตามฉันคิดว่าด้วยขนาดตัวอย่างขนาดใหญ่ค่า p ที่สอดคล้องกันควรน้อยกว่า 0.001 (นั่นคือนัยสำคัญระดับสามดาว)

  • สามารถคำนวณค่า p สำหรับการทดสอบนี้ได้จากสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันและขนาดตัวอย่างหรือไม่?
  • ถ้าใช่สิ่งนี้สามารถทำได้ใน R

1
สำหรับผู้ที่สนใจที่นี่เป็นเครื่องคิดเลข p-value ออนไลน์ที่ใช้เวลาและ R n
Jeromy Anglim

คำตอบ:


14

ใช่สามารถทำได้ถ้าคุณใช้การแปลง R-to-z ของฟิชเชอร์ วิธีอื่น ๆ (เช่น bootstrap) อาจมีข้อได้เปรียบบางอย่าง แต่ต้องการข้อมูลต้นฉบับ ใน R ( rคือสัมประสิทธิ์สหสัมพันธ์ตัวอย่างnคือจำนวนการสังเกต):

z <- 0.5 * log((1+r)/(1-r))
zse <- 1/sqrt(n-3)
min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2

ดูยังโพสต์นี้บนบล็อกของฉัน

ที่กล่าวว่าไม่ว่าจะเป็น. 01 หรือ. 001 นั้นไม่สำคัญเท่าไหร่ อย่างที่คุณพูดนี่คือฟังก์ชั่นขนาดตัวอย่างส่วนใหญ่และคุณรู้อยู่แล้วว่าขนาดตัวอย่างใหญ่ ข้อสรุปเชิงตรรกะคือคุณอาจไม่จำเป็นต้องทำการทดสอบเลย (โดยเฉพาะอย่างยิ่งไม่ใช่การทดสอบสมมติฐานที่เรียกว่า 'ไม่มี' ที่ความสัมพันธ์เป็น 0) ด้วยN = 878 คุณสามารถมั่นใจในความแม่นยำของการประมาณการและมุ่งเน้นไปที่การตีความโดยตรง (เช่นคือ. 75 ขนาดใหญ่ในสาขาของคุณ?)

อย่างไรก็ตามอย่างเป็นทางการเมื่อคุณทำการทดสอบทางสถิติในกรอบงานของ Neyman-Pearson คุณจะต้องระบุระดับข้อผิดพลาดล่วงหน้า ดังนั้นหากผลลัพธ์ของการทดสอบมีความสำคัญและมีการวางแผนการศึกษาด้วย. 01 เป็นเกณฑ์จะทำให้รู้สึกถึงการรายงานp <.01 เท่านั้นและคุณไม่ควรฉวยโอกาสทำให้มันเป็นp <.001 ตามค่าp ที่ได้รับ ความยืดหยุ่นที่ไม่เปิดเผยประเภทนี้เป็นหนึ่งในเหตุผลหลักที่อยู่เบื้องหลังการวิจารณ์ของดาวฤกษ์ดวงเล็ก ๆ และโดยทั่วไปแล้วการทดสอบนัยสำคัญที่ใช้สมมติฐานสมมุติฐานว่างในสังคมศาสตร์

ดูเพิ่มเติม Meehl, PE (1978) ความเสี่ยงเชิงทฤษฎีและเครื่องหมายดอกจันแบบตาราง: เซอร์คาร์ล, เซอร์โรนัลด์และความก้าวหน้าช้าของจิตวิทยาอ่อน วารสารการให้คำปรึกษาและจิตวิทยาคลินิก, 46 (4), 806-834 (ชื่อมีการอ้างอิงถึง "ดาว" เหล่านี้ แต่เนื้อหาเป็นการสนทนาที่กว้างกว่ามากเกี่ยวกับบทบาทของการทดสอบที่สำคัญ)


1
ฉันอาจจะแนะนำพวกเขาให้เลิกดาวเล็ก ๆ น้อย ๆ แม้ว่าผลลัพธ์จะถูกต้อง แต่ฉันเห็นจุดของคุณ
งานกาล่า

1
ฉันแก้ไขคำตอบเพื่อเพิ่มหมายเหตุเกี่ยวกับปัญหานี้ โปรดทราบว่า 0.001 <0.01 เพื่อให้ผู้เขียน "ถูกต้อง" อย่างเป็นทางการในทุกกรณีมันเป็นเรื่องของวิธีการรายงานผลลัพธ์ที่มีความหมาย ฉันคิดว่าแตกต่างจากข้อผิดพลาดทันทีที่ผู้ตรวจสอบควรแก้ไขปัญหานี้ควรถูกทิ้งให้ผู้เขียนตัดสินใจ
งานกาล่า

1
คุณถูกต้อง แต่จนถึงตอนนี้ฉันไม่เคยเห็นการรายงาน p <0.01 ถ้า p จริงน้อยกว่า 0.001 (โดยไม่บอกว่าระดับความมั่นใจสำหรับบทความนั้นคือ 0.01) ยิ่งกว่านั้นในบทความที่ฉันพูดถึงผู้เขียนรายงานการทดสอบสหสัมพันธ์ 30 ครั้งตามขนาดของกลุ่มตัวอย่างตั้งแต่ 837 ถึง 886 โดยมีความสัมพันธ์ระหว่าง 0.145 ถึง 0.754 และทั้งหมดถูกรายงานว่าเป็นดาวสองดวงที่สำคัญ
Miroslav Sabo

1
ฉันมีปัญหาในการโพสต์รหัสของฉันที่นี่ แต่ฉันรันการจำลองและค่า p จากโค้ดของคุณไม่เหมือนกับ p-value จาก cor.test
Miroslav Sabo

4
ฉันเขียนรีวิวการสอนการใช้ Fisher's z สำหรับความสัมพันธ์ที่เข้าถึงได้ที่stata-journal.com/sjpdf.html?articlenum=pr0041ฉันขอแนะนำให้ใช้ช่วงความมั่นใจมากขึ้นและคำนวณ 0.724, 0.781 ตามขีด จำกัด 95% ฉันขอแนะนำให้ดูข้อมูลเพิ่มเติมและหาวิธีการถดถอย
Nick Cox

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.