เกณฑ์สำหรับสัมประสิทธิ์สหสัมพันธ์เพื่อระบุนัยสำคัญทางสถิติของสหสัมพันธ์ในเมทริกซ์สหสัมพันธ์


10

ฉันได้คำนวณเมทริกซ์สหสัมพันธ์ของชุดข้อมูลซึ่งมีจุดข้อมูล 455 จุดแต่ละจุดมี 14 ลักษณะ ดังนั้นมิติของเมทริกซ์สหสัมพันธ์จึงเท่ากับ 14 x 14

ฉันสงสัยว่ามีเกณฑ์สำหรับค่าของสัมประสิทธิ์สหสัมพันธ์ซึ่งชี้ให้เห็นว่ามีความสัมพันธ์อย่างมีนัยสำคัญระหว่างสองของลักษณะเหล่านั้น

ฉันมีค่าอยู่ระหว่าง -0.2 ถึง 0.85 และฉันคิดว่าสิ่งสำคัญคือสิ่งที่สูงกว่า 0.7

  • มีค่าทั่วไปสำหรับค่าสัมประสิทธิ์สหสัมพันธ์ซึ่งควรได้รับการพิจารณาสำหรับเกณฑ์หรือเป็นเพียงบริบทขึ้นอยู่กับชนิดข้อมูลที่ฉันกำลังตรวจสอบ?

1
คุณได้ตรวจสอบstats.stackexchange.com/questions/5750/…แล้วหรือยัง?
user603

@ user603 จับดี: เป็นคำถามเดียวกันจริง นวัตกรรมที่นี่คือการถามว่าการทดสอบความสัมพันธ์ที่สำคัญอาจขึ้นอยู่กับ "ชนิดข้อมูล" (อ่าน: การกระจายข้อมูล) หวังว่าคำตอบจะมุ่งเน้นที่ด้านนี้แทนที่จะมุ่งไปที่พื้นเก่า
whuber

คำตอบ:


8

การทดสอบความสำคัญสำหรับสหสัมพันธ์

มีการทดสอบนัยสำคัญทางสถิติที่สามารถนำไปใช้กับความสัมพันธ์ส่วนบุคคลซึ่งบ่งชี้ถึงความน่าจะเป็นที่จะได้รับสหสัมพันธ์ที่มีขนาดใหญ่หรือใหญ่กว่าความสัมพันธ์ของกลุ่มตัวอย่างที่สมมติว่าสมมติฐานว่างเป็นจริง

จุดสำคัญคือสิ่งที่ถือเป็นสัมประสิทธิ์สหสัมพันธ์อย่างมีนัยสำคัญทางสถิติขึ้นอยู่กับ:

  • ขนาดตัวอย่าง : ขนาดตัวอย่างที่ใหญ่กว่าจะนำไปสู่เกณฑ์ที่น้อยลง
  • อัลฟ่า : มักตั้งเป็น. 05 อัลฟ่าที่เล็กกว่าจะนำไปสู่เกณฑ์ที่สูงขึ้นสำหรับนัยสำคัญทางสถิติ
  • การทดสอบแบบด้านเดียว / สองด้าน : ฉันเดาว่าคุณจะใช้แบบสองด้านดังนั้นสิ่งนี้อาจไม่สำคัญ
  • ประเภทของสัมประสิทธิ์สหสัมพันธ์ : ฉันเดาว่าคุณใช้ของเพียร์สัน
  • สมมติฐานการกระจายของ x และ y

ในสถานการณ์ทั่วไปโดยที่อัลฟาคือ. 05 ใช้การทดสอบแบบสองด้านโดยมีความสัมพันธ์ของเพียร์สันและที่ความปกติอย่างน้อยการประมาณที่เพียงพอปัจจัยหลักที่มีอิทธิพลต่อการตัดคือขนาดตัวอย่าง

เกณฑ์ความสำคัญ

อีกวิธีหนึ่งในการตีความคำถามของคุณคือพิจารณาว่าคุณสนใจไม่ใช่ว่าความสัมพันธ์มีความสำคัญทางสถิติหรือไม่ แต่เป็นประเด็นที่สำคัญจริงหรือไม่

นักวิจัยบางคนเสนอกฎง่ายๆสำหรับการตีความความหมายของสัมประสิทธิ์สหสัมพันธ์ แต่กฎของหัวแม่มือเหล่านี้เป็นโดเมนเฉพาะ

การทดสอบที่สำคัญหลายรายการ

k(k-1)/2k14(13)/2=9191* * * *05=4.55

ในฐานะที่เป็น @ user603 มีการชี้ประเด็นเหล่านี้มีการพูดคุยกันในเรื่องนี้คำถามก่อนหน้านี้

โดยทั่วไปแล้วฉันพบว่ามีประโยชน์เมื่อตีความเมทริกซ์สหสัมพันธ์เพื่อเน้นโครงสร้างระดับที่สูงขึ้น สิ่งนี้สามารถทำได้อย่างไม่เป็นทางการโดยดูที่รูปแบบทั่วไปในเมทริกซ์สหสัมพันธ์ สามารถทำได้อย่างเป็นทางการโดยใช้เทคนิคเช่น PCA และการวิเคราะห์ปัจจัย วิธีการดังกล่าวหลีกเลี่ยงปัญหาที่เกี่ยวข้องกับการทดสอบความสำคัญหลายอย่าง


1

ทางเลือกหนึ่งคือการจำลองสถานการณ์หรือทดสอบการเปลี่ยนรูป หากคุณรู้ว่าการกระจายที่ข้อมูลของคุณมาจากคุณสามารถจำลองจากการกระจายนั้น แต่ด้วยการสังเกตทั้งหมดที่เป็นอิสระ หากคุณไม่รู้จักการแจกแจงคุณสามารถเปลี่ยนค่าตัวแปรแต่ละตัวให้เป็นอิสระจากกันและนั่นจะทำให้คุณมีการกระจายตัวทั่วไปของตัวแปรแต่ละตัวเท่าเดิม แต่จะลบความสัมพันธ์ออกไป

ทำข้อใดข้อหนึ่งข้างต้น (รักษาขนาดตัวอย่างและขนาดเมทริกซ์ให้เหมือนกัน) ทั้งครั้ง (10,000 หรือมากกว่านั้น) และดูความสัมพันธ์สัมบูรณ์สูงสุดหรือควอไทล์อื่นที่อาจเป็นที่สนใจ สิ่งนี้จะให้การกระจายตัวของคุณจากสมมติฐานว่างที่คุณสามารถเปรียบเทียบค่าสูงสุดของความสัมพันธ์ที่สังเกตได้จริงของคุณกับ (และจำนวนดอกเบี้ยที่สูงอื่น ๆ )


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.