การทดสอบความสำคัญของความสัมพันธ์สามรายการขึ้นไปโดยใช้การแปลงของฟิชเชอร์


9

หลังจากที่โพสต์ก่อนหน้านี้เท่าที่ฉันสามารถเข้าใจได้ถ้าฉันมีสามค่าสัมประสิทธิ์สหสัมพันธ์ฉันจะต้องทดสอบพวกเขาเป็นคู่เพื่อดูว่ามีความแตกต่างอย่างมีนัยสำคัญในหมู่พวกเขา

ซึ่งหมายความว่าฉันจะต้องใช้การแปลง Fishers เพื่อหาคะแนน z ของ r แล้วตามด้วยค่า p ของ z (ซึ่งเครื่องคิดเลขที่แนะนำในโพสต์ก่อนหน้าทำขอบคุณ) แล้วตรวจสอบว่าค่า p สูงหรือต่ำกว่า ค่าอัลฟาของฉัน (0.05) สำหรับแต่ละคู่

เช่นถ้าอายุ 21 ถึง 30 ปีคือกลุ่มอายุ 1, 31 ถึง 40 ปีคือกลุ่มอายุ 2 และ 41 ถึง 50 ปีคือกลุ่มอายุ 2, การเปรียบเทียบความสัมพันธ์ระหว่างพฤติกรรมการช็อปปิ้งและการลดน้ำหนักของฉันจะเป็นอย่างไร:

  • กลุ่ม 1 กับกลุ่ม 2
  • กลุ่ม 1 กับกลุ่ม 3
  • กลุ่ม 2 กับกลุ่ม 3

แทนที่จะทำการคำนวณสามแบบแยกกันมีวิธีการคำนวณเหล่านี้ทั้งหมดในขั้นตอนเดียวหรือไม่?


1
คุณช่วยอธิบายรายละเอียดเพิ่มเติมหน่อยได้ไหม? เช่นเดียวกับใน - การตอบสนองของคุณคืออะไรตัวแปรอธิบายและความสัมพันธ์ที่คุณสนใจ คุณอาจไม่แปลงของ Fisher สำหรับการทดสอบสหสัมพันธ์ t-test ง่าย ๆ อาจเพียงพอ
suncoolsu

@suncoolsu ฉันกำลังทดสอบความสัมพันธ์ระหว่างพฤติกรรมการซื้อและการเพิ่มน้ำหนักของทั้งสามกลุ่ม ผลลัพธ์ของฉันมีดังนี้: กลุ่ม 1: r = .8978, n = 105; กลุ่ม 2: r = .5678, n = 95; และกลุ่ม 3: r = .7865, n = 120
Adhesh Josh

ฉันคิดว่าข้อมูลของคุณผ่าน IOTT นั่นคือการทดสอบการบาดเจ็บระหว่างตา - มันกระทบคุณระหว่างดวงตา หากความสัมพันธ์ของ. 9, .6 และ. 8 ไม่แตกต่างจากกันคืออะไร แต่ถ้าคุณสนใจจริงๆ
Peter Flom

คำตอบ:


4

คำถามของคุณเป็นตัวอย่างที่สมบูรณ์แบบของตัวแบบการถดถอยพร้อมตัวทำนายเชิงปริมาณและคุณภาพ โดยเฉพาะกลุ่มอายุสามกลุ่มคือ - เป็นตัวแปรเชิงคุณภาพและตัวแปรเชิงปริมาณคือพฤติกรรมการช็อปปิ้งและการลดน้ำหนัก (ฉันเดาเพราะคุณกำลังคำนวณสหสัมพันธ์)1,2,&3

ฉันต้องเน้นว่านี่เป็นวิธีที่ดีกว่าในการสร้างแบบจำลองมากกว่าการคำนวณความสัมพันธ์แบบกลุ่มที่แยกจากกันเพราะคุณมีข้อมูลมากขึ้นในการสร้างแบบจำลองดังนั้นการประเมินข้อผิดพลาดของคุณ (p-values ​​ฯลฯ ) จะเชื่อถือได้มากขึ้น เหตุผลทางเทคนิคที่มากขึ้นก็คือระดับความเป็นอิสระที่สูงขึ้นในสถิติ t-test สำหรับการทดสอบความสำคัญของสัมประสิทธิ์การถดถอย

การดำเนินการตามกฎที่สามารถทำนายตัวบ่งชี้เชิงคุณภาพได้โดยตัวแปรตัวบ่งชี้ตัวแปรตัวบ่งชี้สองตัวคือเท่านั้นที่นี่ซึ่งมีการกำหนดไว้ดังต่อไปนี้:cc1X1,X2

X1=1 if person belongs to group 1;0 otherwise.
X2=1 if person belongs to group 2;0 otherwise.

นี่ก็หมายความว่ากลุ่มมี ; แทนการตอบสนองของคุณ - ช้อปปิ้งนิสัยเป็นและการสูญเสียน้ำหนักตัวแปรอธิบายเชิงปริมาณเป็นWตอนนี้คุณอยู่พอดีกับโมเดลเชิงเส้นนี้แล้ว3X1=0,X2=0YW

E[Y]=β0+β1X1+β2X2+β3W.
คำถามที่ชัดเจนคือมันสำคัญไหมถ้าเราเปลี่ยนและ (เพราะฉันสุ่มเลือกพฤติกรรมการช็อปปิ้งเป็นตัวแปรตอบกลับ) คำตอบคือใช่ - ค่าประมาณของสัมประสิทธิ์การถดถอยจะเปลี่ยนไป แต่การทดสอบสำหรับ "การเชื่อมโยง" ระหว่างเงื่อนไขในกลุ่ม (นี่คือการทดสอบ t- แต่มันเหมือนกับการทดสอบความสัมพันธ์สำหรับตัวแปรตัวทำนายเดียว) จะไม่ เปลี่ยนแปลง เจาะจง,WY

E[Y]=β0+β3W -- for third group,
E[Y]=(β0+β2)+β3W -- for second group,
E[Y]=(β0+β1)+β3W -- for first group,
นี้จะเทียบเท่ากับการมี 3 สายแยกจากกันไปขึ้นอยู่กับกลุ่มถ้าคุณวางแผน VS Wนี่เป็นวิธีที่ดีในการแสดงภาพสิ่งที่คุณกำลังทดสอบเพื่อให้เข้าใจได้ง่าย (โดยทั่วไปคือรูปแบบของ EDA และการตรวจสอบแบบจำลอง แต่คุณต้องแยกความแตกต่างระหว่างการสังเกตแบบกลุ่มอย่างเหมาะสม) เส้นขนานสามเส้นบ่งชี้ว่าไม่มีการโต้ตอบระหว่างสามกลุ่มกับและการปฏิสัมพันธ์จำนวนมากที่มีความหมายว่าเส้นเหล่านี้จะถูกตัดกันYWW

การทดสอบทำอย่างไรที่คุณถาม โดยทั่วไปเมื่อคุณพอดีกับโมเดลและมีค่าประมาณคุณจะต้องทดสอบความแตกต่าง โดยเฉพาะสำหรับการเปรียบเทียบของคุณ:

Group 2 vs Group 3: β2+β0β0=0,
Group 1 vs Group 3: β1+β0β0=0,
Group 2 vs Group 1: β2+β0(β0+β1)=0.

การทดสอบความเท่ากันของความลาดชันนั้นแตกต่างจากการทดสอบความเท่ากันของสหสัมพันธ์ ดูตัวอย่างเช่น: jessicagrahn.com/uploads/6/0/8/5/6085172/comparecorrcoeff.doc
Wolfgang

ฉันเห็นด้วย แต่สำหรับตัวแปรทำนายเดียวมันควรจะเหมือนกันเพราะความสัมพันธ์นี้{n-2} t=ρn21ρ2tn2
suncoolsu

นอกจากนี้เอกสารของคุณยังพูดถึงการเปรียบเทียบประชากรที่แตกต่างกันซึ่งไม่ใช่กรณีของผู้ทำนายเดี่ยว
suncoolsu

ประเด็นคืออาจเป็นจริงในขณะที่อาจเป็นเท็จ (และในทางกลับกัน) ความสัมพันธ์ระหว่าง X และ Y ไม่เพียง แต่ขึ้นอยู่กับเท่านั้น แต่ยังรวมถึงความแปรปรวนใน X และความแปรปรวนของข้อผิดพลาดด้วย หากความแปรปรวนใน X และ / หรือข้อผิดพลาดแตกต่างกันใน 3 กลุ่มแสดงว่าคุณกำลังทดสอบสมมติฐานที่แตกต่างกัน H0:β1=β2=β3H0:ρ1=ρ2=ρ3β
Wolfgang

ใช่คุณพูดถูก (เหมือนที่ฉันพูดก่อนหน้านี้) แต่คำตอบของฉันสันนิษฐานว่า OP มีความสนใจในการกำหนดความสัมพันธ์ระหว่าง wt.loss และพฤติกรรมการช็อปปิ้งตามกลุ่ม (ไม่จำเป็นต้องสัมพันธ์กัน) ฉันเดาว่าฉันผิดเพราะ OP ยอมรับคำตอบอื่น อย่างไรก็ตามคำตอบนี้ทำหน้าที่เป็นทางเลือกที่มีประโยชน์ (ฉันหวังว่า)
suncoolsu

1

การทดสอบแบบคู่ในสถานการณ์นี้ยังไม่ได้พิสูจน์ด้วยคำอธิบายข้อมูล คุณควรใช้วิธีการถดถอยแบบหลายตัวแปร การโทร R อาจเป็น:

lm( weight_end ~ shop_habit + age_grp + weight_begin)

การสร้าง 3 หมวดนั้นไม่ใช่วิธีที่ดีที่สุดในการควบคุมอายุ (หรือวิเคราะห์การมีส่วนร่วมหากเป็นคำถามหลัก) เนื่องจากการจัดหมวดหมู่สามารถบิดเบือนความสัมพันธ์ต่อเนื่อง เมื่อมีหลักฐานเพียงพอของความสัมพันธ์ของการเปลี่ยนแปลงน้ำหนักหลังจากการวิเคราะห์ที่เหมาะสมแล้วจะมีตัวเลือกการทดสอบเฉพาะกิจที่สามารถปรับใช้

(ฉันเห็นด้วยกับสิ่งที่ @ โฮเบอร์ส่วนใหญ่แสดงความคิดเห็นและโดยทั่วไปฉันพบว่ามีความเห็นเชิงอำนาจ แต่ไม่เข้าใจจุดยืนของเขาเกี่ยวกับวิธีการถดถอย)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.