คำถามของคุณเป็นตัวอย่างที่สมบูรณ์แบบของตัวแบบการถดถอยพร้อมตัวทำนายเชิงปริมาณและคุณภาพ โดยเฉพาะกลุ่มอายุสามกลุ่มคือ - เป็นตัวแปรเชิงคุณภาพและตัวแปรเชิงปริมาณคือพฤติกรรมการช็อปปิ้งและการลดน้ำหนัก (ฉันเดาเพราะคุณกำลังคำนวณสหสัมพันธ์)1,2,&3
ฉันต้องเน้นว่านี่เป็นวิธีที่ดีกว่าในการสร้างแบบจำลองมากกว่าการคำนวณความสัมพันธ์แบบกลุ่มที่แยกจากกันเพราะคุณมีข้อมูลมากขึ้นในการสร้างแบบจำลองดังนั้นการประเมินข้อผิดพลาดของคุณ (p-values ฯลฯ ) จะเชื่อถือได้มากขึ้น เหตุผลทางเทคนิคที่มากขึ้นก็คือระดับความเป็นอิสระที่สูงขึ้นในสถิติ t-test สำหรับการทดสอบความสำคัญของสัมประสิทธิ์การถดถอย
การดำเนินการตามกฎที่สามารถทำนายตัวบ่งชี้เชิงคุณภาพได้โดยตัวแปรตัวบ่งชี้ตัวแปรตัวบ่งชี้สองตัวคือเท่านั้นที่นี่ซึ่งมีการกำหนดไว้ดังต่อไปนี้:cc−1X1,X2
X1=1 if person belongs to group 1;0 otherwise.
X2=1 if person belongs to group 2;0 otherwise.
นี่ก็หมายความว่ากลุ่มมี ; แทนการตอบสนองของคุณ - ช้อปปิ้งนิสัยเป็นและการสูญเสียน้ำหนักตัวแปรอธิบายเชิงปริมาณเป็นWตอนนี้คุณอยู่พอดีกับโมเดลเชิงเส้นนี้แล้ว3X1=0,X2=0YW
E[Y]=β0+β1X1+β2X2+β3W.
คำถามที่ชัดเจนคือมันสำคัญไหมถ้าเราเปลี่ยนและ (เพราะฉันสุ่มเลือกพฤติกรรมการช็อปปิ้งเป็นตัวแปรตอบกลับ) คำตอบคือใช่ - ค่าประมาณของสัมประสิทธิ์การถดถอยจะเปลี่ยนไป แต่การทดสอบสำหรับ "การเชื่อมโยง" ระหว่างเงื่อนไขในกลุ่ม (นี่คือการทดสอบ t- แต่มันเหมือนกับการทดสอบความสัมพันธ์สำหรับตัวแปรตัวทำนายเดียว) จะไม่ เปลี่ยนแปลง เจาะจง,
WY
E[Y]=β0+β3W -- for third group,
E[Y]=(β0+β2)+β3W -- for second group,
E[Y]=(β0+β1)+β3W -- for first group,
นี้จะเทียบเท่ากับการมี 3 สายแยกจากกันไปขึ้นอยู่กับกลุ่มถ้าคุณวางแผน VS Wนี่เป็นวิธีที่ดีในการแสดงภาพสิ่งที่คุณกำลังทดสอบเพื่อให้เข้าใจได้ง่าย (โดยทั่วไปคือรูปแบบของ EDA และการตรวจสอบแบบจำลอง แต่คุณต้องแยกความแตกต่างระหว่างการสังเกตแบบกลุ่มอย่างเหมาะสม) เส้นขนานสามเส้นบ่งชี้ว่าไม่มีการโต้ตอบระหว่างสามกลุ่มกับและการปฏิสัมพันธ์จำนวนมากที่มีความหมายว่าเส้นเหล่านี้จะถูกตัดกัน
YWW
การทดสอบทำอย่างไรที่คุณถาม โดยทั่วไปเมื่อคุณพอดีกับโมเดลและมีค่าประมาณคุณจะต้องทดสอบความแตกต่าง โดยเฉพาะสำหรับการเปรียบเทียบของคุณ:
Group 2 vs Group 3: β2+β0−β0=0,
Group 1 vs Group 3: β1+β0−β0=0,
Group 2 vs Group 1: β2+β0−(β0+β1)=0.