ภาวะแทรกซ้อนของการมีตัวอย่างขนาดเล็กมากในตัวแบบสมการโครงสร้าง


13

ฉันกำลังใช้โมเดลสมการโครงสร้าง (SEM) ใน Amos 18 ฉันกำลังมองหาผู้เข้าร่วม 100 คนสำหรับการทดสอบของฉัน (ใช้แบบหลวม ๆ ) ซึ่งถือว่าไม่น่าจะเพียงพอที่จะจัดการ SEM ที่ประสบความสำเร็จ ฉันได้รับการบอกซ้ำ ๆ ว่า SEM (พร้อมด้วย EFA, CFA) เป็นกระบวนการทางสถิติ "ตัวอย่างขนาดใหญ่" เรื่องสั้นสั้นฉันไม่ได้ทำให้ผู้เข้าร่วม 100 คน (น่าแปลกใจ!) และมีเพียง 42 หลังจากไม่รวมจุดข้อมูลที่มีปัญหาสองจุด ฉันก็ลองแบบจำลองต่อไปและด้วยความประหลาดใจของฉันมันก็ดูเหมือนจะเข้ากันได้ดีมาก! CFI> .95, RMSEA <.09, SRMR <.08

ตัวแบบไม่ง่ายจริง ๆ แล้วฉันจะบอกว่ามันค่อนข้างซับซ้อน ฉันมีตัวแปรแฝงอยู่สองตัวตัวหนึ่งมีสองตัวแปรที่สังเกตได้และอีก 5 ตัวแปรที่สังเกตได้ ฉันมีตัวแปรที่สังเกตเพิ่มเติมอีกสี่ตัวในโมเดล มีความสัมพันธ์มากมายระหว่างตัวแปรทางอ้อมและทางตรงโดยมีตัวแปรบางตัวที่อยู่ภายนอกถึงสี่คนเป็นตัวอย่าง

ฉันค่อนข้างใหม่สำหรับ SEM; อย่างไรก็ตามบุคคลสองคนที่ฉันรู้ว่าคุ้นเคยกับ SEM บอกฉันว่าตราบใดที่การบ่งบอกความเหมาะสมนั้นดีผลกระทบนั้นสามารถตีความได้ (ตราบใดที่พวกเขามีความสำคัญ) และไม่มีอะไรผิดปกติกับโมเดล ฉันรู้ว่าตัวบ่งชี้ที่พอดีบางตัวมีอคติสำหรับหรือเปรียบเทียบกับกลุ่มตัวอย่างขนาดเล็กในแง่ของการแนะนำแบบที่ดี แต่ทั้งสามที่ฉันกล่าวถึงก่อนหน้านี้ดูดีและฉันเชื่อว่าไม่ลำเอียงในทำนองเดียวกัน เพื่อทดสอบผลกระทบทางอ้อมฉันใช้ bootstrapping (ตัวอย่าง 2000 ตัวอย่างหรือมากกว่านั้น) ความเชื่อมั่นที่ถูกต้อง 90 เปอร์เซ็นต์ถูกแก้ไข monte carlo หมายเหตุเพิ่มเติมคือฉันใช้ SEM ที่แตกต่างกันสามตัวสำหรับเงื่อนไขที่แตกต่างกันสามแบบ

ฉันมีสองคำถามที่ฉันต้องการให้คุณพิจารณาและโปรดตอบกลับหากคุณมีบางอย่างที่จะช่วย:

  1. มีจุดอ่อนที่สำคัญสำหรับโมเดลของฉันที่ไม่ได้แสดงโดยดัชนีพอดีหรือไม่? ตัวอย่างขนาดเล็กจะได้รับการเน้นเป็นจุดอ่อนของการศึกษา แต่ฉันถูกทิ้งให้สงสัยว่ามีปัญหาทางสถิติขนาดใหญ่ที่ฉันลืมไปโดยสิ้นเชิง ฉันวางแผนที่จะรับผู้เข้าร่วมอีก 10-20 คนในอนาคต แต่สิ่งนี้จะทำให้ฉันมีตัวอย่างที่ค่อนข้างเล็กสำหรับการวิเคราะห์เช่นนี้

  2. มีปัญหาใด ๆ กับการใช้ bootstrapping ของฉันหรือไม่กับบริบทที่ฉันใช้

ฉันหวังว่าคำถามเหล่านี้จะไม่ "ธรรมดา" สำหรับฟอรัมนี้ ฉันได้อ่านบทต่างๆเกี่ยวกับ SEM และเรื่องที่เกี่ยวข้องแล้ว แต่ฉันพบว่าผู้คนกระจัดกระจายมากในแง่ของความคิดเห็นในเรื่องนี้!

ไชโย


1
@Behacad - ปัญหาที่อธิบายอย่างดี คุณกำลังประเมินค่าพารามิเตอร์จำนวนมากโดยใช้ข้อมูลที่กระจัดกระจายมาก ดังนั้นการอนุมานจะสั่นคลอนอย่างสุดขีด แต่ฉันต้องการถอยกลับและถามคุณใช้ 42 สิ่งเหล่านี้เพื่ออนุมานความสัมพันธ์ระหว่างประชากรที่มีขนาดใหญ่ขึ้นหรือไม่ ถ้าเป็นเช่นนั้น 42 ตัวอย่างสุ่มหรืออย่างน้อยหนึ่งตัวแทนที่พิสูจน์ได้หรือไม่
rolando2

ขอบคุณสำหรับความคิดเห็นของคุณ rolando2! กลุ่มตัวอย่างประกอบด้วยนักศึกษามหาวิทยาลัย 42 คนและฉันกำลังดูความสัมพันธ์ระหว่างปัจจัยหลายอย่างกับความวิตกกังวล ความสัมพันธ์ที่ฉันกำลังมองหาเพื่ออนุมานจะอยู่ในหมู่ประชากรทั่วไป การอนุมานของฉันมี จำกัด เนื่องจากผู้เข้าร่วมเป็นนักเรียนที่ค่อนข้างเล็ก แต่ฉันไม่ได้มองหาประชากรที่เฉพาะเจาะจง (เช่นบุคคลที่ทุกข์ทรมานจากโรควิตกกังวล) ฉันสนใจที่จะระบุอย่างกว้างขวางว่า X มีความสัมพันธ์ทางอ้อมกับ Y ในตัวอย่างที่ไม่ใช่คลินิก นั่นตอบคำถามของคุณหรือไม่
Behacad

1
@Behacad - สมมติว่าคุณสามารถปกป้องนักวิจารณ์ที่มีศักยภาพของคุณเกี่ยวกับการเป็นตัวแทนของตัวอย่างของคุณฉันจะบอกได้อย่างแจ่มแจ้งว่าการพยายามประเมินความสัมพันธ์ระหว่างตัวแปรทั้ง 12 ตัวนั้นกำลังถามถึง 42 กรณีของคุณมากเกินไป ดูว่าคุณสามารถทำให้แบบจำลองของคุณง่ายขึ้นเพื่อรวมตัวทำนายที่น่าสนใจเพียง 3 ข้อหรือไม่ แม้ว่าฉันจะรู้ว่ามันเจ็บปวดที่จะแยกส่วนกับข้อมูลที่คุณอาจทำงานหนักเพื่อรวบรวม!
rolando2

ขอบคุณสำหรับการตอบกลับ. ฉันมี "ความรู้สึก" ที่ประเมินความสัมพันธ์ระหว่างตัวแปรเหล่านี้ยากที่จะทำกับ 42 จุดข้อมูลและฉันเห็นว่าคุณมาจากไหน ที่ถูกกล่าวว่าเหตุผลทางสถิติ (อ้างถึงโดยเฉพาะอย่างยิ่ง) สำหรับปัญหานี้จะเป็นอย่างไร สิ่งนี้แตกต่างจากการรันจำนวนการถดถอย / สหสัมพันธ์บนตัวแปรตามที่ต่างกันอย่างไร ความพอดีเป็นสิ่งที่ดี (และจริง ๆ แล้วฉันกำลังใช้แบบจำลองสามแบบสำหรับงานทดลองที่แตกต่างกัน) และผลลัพธ์นั้นสอดคล้องกันในแบบจำลองและสอดคล้องกับทฤษฎี ขออภัยถ้าฉันออกมาป้องกัน!
Behacad

(ไม่ใช่การป้องกัน - ไม่ต้องกังวล!) การมี 42 รายทำให้คุณได้รับการสุ่มตัวอย่างข้อผิดพลาดอย่างน้อยที่สุดแม้ในขณะที่ประมาณสถิติที่ไม่เปลี่ยนแปลง ทีนี้ใน SEM ตัวแปรแต่ละตัวถูกนำมาใช้หลายครั้งเพราะคุณประเมินความสัมพันธ์ของ A ถึง B ในขณะที่ควบคุมสำหรับ C, D ฯลฯ ดังนั้นผลกระทบของข้อผิดพลาดในการสุ่มตัวอย่างจะถูกเผยแพร่ซึ่งความเข้าใจของฉันคือสาเหตุ หนึ่งมักต้องการตัวอย่างขนาดใหญ่ ในกรณีของคุณคุณอาจมีข้อผิดพลาดมากกว่าการสุ่มตัวอย่างเนื่องจากคุณไม่มีตัวอย่างแบบสุ่ม ดังนั้นคุณต้องวาดช่วงเวลาที่น่าเชื่อถือที่มีขนาดใหญ่มากรอบผลลัพธ์ที่คุณได้รับ
rolando2

คำตอบ:


4

จุดหนึ่ง: ไม่มีสิ่งเช่น "คำถามพื้นฐาน" คุณจะรู้ว่าคุณรู้อะไรและไม่ใช่สิ่งที่คุณไม่รู้ การถามคำถามมักเป็นวิธีเดียวที่จะค้นหา

เมื่อใดก็ตามที่คุณเห็นตัวอย่างเล็ก ๆ คุณจะพบว่าใครมี "ศรัทธา" ในแบบจำลองของพวกเขาและใครเป็นคนทำ ฉันพูดแบบนี้เพราะกลุ่มตัวอย่างขนาดเล็กมักเป็นรุ่นที่มีผลกระทบมากที่สุด

เป็นคนที่กระตือรือร้น (psycho?) ผู้ดูแลตัวเองฉันพูดไปเลย! คุณดูเหมือนจะใช้วิธีการที่ระมัดระวังและคุณยอมรับอคติที่อาจเกิดขึ้น ฯลฯ เนื่องจากกลุ่มตัวอย่างขนาดเล็ก สิ่งหนึ่งที่ต้องคำนึงถึงด้วยโมเดลที่เหมาะสมกับข้อมูลขนาดเล็กคือคุณมีตัวแปร 12 ตัว ตอนนี้คุณควรคิดว่าตัวแบบใดที่มีตัวแปร 12 ตัวจะถูกกำหนดโดยการสังเกต 42 แบบได้ดีแค่ไหน? หากคุณมีตัวแปร 42 ตัวจากนั้นแบบจำลองใด ๆ ก็สามารถเข้ากับการสังเกต 42 อย่าง (พูดอย่างหลวม ๆ ) ดังนั้นกรณีของคุณอยู่ไม่ไกลจากความยืดหยุ่นมากเกินไป จะเกิดอะไรขึ้นเมื่อแบบจำลองของคุณยืดหยุ่นเกินไป มันมีแนวโน้มที่จะพอดีกับเสียง - นั่นคือความสัมพันธ์ที่ถูกกำหนดโดยสิ่งอื่นที่ไม่ใช่สิ่งที่คุณตั้งสมมติฐาน

นอกจากนี้คุณยังมีโอกาสที่จะวางอัตตาของคุณในแบบจำลองของคุณโดยทำนายว่าตัวอย่าง 10-20 ในอนาคตเหล่านั้นจะมาจากแบบจำลองของคุณ ฉันสงสัยว่านักวิจารณ์ของคุณจะตอบสนองต่อแบบจำลองที่เรียกว่า "หลบ" ซึ่งให้คำทำนายที่ถูกต้องอย่างไร โปรดทราบว่าคุณจะได้รับ "ฉันบอกคุณแล้ว" ที่คล้ายกันหากโมเดลของคุณไม่สามารถทำนายข้อมูลได้ดี

อีกวิธีหนึ่งที่คุณสามารถมั่นใจได้ว่าผลลัพธ์ของคุณน่าเชื่อถือคือการพยายามทำลายพวกเขา รักษาข้อมูลดั้งเดิมของคุณให้คงอยู่สร้างชุดข้อมูลใหม่และดูสิ่งที่คุณต้องทำกับชุดข้อมูลใหม่นี้เพื่อให้ผลลัพธ์ SEM ของคุณดูไร้สาระ จากนั้นดูสิ่งที่คุณต้องทำและพิจารณา: นี่เป็นสถานการณ์ที่สมเหตุสมผลหรือไม่ ข้อมูล "ไร้สาระ" ของฉันมีลักษณะเป็นไปได้จริงหรือไม่ หากคุณต้องนำข้อมูลของคุณไปยังดินแดนไร้สาระเพื่อให้ได้ผลลัพธ์ที่ไร้สาระก็ให้ความมั่นใจ (ฮิวริสติกไม่ใช่เป็นทางการ) ว่าวิธีการของคุณนั้นดี


1

ปัญหาหลักที่ฉันเห็นคือขาดพลังงาน ปัจจัยการยืนยันและการทดสอบ SEM ดูเพื่อยอมรับค่าว่าง - คุณต้องการดูค่า p ที่ไม่สำคัญ - ดังนั้นการขาดพลังงานอาจเป็นปัญหาได้ พลังของการทดสอบขึ้นอยู่กับขนาดตัวอย่าง (42) และองศาอิสระ AMOS ให้ระดับความอิสระแก่คุณ คุณยังไม่ได้อ้างถึง แต่จะไม่ใหญ่ในกรณีนี้ ด้วย 12 ตัวแปรคุณเริ่มต้นด้วย 66 DF และลบ 1 สำหรับแต่ละพารามิเตอร์ที่คุณประเมิน ฉันไม่รู้ว่าจะเป็นจำนวนเท่าใด แต่คุณบอกว่าคุณมีปัจจัยหลายอย่างและความสัมพันธ์ระหว่างโครงสร้างต่าง ๆ

ฉันไม่เห็นด้วยทั้งหมดกับ Rolando2 ใน SEM คุณจะได้รับโดยมีตัวแปรมากมายโดยสมมติว่าเป็นตัวบ่งชี้ที่เชื่อถือได้ของโครงสร้างพื้นฐาน ดังนั้นอย่าลดจำนวนของตัวแปร ด้วยเหตุผลเดียวกันฉันไม่เห็นด้วยกับ @probabilityislogic ใน SEM คุณไม่ได้พยายามจำลองตัวแปร 12 ตัวด้วยการสังเกต 42 แบบ คุณกำลังพยายามสร้างแบบจำลองโครงสร้างผ่านตัวบ่งชี้ 12 ตัวเพิ่มความแข็งแกร่งโดย 42 ซ้ำ แบบจำลองปัจจัยง่ายมาก - 1 ปัจจัยพร้อมด้วย 12 ตัวบ่งชี้ - อาจทดสอบกับ 42 คน

RMSEA และความดีอื่น ๆ ของการวัดแบบพอดีจะมีแนวโน้มที่จะดีขึ้นเมื่อคุณใกล้ถึงความอิ่มตัวของโมเดลดังนั้นคุณจะเสี่ยงต่อการเกิดความเข้าใจผิด

ที่ถูกกล่าวว่าฉันได้เห็นชุดข้อมูลขนาดเล็กปฏิเสธแบบจำลองปัจจัย อาจหมายถึงสิ่งที่พอดีดูเหมือนจะดี

หมายเหตุ: คุณสามารถตรวจสอบส่วนที่เหลือของรุ่น SEM นี่คือความแตกต่างระหว่างเมทริกซ์ความแปรปรวนร่วมประมาณและเมทริกซ์ความแปรปรวนร่วมแบบจำลอง AMOS จะมอบให้คุณหากคุณร้องขอ การตรวจสอบของเหลืออาจบ่งบอกว่าพวกเขาจะกระจายอย่างเท่าเทียมกันหรือถ้าความแปรปรวนร่วมบางอย่างจะติดตั้งไม่ดีมาก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.