1ตัวอย่างที่มีชื่อเสียงในด้านจิตวิทยาและภาษาศาสตร์อธิบายโดย Herb Clark (1973; ตามโคลแมน, 1964): "การเข้าใจผิดของภาษาเป็นผลคงที่: บทวิจารณ์ของสถิติภาษาในการวิจัยทางจิตวิทยา"
คลาร์กเป็นนักจิตวิทยาที่พูดคุยเกี่ยวกับการทดลองทางจิตวิทยาซึ่งกลุ่มตัวอย่างของงานวิจัยให้คำตอบกับชุดของวัสดุกระตุ้นซึ่งโดยทั่วไปมักใช้คำต่าง ๆ ที่ดึงมาจากคลังข้อมูลบางส่วน เขาชี้ให้เห็นว่ากระบวนการทางสถิติมาตรฐานที่ใช้ในกรณีเหล่านี้ขึ้นอยู่กับมาตรการ ANOVA ซ้ำและเรียกโดยคลาร์กเป็นถือว่าผู้เข้าร่วมเป็นปัจจัยสุ่ม แต่ (อาจจะโดยปริยาย) ถือว่าวัสดุกระตุ้นเศรษฐกิจ คงที่ สิ่งนี้นำไปสู่ปัญหาในการตีความผลลัพธ์ของการทดสอบสมมติฐานเกี่ยวกับปัจจัยเงื่อนไขการทดลอง: โดยธรรมชาติแล้วเราต้องการสมมติว่าผลลัพธ์ในเชิงบวกบอกเราบางอย่างเกี่ยวกับประชากรทั้งสองที่เราดึงตัวอย่างผู้เข้าร่วมของเรา วัสดุภาษา แต่ฉF1โดยผู้เข้าร่วมการรักษาเป็นแบบสุ่มและสิ่งเร้าคงเป็นเพียงบอกเราเกี่ยวกับผลกระทบของปัจจัยสภาพข้ามคนอื่น ๆ ที่คล้ายกันการตอบสนองต่อสิ่งเร้าเดียวกันแน่นอน การดำเนินการวิเคราะห์ F 1เมื่อผู้เข้าร่วมและสิ่งเร้าถูกมองอย่างเหมาะสมมากขึ้นเนื่องจากการสุ่มสามารถนำไปสู่อัตราความผิดพลาด Type 1 ที่สูงกว่าระดับ αเล็กน้อยซึ่งมักจะเป็น. 05 - โดยขึ้นอยู่กับปัจจัยเช่นจำนวนและความแปรปรวนของ สิ่งเร้าและการออกแบบการทดลอง ในกรณีนี้การวิเคราะห์ความเหมาะสมมากขึ้นอย่างน้อยภายใต้กรอบการวิเคราะห์ความแปรปรวนคลาสสิกคือการใช้สิ่งที่เรียกว่ากึ่ง Fสถิติขึ้นอยู่กับอัตราส่วนของสี่เหลี่ยมหมายถึงF1F1αFผลรวมเชิงเส้นของ
กระดาษของคลาร์กสาดในภาษาศาสตร์จิตวิทยาในเวลานั้น แต่ล้มเหลวในการสร้างบุ๋มใหญ่ในวรรณคดีจิตวิทยาที่กว้างขึ้น (และแม้กระทั่งภายในจิตวิทยาภาษาศาสตร์คำแนะนำของคลาร์กก็ค่อนข้างบิดเบี้ยวในช่วงหลายปีที่ผ่านมาโดย Raaijmakers, Schrijnemakers, & Gremmen, 1999) แต่ในช่วงไม่กี่ปีที่ผ่านมาปัญหาดังกล่าวได้เห็นการฟื้นฟู ในโมเดลเอฟเฟ็กต์แบบผสมซึ่ง ANOVA รุ่นผสมแบบคลาสสิกสามารถมองได้ว่าเป็นกรณีพิเศษ เอกสารล่าสุดบางส่วน ได้แก่ Baayen, Davidson, & Bates (2008), Murayama, Sakaki, Yan, & Smith (2014) และ ( ahem ) Judd, Westfall, & Kenny (2012) ฉันแน่ใจว่ามีบางอย่างที่ฉันลืม
2.ไม่แน่นอน มีอยู่ . วิธีการรับอย่างไม่ว่าจะเป็นปัจจัยที่จะรวมอยู่ที่ดีขึ้นเป็นผลสุ่มหรือไม่ได้อยู่ในรูปแบบที่ทุกคน (ดูเช่น Pinheiro & เบตส์, 2000, pp ได้ 83-87;แต่ดู Barr, ประกาศ Scheepers และ Tily, 2013) และแน่นอนว่ามีเทคนิคการเปรียบเทียบแบบจำลองแบบคลาสสิกสำหรับการพิจารณาว่าปัจจัยใดที่รวมอยู่ในผลกระทบคงที่ดีกว่าหรือไม่เลย (เช่นการทดสอบ ) แต่ฉันคิดว่าการพิจารณาว่าปัจจัยใดที่ถือว่าดีกว่าว่าเป็นแบบคงที่หรือแบบสุ่มโดยทั่วไปแล้วจะเหลือคำถามที่ดีที่สุดเป็นคำถามทางความคิดที่จะตอบโดยพิจารณาจากการออกแบบการศึกษาและลักษณะของข้อสรุปที่ดึงออกมาF
Gary McClelland ผู้สอนสถิติระดับบัณฑิตศึกษาคนหนึ่งของฉันชอบบอกว่าบางทีคำถามพื้นฐานของการอนุมานเชิงสถิติคือ: "เปรียบเทียบกับอะไร" ต่อไปนี้ Gary ฉันคิดว่าเราสามารถวางกรอบคำถามเชิงแนวคิดที่ฉันกล่าวไว้ข้างต้นว่า: อะไรคือคลาสอ้างอิงของผลการทดลองเชิงสมมุติฐานที่ฉันต้องการเปรียบเทียบผลลัพธ์ที่สังเกตจริงของฉันกับอะไร อยู่ในบริบทของภาษาศาสตร์จิตวิทยาและพิจารณาการออกแบบการทดลองที่เรามีตัวอย่างของวิชาที่ตอบสนองต่อตัวอย่างของคำที่ถูกจัดประเภทในหนึ่งในสองเงื่อนไข (การออกแบบเฉพาะที่กล่าวถึงความยาวโดยคลาร์ก, 1973) ฉันจะเน้น สองความเป็นไปได้:
- ชุดการทดลองที่แต่ละการทดลองเราวาดตัวอย่างวิชาใหม่ตัวอย่างคำศัพท์ใหม่และตัวอย่างข้อผิดพลาดใหม่จากแบบจำลองเชิงกำเนิด ภายใต้รุ่นนี้หัวเรื่องและคำต่าง ๆ เป็นทั้งเอฟเฟกต์แบบสุ่ม
- ชุดการทดลองที่เราจะวาดตัวอย่างวิชาใหม่และตัวอย่างข้อผิดพลาดใหม่สำหรับการทดสอบแต่ละครั้ง แต่เรามักจะใช้ชุดคำเดิมเสมอ ภายใต้โมเดลนี้หัวเรื่องเป็นเอฟเฟ็กต์แบบสุ่ม แต่ Words เป็นเอฟเฟกต์คงที่
เพื่อให้เป็นรูปธรรมโดยสิ้นเชิงด้านล่างนี้มีแผนการบางส่วนจาก (ด้านบน) 4 ชุดของผลลัพธ์เชิงสมมุติจาก 4 การจำลองการทดลองภายใต้แบบจำลอง 1; (ด้านล่าง) ผลลัพธ์สมมุติฐาน 4 ชุดจากการทดลองจำลอง 4 ครั้งภายใต้แบบจำลอง 2 การทดลองแต่ละครั้งจะดูผลลัพธ์ในสองวิธี: (แผงด้านซ้าย) จัดกลุ่มตามหัวเรื่องโดย Subject-by-Condition หมายถึงพล็อตและเชื่อมโยงเข้าด้วยกัน (พาเนลด้านขวา) จัดกลุ่มตามคำโดยมีพล็อตสรุปการกระจายการตอบสนองสำหรับแต่ละ Word การทดลองทั้งหมดเกี่ยวข้องกับ 10 คนที่ตอบสนองต่อคำ 10 คำและในการทดลองทั้งหมด "สมมติฐานว่างเปล่า" ที่ไม่มีความแตกต่างของเงื่อนไขนั้นเป็นจริงในประชากรที่เกี่ยวข้อง
ผู้เข้าร่วมการทดลองและกลุ่มคำทั้งสองแบบสุ่ม: 4 การทดลองจำลอง
โปรดสังเกตที่นี่ว่าในการทดสอบแต่ละครั้งโปรไฟล์การตอบสนองสำหรับหัวเรื่องและคำต่างกันโดยสิ้นเชิง สำหรับหัวข้อเราบางครั้งผู้ตอบแบบสอบถามโดยรวมต่ำบางครั้งผู้ตอบสูงบางครั้งหัวเรื่องที่แสดงความแตกต่างของเงื่อนไขจำนวนมากและบางครั้งหัวเรื่องที่แสดงความแตกต่างของเงื่อนไขเล็กน้อย ในทำนองเดียวกันสำหรับคำบางครั้งเราได้รับคำที่มีแนวโน้มที่จะกระตุ้นการตอบสนองต่ำและบางครั้งได้รับคำที่มีแนวโน้มที่จะกระตุ้นการตอบสนองสูง
หัวเรื่องสุ่ม, คำที่แก้ไข: 4 การทดลองจำลอง
โปรดสังเกตที่นี่ว่าในการทดลองทั้ง 4 แบบจำลองหัวเรื่องจะแตกต่างกันทุกครั้ง แต่โปรไฟล์การตอบสนองของคำจะมีลักษณะเหมือนกันโดยสอดคล้องกับสมมติฐานที่ว่าเรากำลังนำชุดคำศัพท์เดิมมาใช้สำหรับการทดลองทุกครั้งภายใต้โมเดลนี้
ตัวเลือกของเราไม่ว่าเราจะคิดว่าแบบจำลอง 1 (หัวเรื่องและคำทั้งแบบสุ่ม) หรือแบบจำลอง 2 (แบบสุ่มเรื่อง, คำที่แก้ไข) ให้ชั้นอ้างอิงที่เหมาะสมสำหรับผลการทดลองที่เราสังเกตเห็นจริง ๆ แล้วสามารถสร้างความแตกต่างอย่างมาก "ทำงาน." เราคาดหวังความผันแปรของโอกาสในข้อมูลภายใต้โมเดล 1 มากกว่าภายใต้โมเดล 2 เนื่องจากมี "ชิ้นส่วนเคลื่อนไหว" ดังนั้นหากข้อสรุปที่เราต้องการวาดมีความสอดคล้องกับสมมติฐานของโมเดล 1 มากขึ้นซึ่งความแปรปรวนของโอกาสจะค่อนข้างสูงกว่า แต่เราวิเคราะห์ข้อมูลของเราภายใต้สมมติฐานของโมเดล 2 ซึ่งความแปรปรวนของโอกาสต่ำกว่าดังนั้นข้อผิดพลาดประเภท 1 ของเรา อัตราสำหรับการทดสอบความแตกต่างของเงื่อนไขจะสูงขึ้นถึงระดับ (อาจค่อนข้างใหญ่) สำหรับข้อมูลเพิ่มเติมดูการอ้างอิงด้านล่าง
อ้างอิง
Baayen, RH, Davidson, DJ, & Bates, DM (2008) การสร้างแบบผสมเอฟเฟ็กต์พร้อมเอฟเฟกต์แบบข้ามสำหรับวัตถุและรายการ วารสารของหน่วยความจำและภาษา, 59 (4), 390-412 รูปแบบไฟล์ PDF
Barr, DJ, Levy, R. , Scheepers, C. , & Tily, HJ (2013) โครงสร้างเอฟเฟ็กต์แบบสุ่มสำหรับการทดสอบสมมติฐานยืนยัน: เก็บได้สูงสุด วารสารหน่วยความจำและภาษา, 68 (3), 255-278 รูปแบบไฟล์ PDF
คลาร์ก HH (2516) การเข้าใจผิดของภาษาเป็นผลคงที่: บทวิจารณ์ของสถิติภาษาในการวิจัยทางจิตวิทยา วารสารการเรียนรู้ด้วยวาจาและพฤติกรรมทางวาจา, 12 (4), 335-359 รูปแบบไฟล์ PDF
Coleman, EB (1964) การสรุปประชากรกลุ่มภาษา รายงานทางจิตวิทยา, 14 (1), 219-226
Judd, CM, Westfall, J. , & Kenny, DA (2012) การรักษาสิ่งเร้าเป็นปัจจัยสุ่มในจิตวิทยาสังคม: วิธีการใหม่และครอบคลุมในการแก้ปัญหาที่แพร่หลาย แต่ไม่สนใจส่วนใหญ่ วารสารบุคลิกภาพและจิตวิทยาสังคม 103 (1) หน้า 54 PDF
Murayama, K. , Sakaki, M. , Yan, VX, & Smith, GM (2014) อัตราความผิดพลาด Type I ในการวิเคราะห์แบบดั้งเดิมโดยผู้เข้าร่วมเพื่อความแม่นยำของ Metamemory: มุมมองตัวแบบผลผสมแบบทั่วไป วารสารจิตวิทยาการทดลอง: การเรียนรู้ความจำและความรู้ความเข้าใจ รูปแบบไฟล์ PDF
Pinheiro, JC, & Bates, DM (2000) โมเดลผสมเอฟเฟกต์ใน S และ S-PLUS สปริงเกอร์
Raaijmakers, JG, Schrijnemakers, J. , & Gremmen, F. (1999) วิธีจัดการกับ“ การเข้าใจผิดแบบผลกระทบต่อภาษา”: ความเข้าใจผิดที่พบบ่อยและการแก้ปัญหาทางเลือก วารสารหน่วยความจำและภาษา, 41 (3), 416-426 รูปแบบไฟล์ PDF