เอฟเฟกต์แบบสุ่มสามารถใช้ได้กับตัวแปรเด็ดขาดเท่านั้นหรือไม่


9

คำถามนี้อาจฟังดูงี่เง่า แต่ ... ถูกต้องหรือไม่ว่าเอฟเฟกต์แบบสุ่มสามารถใช้กับตัวแปรเด็ดขาดเท่านั้น (เช่นรหัสบุคคล, รหัสประชากร, ... ) เช่นพูดxi เป็นตัวแปรเด็ดขาด:

yi ~ βxi

βxi ~ Norm(μ,δ2)

แต่จากหลักการแล้วเอฟเฟกต์แบบสุ่มไม่สามารถใช้กับตัวแปรต่อเนื่อง (เช่นความสูงมวล ... ) ได้zi:

yi ~ α+βzi

เพราะมีค่าสัมประสิทธิ์เดียวเท่านั้น βข้อใดไม่ถูก จำกัด ฟังดูมีเหตุผล แต่ฉันสงสัยว่าทำไมมันถึงไม่เคยถูกกล่าวถึงในวรรณคดีเชิงสถิติ! ขอบคุณ!

แก้ไข:แต่ถ้าฉัน จำกัดzi ชอบ zi ~ Norm(μ,δ2)? มันมีผลแบบสุ่มหรือไม่? แต่นี่แตกต่างจากข้อ จำกัด ที่ฉันใส่βxi- ที่นี่ฉัน จำกัดตัวแปรในขณะที่ในตัวอย่างก่อนหน้าฉัน จำกัดค่าสัมประสิทธิ์ ! มันเริ่มที่จะดูเป็นเรื่องใหญ่สำหรับฉัน ... อย่างไรก็ตามมันก็ไม่สมเหตุสมผลนักที่จะ จำกัด ข้อ จำกัด นี้เพราะzi เป็นค่าที่รู้จักกันดังนั้นความคิดนี้อาจแปลก :-)


1
คำถามที่เกี่ยวข้องที่น่าสนใจ: stats.stackexchange.com/q/61531/5509
อยากรู้อยากเห็น

คำตอบ:


5

นี่เป็นคำถามที่ดีและพื้นฐานมาก

การตีความเอฟเฟกต์แบบสุ่มนั้นขึ้นอยู่กับแต่ละโดเมนและขึ้นอยู่กับตัวเลือกการสร้างแบบจำลอง (แบบจำลองทางสถิติ สำหรับการอภิปรายที่ดีมากดูหน้า 245 Gelman และฮิลล์ (2007) สำหรับ Bayesian ทุกอย่างจะถูกสุ่ม (แม้ว่าพารามิเตอร์อาจมีค่าคงที่ที่แท้จริงพวกมันจะถูกจำลองเป็นแบบสุ่ม) และผู้ใช้บ่อยก็สามารถเลือกค่าพารามิเตอร์ให้เป็นค่าคงที่ซึ่งจะเป็นแบบจำลองแบบสุ่ม (ดูCasella 2008 , การอภิปรายเกี่ยวกับบล็อกที่จะได้รับการแก้ไขหรือสุ่มในตัวอย่าง 3.2)

แก้ไข (หลังจากความคิดเห็น)

ข้อมูลได้รับการแก้ไขหลังจากที่คุณสังเกตเห็น หากพวกเขาต่อเนื่องพวกเขาควรจะทำตัวเป็นแบบต่อเนื่อง คุณสามารถจำลองตัวแปรเด็ดขาดเป็นเด็ดขาดและบางครั้งก็ต่อเนื่อง (เช่นในการตั้งค่าตัวแปรลำดับ) พารามิเตอร์ไม่เป็นที่รู้จักและอาจถูกจำลองเป็นแบบคงที่หรือแบบสุ่ม พารามิเตอร์เกี่ยวข้องกับการตอบสนองของผู้ทำนายเป็นหลัก หากคุณต้องการความชันของตัวทำนาย (หรือค่าสัมประสิทธิ์ของมันในแบบจำลองเชิงเส้น) เพื่อให้แตกต่างกันสำหรับการตอบสนองแต่ละแบบจำลองแบบสุ่มหรือจำลองแบบคงที่ ในทำนองเดียวกันหากคุณต้องการให้การสกัดกั้นแตกต่างกันไปตามกลุ่มต่างๆพวกเขาควรจะทำตัวแบบสุ่ม มิฉะนั้นพวกเขาควรได้รับการแก้ไข


1
ขอบคุณสำหรับคำตอบของคุณ แต่ hmmm .... ฉันใส่คำถามง่าย ๆ และคาดหวังคำตอบง่ายๆหรือคำตอบทั่วไป :) ในย่อหน้าที่ 2 ของคุณคุณระบุว่าใน Bayesian ทุกอย่างเป็นการสุ่ม โปรดอย่าซับซ้อนมากเกินไป :) ฉันจงใจถามที่ระดับตัวแบบโปรดลืมเกี่ยวกับผู้ถี่บ่อยหรือ Bayesian - ฉันสนใจในหลักการ - สำหรับตัวแปรประเภทใดที่มีการใช้เอฟเฟกต์แบบสุ่ม?
อยากรู้อยากเห็น

ในย่อหน้าที่ 3 คุณใส่แอปพลิเคชันพิเศษด้วยอนุกรมเวลาฉันไม่แน่ใจว่าฉันเข้าใจ แต่ AFAIK อนุกรมเวลามักจะไม่ต่อเนื่อง (ไม่ต่อเนื่อง) ถ้าคุณพูดถึงความสัมพันธ์แบบอนุกรม ... อย่างไรก็ตามถ้าคุณมีทั่วไปมากกว่า คำตอบโปรดแบ่งปัน ขอขอบคุณอีกครั้งสำหรับคำตอบ!
อยากรู้อยากเห็น

การสุ่มอยู่ในสิ่งที่ไม่รู้จัก เมื่อคุณมีข้อสังเกตพวกเขาเป็นที่รู้จัก! สิ่งเดียวที่คุณรู้คือข้อมูลของคุณ สิ่งที่ไม่รู้จักคือพารามิเตอร์และพวกมันอาจถูกจำลองเป็นแบบสุ่มหรือแบบคงที่ (ขออภัยในความสับสนนั้นฉันยอมรับฉันไม่จำเป็นทำสิ่งที่ซับซ้อน.)
suncoolsu

ขอบคุณที่ทำให้คำตอบของคุณง่ายขึ้น ดังนั้นมาถึงรากเหง้าของคำถามของฉัน - หมายความว่าคำตอบคือใช่นั่นคือเอฟเฟ็กต์แบบสุ่มใช้เฉพาะกับตัวแปรเชิงหมวดหมู่เนื่องจากเอฟเฟกต์แบบสุ่มใช้กับพารามิเตอร์เท่านั้น (ไม่ใช่ข้อมูล) และพารามิเตอร์เดียวที่สามารถทำโมเดลได้ เป็นแบบสุ่มที่มีหลายระดับเช่นที่เป็นตัวแปรเด็ดขาด? และพารามิเตอร์ของตัวแปรต่อเนื่องไม่สามารถสร้างแบบจำลองแบบสุ่มได้เพราะมีเพียง 1 ค่าพารามิเตอร์สำหรับตัวแปรต่อเนื่อง ขอบคุณ!
อยากรู้อยากเห็น

ในการตั้งค่าเฉพาะของคุณคำตอบคือใช่ แต่โดยทั่วไปแล้วคำตอบฉันจะบอกว่าไม่ใช่เพราะตัวแปรต่อเนื่องอาจแตกต่างกันไปตามกลุ่ม ตัวอย่างเช่นรายได้ของผู้อยู่อาศัยในเมืองควรสูงกว่าหมู่บ้าน (ตามที่คุณอาจเป็นตัวแปรเด็ดขาดสองอย่างสำหรับที่ตั้ง)
suncoolsu

3

คำถามของคุณอาจได้รับการแก้ไขแล้ว แต่จริง ๆ แล้วเขียนไว้ในหนังสือเรียน

เอฟเฟกต์แบบสุ่มเป็นตัวแปรเด็ดขาดซึ่งระดับนั้นถูกมองว่าเป็นตัวอย่างจากประชากรที่มีขนาดใหญ่กว่าซึ่งตรงกันข้ามกับเอฟเฟกต์คงที่ซึ่งระดับนั้นน่าสนใจในสิทธิของตนเอง

ในหน้า 232 ของ: Alan Grafen และ Rosie Hails (2002) "สถิติสมัยใหม่สำหรับวิทยาศาสตร์เพื่อชีวิต", สำนักพิมพ์มหาวิทยาลัยออกซฟอร์ด


2
ทั้งหมดนี้เป็นจริง แต่ฉันไม่คิดว่านี่จะตอบคำถาม
Patrick Coulombe

1
ฉันไม่เห็นด้วยกับความคิดเห็นข้างต้นโดย @PatrickCoulombe ฉันคิดว่านี่ตอบคำถามได้อย่างแม่นยำ +1
อะมีบา

1

ฉันคิดว่าปัญหาคือมีสองสิ่งที่เกี่ยวข้องที่นี่ ตัวอย่างทั่วไปของการสุ่มเอฟเฟกต์อาจเป็นการคาดคะเนเกรดเฉลี่ย (GPA) ของนักศึกษาวิทยาลัยจากปัจจัยหลายประการรวมถึงคะแนนเฉลี่ยของพวกเขาในชุดการทดสอบในช่วงมัธยม

คะแนนเฉลี่ยอยู่อย่างต่อเนื่อง โดยทั่วไปคุณจะมีการสกัดกั้นที่แตกต่างกันหรือการสกัดกั้นและความลาดชันสำหรับคะแนนเฉลี่ยสำหรับแต่ละบุคคล บุคคลที่จะเห็นได้ชัดเด็ดขาด

ดังนั้นเมื่อคุณพูดว่า "ใช้เฉพาะกับตัวแปรเชิงหมวดหมู่" ก็จะคลุมเครือเล็กน้อย สมมติว่าคุณพิจารณาเฉพาะการสกัดกั้นแบบสุ่มสำหรับคะแนนเฉลี่ย ในกรณีนี้การสกัดกั้นแบบสุ่มของคุณสำหรับปริมาณที่ต่อเนื่องและในความเป็นจริงอาจเป็นแบบจำลองเช่นตัวแปร gaussian ที่มีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานที่กำหนดโดยกระบวนการ แต่การสกัดกั้นแบบสุ่มนี้ถูกพิจารณาจากประชากรของนักเรียนโดยที่นักเรียนแต่ละคนจะถูกระบุด้วยตัวแปรหมวดหมู่

คุณสามารถใช้ตัวแปร "ต่อเนื่อง" แทนรหัสนักศึกษา บางทีคุณสามารถเลือกความสูงของนักเรียนได้ แต่มันจะต้องได้รับการปฏิบัติราวกับว่ามันเป็นหมวดหมู่ หากการวัดความสูงของคุณแม่นยำมากคุณจะต้องจบด้วยความสูงที่ไม่เหมือนใครสำหรับนักเรียนทุกคนดังนั้นจะไม่มีอะไรแตกต่างกัน หากการวัดความสูงของคุณไม่แม่นยำมากคุณจะต้องพบกับนักเรียนหลายคนรวมกันในแต่ละระดับความสูง (การผสมคะแนนของพวกเขาในรูปแบบที่ไม่ชัดเจน)

นี่เป็นสิ่งที่ตรงกันข้ามกับการโต้ตอบ ในการโต้ตอบคุณจะคูณสองตัวแปรและถือว่าทั้งสองอย่างต่อเนื่อง ตัวแปรหมวดหมู่จะถูกแบ่งออกเป็นชุดตัวแปรดัมมี่ 0/1 และตัวแปร 0 หรือ 1 จะคูณด้วยตัวแปรอื่นในการโต้ตอบ

บรรทัดล่างคือว่า "เอฟเฟ็กต์แบบสุ่ม" ในแง่หนึ่งก็คือค่าสัมประสิทธิ์ซึ่งมีการแจกแจง (เป็นแบบจำลอง) มากกว่าค่าคงที่


โปรดเข้าสู่ระบบภายใต้บัญชีหลักของคุณเพื่อให้สามารถแก้ไขได้
อะมีบา
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.