ความขัดแย้งของข้อมูล iid (อย่างน้อยสำหรับฉัน)


24

เท่าที่รวมของฉัน (และหายาก) ความรู้เกี่ยวกับใบอนุญาตสถิติผมเข้าใจว่าถ้าX1,X2,...,Xnเป็นตัวแปรสุ่มของ iid จากนั้นเมื่อคำเหล่านี้แสดงถึงความเป็นอิสระและการกระจายตัวที่เหมือนกัน

ความกังวลของฉันที่นี่เป็นทรัพย์สินเดิมของตัวอย่าง iid ซึ่งอ่าน:

พี(Xn|Xผม1,Xผม2,...,Xผมk)=พี(Xn),

สำหรับคอลเลกชันใด ๆ ที่แตกต่างกัน 's เซนต์<nij1ij<n

อย่างไรก็ตามมีใครรู้ว่าการรวมกลุ่มตัวอย่างอิสระของการแจกแจงแบบเดียวกันให้ข้อมูลเกี่ยวกับโครงสร้างการกระจายและเป็นผลเกี่ยวกับในกรณีข้างต้นดังนั้นจึงไม่ควรเป็นกรณีที่: Xn

p(Xn|Xi1,Xi2,...,Xik)=p(Xn).

ฉันรู้ว่าฉันตกเป็นเหยื่อของการเข้าใจผิด แต่ฉันไม่รู้ว่าทำไม โปรดช่วยฉันออกจากนี้


คุณรู้กฎของเบย์หรือไม่? ได้ยินคลาสสิก เทียบกับสถิติแบบเบย์? ไพรเออร์?
Matthew Gunn

1
ฉันไม่ปฏิบัติตามข้อโต้แย้งในตอนท้ายของคำถามของคุณ คุณชัดเจนกว่านี้ได้ไหม
Glen_b -Reinstate Monica

@Glen_b อะไรที่คุณไม่ได้ติดตามอย่างแน่นอน คุณหมายถึงอะไรในตอนท้ายของมัน? ฉันกำลังพยายามพูดด้วย logics ที่แตกต่างกันทั้งความเท่าเทียมและความไม่เท่าเทียมดูเหมือนจะเป็นไปได้ซึ่งเป็นความขัดแย้ง
Cupitor

ที่นี่ไม่มีความขัดแย้ง - เป็นเพียงความล้มเหลวในการใช้คำจำกัดความที่เหมาะสม คุณไม่สามารถเรียกร้องให้มีความขัดแย้งเมื่อคุณเพิกเฉยต่อความหมายของคำที่คุณใช้! ในตัวอย่างนี้การเปรียบเทียบคำจำกัดความที่เป็นอิสระกับความน่าจะเป็นจะเปิดเผยข้อผิดพลาด
whuber

@whuber ฉันคิดว่าคุณสังเกตเห็นชัดเจน "(อย่างน้อยสำหรับฉัน)" ในชื่อคำถามของฉันและความจริงที่ว่าฉันขอความช่วยเหลือเพื่อหา "การเข้าใจผิด" ของการโต้แย้งของฉันซึ่งชี้ไปที่ความจริงที่ว่านี้ ไม่ใช่ความขัดแย้งที่แท้จริง
Cupitor

คำตอบ:


30

ฉันคิดว่าคุณมีความสับสนรุ่นประมาณของการกระจายที่มีตัวแปรสุ่ม ลองเขียนสมมติฐานอิสระดังนี้ ที่บอกว่าถ้าคุณรู้ว่าการกระจายพื้นฐานของX n ( และตัวอย่างเช่นสามารถระบุได้โดยชุดพารามิเตอร์θ

(1)P(Xn|θ,Xi1,Xi2,,Xik)=P(Xn|θ)
Xnθ) จากนั้นการแจกแจงจะไม่เปลี่ยนแปลงเนื่องจากคุณได้สังเกตตัวอย่างจากมัน

ตัวอย่างเช่นคิดว่าเป็นตัวแปรสุ่มที่แสดงผลลัพธ์ของการโยนเหรียญn -th รู้น่าจะเป็นของหัวและหางสำหรับเหรียญ (ซึ่ง BTW สมมติมีการเข้ารหัสในθ ) ก็พอจะรู้ว่าการกระจายของX n โดยเฉพาะอย่างยิ่งผลลัพธ์ของการทอยก่อนหน้านี้ไม่ได้เปลี่ยนความน่าจะเป็นของการโยนหัวหรือหางสำหรับการทอยn -th และ( 1 )ถือXnnθXnn(1)

แต่โปรดทราบว่า )P(θ|Xn)P(θ|Xi1,Xi2,,Xik)


ขอบคุณมาก. ค่อนข้างตรงประเด็น ค่อนข้างตลกที่ฉันเดาคำตอบเมื่อไม่นานมานี้ แต่ฉันลืมไปแล้ว .... ตราบใดที่ฉันเข้าใจว่าการเข้าใจผิดไปโดยปริยายสมมติว่า "แบบจำลอง" ซึ่งสามารถทำให้การกระจายตัวของตัวแปรแบบสุ่ม ฉันทำให้ถูกต้องหรือไม่
Cupitor

1
@Cupitor: ฉันดีใจที่มีประโยชน์ ใช่เงื่อนไขในแบบจำลองตัวแปรสุ่มอิสระไม่ส่งผลกระทบต่อกันและกัน แต่ความเป็นไปได้ที่การกระจายที่กำหนดนั้นจะสร้างลำดับของผลลัพธ์ที่เปลี่ยนแปลงได้เมื่อคุณเห็นตัวอย่างเพิ่มเติมจากการแจกแจง (จริง) ที่แฝงอยู่
Sobi

15

หากคุณใช้วิธีการแบบเบย์และพารามิเตอร์รักษาอธิบายการกระจายของเป็นตัวแปรสุ่ม / เวกเตอร์แล้วสังเกตแน่นอนไม่อิสระ แต่พวกเขาจะเป็นเงื่อนไขที่เป็นอิสระได้รับความรู้เกี่ยวกับθจึงP ( X n | X n - 1 , X 1 , θ ) = P ( X nθ )จะถือXθP(Xn|Xn-1,...X1,θ)=P(Xn|θ)

ในวิธีการทางสถิติคลาสสิกคือไม่ได้เป็นตัวแปรสุ่ม การคำนวณเสร็จสิ้นราวกับว่าเรารู้ว่าθคืออะไร ในบางแง่มุมคุณมัก จำกัด อยู่กับθ (แม้ว่าคุณจะไม่ทราบคุณค่า)θθθ

เมื่อคุณเขียนว่า "... ให้ข้อมูลเกี่ยวกับโครงสร้างการกระจายและผลที่ตามมาเกี่ยวกับ " โดยปริยายคุณกำลังใช้แนวทางแบบเบย์ แต่ไม่ได้ทำอย่างแม่นยำ คุณกำลังเขียนคุณสมบัติของตัวอย่าง IID ว่า frequentist จะเขียน แต่คำสั่งที่สอดคล้องกันในการตั้งค่าเบส์จะเกี่ยวข้องกับเครื่องบนθXnθ

เบย์กับนักสถิติคลาสสิก

ให้เป็นผลมาจากการพลิกเหรียญที่ไม่สมดุลและไม่เป็นธรรม เราไม่ทราบความน่าจะเป็นที่เหรียญติดดินxผม

  • กับสถิติคลาสสิค frequentist, เป็นพารามิเตอร์บางขอเรียกว่าθ สังเกตว่าθตรงนี้เป็นสเกลาร์เช่นเดียวกับ 1/3 เราอาจไม่ทราบว่าตัวเลขคืออะไร แต่มันเป็นจำนวนหนึ่ง! มันไม่ได้สุ่ม!P(xผม=H)θθ
  • สำหรับนักสถิติเบย์นั้นตัวมันเองเป็นตัวแปรสุ่ม! มันแตกต่างกันมาก!θ

ความคิดที่สำคัญที่นี่คือสถิติแบบเบย์ขยายเครื่องมือของความน่าจะเป็นสถานการณ์ที่สถิติคลาสสิกไม่ได้ เพื่อ frequentist ที่ไม่ได้เป็นตัวแปรสุ่มเพราะมันมีค่าที่เป็นไปได้หนึ่ง ! ผลลัพธ์หลายอย่างเป็นไปไม่ได้! ในจินตนาการของเบส์แม้ว่าหลายค่าของθที่เป็นไปได้และเบส์ยินดีที่จะรูปแบบที่มีความไม่แน่นอน (ในใจของเขาเอง) โดยใช้เครื่องมือของความน่าจะเป็นθθ

จะไปที่ไหน

สมมติว่าเราพลิกเหรียญครั้ง การโยนครั้งเดียวไม่ส่งผลต่อผลลัพธ์ของอีกฝ่าย นักสถิติคลาสสิกจะเรียกการโยนอิสระเหล่านี้ (และแน่นอนพวกเขา) เราจะมี: P ( x n = H x n - 1 , x n - 2 , , x 1 ) = P ( x n = H ) = θ โดยที่θเป็นพารามิเตอร์ที่ไม่รู้จัก (จำไว้ว่าเราไม่รู้ว่ามันคืออะไร แต่มันไม่ใช่ตัวแปรสุ่ม! มันมีจำนวนพอสมควร)n

P(xn=H|xn-1,xn-2,...,x1)=P(xn=H)=θ
θ

Bayesian ลึกเข้าไปในความน่าจะเป็นอัตนัยจะบอกว่าสิ่งที่สำคัญคือความน่าจะเป็นจากมุมมองของเธอ! . หากเธอเห็น 10 หัวในแถวหัวที่ 11 น่าจะเป็นเพราะ 10 หัวในแถวนำไปสู่การเชื่อว่าเหรียญนั้นไม่สมดุลกับศีรษะ

P(x11=H|x10=H,x9=H,...,x1=H)>P(x1=H)

เกิดอะไรขึ้นที่นี่? ต่างกันอย่างไร! การอัพเดทความเชื่อเกี่ยวกับตัวแปรสุ่มแฝง ! หากθถือเป็นตัวแปรสุ่มการโยนจะไม่ขึ้นกับอีกต่อไป แต่พลิกมีความเป็นอิสระตามเงื่อนไขที่กำหนดค่าของθθθθ

P(x11=H|x10=H,x9=H,...,x1=H,θ)=P(x1=H|θ)=θ

θθ

หมายเหตุเพิ่มเติม

ฉันพยายามอย่างดีที่สุดที่จะให้คำแนะนำสั้น ๆ ที่นี่ แต่สิ่งที่ฉันทำไปนั้นดีที่สุดเพียงผิวเผินและแนวความคิดนั้นค่อนข้างลึก หากคุณต้องการดำดิ่งสู่ปรัชญาแห่งความน่าจะเป็นหนังสือ 1954 ของ Savage รากฐานของสถิติเป็นแบบคลาสสิก Google สำหรับ Bayesian vs. บ่อยครั้งและสิ่งต่าง ๆ จะเกิดขึ้น

วิธีการที่จะคิดเกี่ยวกับ IID ดึงก็คือเดอทฤษฎีบท Finetti ของและความคิดของexchangeability ในกรอบ Bayesian ความสามารถในการแลกเปลี่ยนนั้นเทียบเท่ากับความเป็นอิสระของเงื่อนไขในตัวแปรสุ่มบางอย่างที่แฝงอยู่ (ในกรณีนี้คือความไม่สมดุลของเหรียญ)


ในสาระสำคัญวิธีการแบบเบส์จะรักษาคำสั่ง "ตัวแปรสุ่ม iid" ไม่เป็นความจริงที่ว่าพวกเขาจะต้องเป็น IID แต่เป็นข้อสันนิษฐานที่แข็งแกร่งมากก่อนหน้านี้ว่าพวกเขาเป็นเช่นนั้น - และหากหลักฐานที่แข็งแกร่งบ่งชี้ว่า สมมติฐานเป็นจริงจากนั้น "การไม่เชื่อในเงื่อนไขที่กำหนด" จะปรากฏในผลลัพธ์
Peteris

ขอบคุณมากสำหรับคำตอบอย่างละเอียด ฉันได้ upvoting มัน แต่ฉันคิดว่าคำตอบของ Sobi ชี้ให้เห็นอย่างชัดเจนมากขึ้นว่าปัญหาอยู่ที่ใดนั่นคือสมมติว่าโครงสร้างของโมเดล (หรือนี่คือเท่าที่ฉันเข้าใจ)
Cupitor

1
@ Matthew Gunn: เรียบร้อยละเอียดและอธิบายได้ดีมาก! ฉันเรียนรู้เล็ก ๆ น้อย ๆ จากคำตอบของคุณขอบคุณ!
Sobi
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.