"ข้อมูลหน่วยก่อน" คืออะไร


11

ฉันได้อ่าน Wagenmakers (2007) วิธีการแก้ปัญหาการปฏิบัติเพื่อให้ปัญหาที่แพร่หลายของค่าพี ฉันรู้สึกทึ่งกับการแปลงค่า BIC ให้เป็นปัจจัยและความน่าจะเป็นของเบย์ อย่างไรก็ตามจนถึงตอนนี้ฉันยังไม่เข้าใจว่าข้อมูลหน่วยก่อนหน้าเป็นอย่างไร ฉันจะขอบคุณสำหรับคำอธิบายเกี่ยวกับรูปภาพหรือรหัส R เพื่อสร้างรูปภาพของสิ่งนี้ก่อนหน้านี้

คำตอบ:


6

ข้อมูลหน่วยก่อนหน้านั้นขึ้นอยู่กับข้อมูลก่อนหน้า (โดยทั่วไปคือหลายตัวแปรปกติ) ด้วยค่าเฉลี่ยที่ MLE และความแม่นยำเท่ากับข้อมูลที่ได้จากการสังเกตหนึ่งครั้ง ดูเช่นรายงานเทคโนโลยีนี้หรือเอกสารนี้สำหรับรายละเอียดแบบเต็ม แนวคิดของ UIP คือการให้ก่อนว่า 'ให้ข้อมูลพูดได้เอง'; ในกรณีส่วนใหญ่การเพิ่มก่อนหน้านี้ที่บอกคุณได้มากเท่ากับการสังเกตการณ์หนึ่งจุดซึ่งข้อมูลอื่นเป็น 'การชี้' จะมีผลกระทบเพียงเล็กน้อยต่อการวิเคราะห์ที่ตามมา หนึ่งในการใช้งานหลักคือการแสดงให้เห็นว่าการใช้ BIC สอดคล้องในกลุ่มตัวอย่างขนาดใหญ่เพื่อใช้ปัจจัย Bayes พร้อมกับ UIPs ในพารามิเตอร์ของพวกเขา

อาจเป็นเรื่องที่น่าสังเกตว่านักสถิติหลายคน (รวมถึง Bayesians) รู้สึกไม่สบายใจกับการใช้งาน Bayes Factor และ / หรือ BIC สำหรับปัญหาที่นำมาใช้มากมาย


2
BIC ไม่ใช่เครื่องมือ Bayesian เนื่องจากเป็นการลบผลกระทบจากก่อนหน้านี้ ในฐานะ Bayesian ฉันรู้สึกสะดวกสบายกับปัจจัย Bayes แต่ไม่ใช่กับ AIC, BIC หรือ DIC!
ซีอาน

ฉันไม่เคยบอกว่ามันเป็น! ในฐานะที่เป็น Bayesian (ผู้อ่านและผู้ที่ให้ความสำคัญกับ Bayesian Choice) ฉันจะมีความสุขกับวิธีการเหล่านี้หากพวกเขามีเหตุผลในการตัดสินใจเชิงทฤษฎีแม้กระทั่งประมาณสำหรับยูทิลิตี้ที่สะท้อนสิ่งที่ฉันต้องการให้การวิเคราะห์
แขกที่เข้าพัก

ขอบคุณสำหรับคำตอบ ฉันถามคำถามติดตามที่นี่
Matt Albrecht

2

ข้อมูลหน่วยก่อนขึ้นอยู่กับการตีความของการผันคำกริยาต่อไปนี้:

ติดตั้ง

  • ข้อมูลปกติ: ด้วยโดยที่ไม่ทราบและเป็นที่รู้จัก ข้อมูลสามารถสรุปได้อย่างเพียงพอโดยค่าเฉลี่ยตัวอย่างซึ่งก่อนที่จะมีการเปิดเผยข้อมูลใด ๆ จะถูกกระจายตาม})Xn=(X1,,Xn)XiN(μ,σ2)μσ2X¯N(μ,σ2n)
  • ปกติก่อนหน้าสำหรับ :μด้วยมีความแปรปรวนเช่นเดียวกับในข้อมูลμN(a,σ2)
  • หลังปกติสำหรับ :μด้วยโดยที่และ1}μN(M,v)M=1n+1(a+nx¯)v=σ2n+1

การตีความ

ดังนั้นหลังจากการสังเกต dataเรามีส่วนท้ายของที่มุ่งเน้นไปที่การรวมกันของการสังเกตนูนและสิ่งที่ถูกบันทึกไว้ก่อนที่ข้อมูลจะถูกสังเกตว่า ยิ่งกว่านั้นความแปรปรวนของหลังถูกกำหนดโดย , ดังนั้น, ราวกับว่าเรามีการสังเกตมากกว่าX¯=x¯μx¯aσ2n+1n+1nเปรียบเทียบการกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่าง โปรดทราบว่าการแจกแจงตัวอย่างจะไม่เหมือนกับการแจกแจงหลัง อย่างไรก็ตามรูปแบบหลังดูเหมือนว่าเป็นข้อมูลที่อนุญาตให้พูดได้ ดังนั้นมีข้อมูลหน่วยก่อนที่หนึ่งได้รับหลังที่มีความเข้มข้นในข้อมูลส่วนใหญ่ที่และหดต่อข้อมูลก่อนเป็น one-off โทษx¯a

Kass และ Wasserman ยิ่งกว่านั้นแสดงให้เห็นว่าการเลือกรูปแบบกับกับที่ได้รับก่อนหน้านี้สามารถประมาณกับเกณฑ์ชวาร์ตษ์ BIC / 2) เมื่อมีขนาดใหญ่M0:μ=aM1:μRn

ข้อสังเกตบางส่วน:

  • ความจริง BIC นั้นใกล้เคียงกับปัจจัยของ Bayes จากข้อมูลของหน่วยก่อนหน้านี้ไม่ได้หมายความว่าเราควรใช้ข้อมูลหน่วยก่อนที่จะสร้างปัจจัย Bayes ตัวเลือกเริ่มต้นของ Jeffreys (1961) คือการใช้ Cauchy ก่อนขนาดเอฟเฟกต์แทนดูที่ Ly et al (ในสื่อสิ่งพิมพ์) สำหรับคำอธิบายเกี่ยวกับการเลือกของ Jeffreys
  • Kass และ Wasserman แสดงให้เห็นว่า BIC หารด้วยค่าคงที่ (ที่เกี่ยวข้องกับ Cauchy กับการแจกแจงแบบปกติ) ยังสามารถใช้เป็นค่าประมาณของปัจจัย Bayes (เวลานี้ขึ้นอยู่กับ Cauchy ก่อนแทนที่จะเป็นค่าปกติ)

อ้างอิง

  • Jeffreys, H. (1961) ทฤษฎีของความน่า Oxford University Press, Oxford, UK, 3 ฉบับ
  • Kass, RE และ Wasserman, L. (1995) "การทดสอบแบบเบส์อ้างอิงสำหรับสมมติฐานที่ซ้อนกันและความสัมพันธ์กับเกณฑ์ Schwarz" วารสารสมาคมสถิติอเมริกัน , 90, 928-934
  • Ly, A. , Verhagen, AJ, & Wagenmakers, E.-J. (ในการกด) การทดสอบสมมติฐานของ Bayes ปัจจัยพื้นฐานของ Harold Jeffreys: คำอธิบายส่วนขยายและการประยุกต์ใช้ในด้านจิตวิทยา วารสารจิตวิทยาคณิตศาสตร์
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.