การอนุมานแบบไม่ใช่แบบเบย์ (นอกเหนือจากเคส SLR) เป็นข้อมูลล่าสุด ภายใต้ส่วนหัวของ "non-Bayesian" เราสามารถแบ่งวิธีการออกเป็นแบบ "คลาสสิค" บ่อยครั้งและวิธีการที่เป็นไปได้ "
การทำนายบ่อยคลาสสิก
αβ
ตอนนี้โดยทั่วไปฉันมีปัญหาเกี่ยวกับการนำเสนอและการสอน PI ของคลาสสิกในหลักสูตรสถิติส่วนใหญ่เนื่องจากแนวโน้มที่ครอบงำคือการตีความสิ่งเหล่านี้เป็นช่วงหลังการทำนายแบบเบย์ซึ่งพวกเขาไม่ได้ตัดสินใจอย่างแน่นอน โดยพื้นฐานแล้วพวกเขากำลังพูดถึงความน่าจะเป็นที่แตกต่างกัน! Bayesian's ไม่อ้างสิทธิ์ในการสุ่มตัวอย่างประสิทธิภาพของปริมาณของพวกเขา (มิฉะนั้นพวกเขาจะเป็นประจำ) ประการที่สอง Bayesian PI ได้ทำสิ่งที่คล้ายกันในจิตวิญญาณกับช่วงความอดทนแบบคลาสสิกมากกว่าการทำนายแบบคลาสสิก
สำหรับการอ้างอิง: ช่วงเวลาความอดทนต้องระบุด้วยความน่าจะเป็นสองอย่าง : ความมั่นใจและความครอบคลุม ความมั่นใจบอกเราว่าถูกต้องบ่อยแค่ไหนในตัวอย่างที่ทำซ้ำ ความครอบคลุมบอกเราถึงการวัดความน่าจะเป็นขั้นต่ำ ของช่วงเวลาภายใต้การแจกแจงที่แท้จริง (ตรงข้ามกับ PI ซึ่งให้การวัดความน่าจะเป็นที่คาดหวัง ... อีกครั้งภายใต้การสุ่มตัวอย่างซ้ำ) นี่คือสิ่งที่ Bayesian PI พยายามทำเช่นนั้น แต่ไม่มีการสุ่มตัวอย่างซ้ำ ๆ
ดังนั้นตรรกะพื้นฐานของ Stats 101 Simple Linear Regression คือการหาคุณสมบัติการสุ่มตัวอย่างซ้ำ ๆ ของ PI ภายใต้สมมติฐานของภาวะปกติ มันเป็นวิธีการแบบเกาส์สแบบบ่อยๆที่มักจะคิดว่าเป็น "คลาสสิก" และสอนในชั้นเรียนสถิติอินโทร สิ่งนี้ขึ้นอยู่กับความเรียบง่ายของการคำนวณที่เกิดขึ้น (ดูWikipediaสำหรับภาพรวมที่ดี)
การแจกแจงความน่าจะเป็นแบบ non-gaussian นั้นเป็นปัญหาโดยทั่วไปเพราะพวกมันสามารถขาดปริมาณที่สำคัญที่สามารถกลับด้านได้อย่างเรียบร้อยเพื่อให้ได้ช่วงเวลา ดังนั้นจึงไม่มีวิธี "แน่นอน" สำหรับการแจกแจงเหล่านี้บ่อยครั้งเนื่องจากคุณสมบัติของช่วงเวลาขึ้นอยู่กับพารามิเตอร์พื้นฐานที่แท้จริง
ยอมรับการไร้ความสามารถนี้อีกระดับของการทำนายเกิดขึ้น (และการอนุมานและการประมาณค่า) ด้วยวิธีการความน่าจะเป็น
การอนุมานตามความน่าจะเป็น
แนวทางตามความน่าจะเป็นเช่นแนวคิดทางสถิติที่ทันสมัยสามารถย้อนกลับไปหา Ronald Fisher ได้ แนวคิดพื้นฐานของโรงเรียนนี้คือยกเว้นกรณีพิเศษการอนุมานเชิงสถิติของเรานั้นมีเหตุผลที่อ่อนแอกว่าเมื่อเราจัดการกับการอนุมานจากการแจกแจงแบบปกติ (ซึ่งการประมาณพารามิเตอร์เป็นorthogonal ) ซึ่งเราสามารถสร้างความน่าจะเป็นที่แน่นอนได้ ในมุมมองของการอนุมานเราควรหลีกเลี่ยงข้อความที่เกี่ยวกับความน่าจะเป็นจริงยกเว้นในกรณีที่เป็นอย่างอื่นมิเช่นนั้นเราควรทำข้อความเกี่ยวกับความน่าจะเป็นและรับทราบว่าไม่มีใครรู้ถึงความน่าจะเป็นของข้อผิดพลาด
ดังนั้นเราจึงสามารถเห็นความน่าจะเป็นคล้ายกับความน่าจะเป็นแบบเบย์ แต่ไม่มีข้อกำหนดด้านความสามารถในการรวมระบบหรือความสับสนที่อาจเกิดขึ้นกับความน่าจะเป็นแบบประจำ มันตีความเป็นอัตนัยทั้งหมด ... แม้ว่าอัตราส่วนความน่าจะเป็นที่ 0.15 มักจะแนะนำสำหรับการอนุมานพารามิเตอร์เดียว
อย่างไรก็ตามมักจะไม่เห็นเอกสารที่ให้ "ช่วงเวลาความน่าจะเป็น" อย่างชัดเจน ทำไม? ปรากฏว่านี่เป็นเรื่องของสังคมวิทยาเป็นส่วนใหญ่เนื่องจากเราทุกคนต่างคุ้นเคยกับคำแถลงความเชื่อมั่นที่อิงกับความน่าจะเป็น สิ่งที่คุณเห็นบ่อย ๆ คือผู้เขียนที่อ้างถึงช่วงความเชื่อมั่น "โดยประมาณ" หรือ "เชิงเส้น" ของสิ่งนั้นและเช่นนั้น ช่วงเวลาเหล่านี้ส่วนใหญ่ได้มาจากวิธีความน่าจะเป็นที่ซึ่งเราพึ่งพาการกระจายตัวแบบไคสแควร์แบบ asymptotic ของอัตราส่วนความน่าจะเป็นในแบบเดียวกับที่เราขึ้นอยู่กับค่าปกติเชิงเส้นกำกับของตัวอย่าง
ด้วย "การแก้ไข" นี้เราสามารถสร้าง "ความเชื่อมั่น" 95% พื้นที่ที่มีความเชื่อมั่นได้เกือบเท่ากับตรรกะแบบเบย์
จาก CI ถึง PI ในกรอบความเป็นไปได้
ความสำเร็จและความง่ายในการใช้โอกาสที่กล่าวมาข้างต้นนำไปสู่ความคิดเกี่ยวกับการขยายไปสู่การทำนาย บทความสำรวจที่ดีมากเกี่ยวกับเรื่องนี้ได้รับที่นี่ (ฉันจะไม่ทำซ้ำความคุ้มครองที่ดีเยี่ยมของมัน) มันสามารถย้อนกลับไปหา David Hinkley ในช่วงปลายทศวรรษ 1970 (ดูJSTOR ) ซึ่งเป็นคนบัญญัติศัพท์ เขาใช้มันไปตลอดกาล " เพียร์สันปัญหาทำนายทวินาม " ฉันจะสรุปตรรกะพื้นฐาน
YYY
กฎพื้นฐานสำหรับการกำจัดพารามิเตอร์ "ความรำคาญ" เพื่อให้ได้โอกาสในการทำนายมีดังนี้:
- μ , σ
- หากพารามิเตอร์เป็นแบบสุ่ม (เช่นข้อมูลอื่น ๆ ที่ไม่มีการตรวจสอบหรือ "เอฟเฟ็กต์แบบสุ่ม") คุณต้องรวมพารามิเตอร์เหล่านั้นออก (เช่นเดียวกับวิธีการแบบเบย์)
ความแตกต่างระหว่างพารามิเตอร์แบบคงที่และแบบสุ่มนั้นไม่เหมือนกันกับการอนุมานโอกาส แต่มีการเชื่อมต่อกับโมเดลเอฟเฟกต์แบบผสมซึ่งดูเหมือนว่ากรอบแบบเบย์
หวังว่าสิ่งนี้จะตอบคำถามของคุณเกี่ยวกับการคาดการณ์ที่ไม่ใช่ "แบบเบย์" (และการอนุมานสำหรับเรื่องนั้น) เนื่องจากการเชื่อมโยงหลายมิติสามารถเปลี่ยนแปลงได้ฉันจะสร้างหนังสือ "ในทุกโอกาส: การสร้างแบบจำลองทางสถิติและการอนุมานโดยใช้ความน่าจะเป็น" ซึ่งกล่าวถึงกรอบความเป็นไปได้ในปัจจุบันที่ระดับความลึก การอนุมานและการทำนาย
อ้างอิง
- ช่วงทำนาย: วิธีการที่ไม่ใช่ตัวแปร วิกิพีเดีย เข้าถึง 9/13/2015
- Bjornstad, ม.ค. F. โอกาสในการทำนาย: รีวิว statist วิทย์ 5 (1990) หมายเลข 2, 242--254 ดอย: 10.1214 / ss / 1177012175
http://projecteuclid.org/euclid.ss/1177012175
- David Hinkley โอกาสที่จะเกิดการคาดการณ์ พงศาวดารของสถิติปีที่ 7, ฉบับที่ 4 (ก.ค. , 2522), หน้า 718-728 จัดพิมพ์โดย: สถาบันคณิตศาสตร์สถิติ URL ที่มีเสถียรภาพ: http://www.jstor.org/stable/2958920
- Yudi Pawitan ในทุกโอกาส: การสร้างแบบจำลองทางสถิติและการอนุมานโดยใช้ความน่าจะเป็น สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด; 1 ฉบับ (30 สิงหาคม 2544) ISBN-10: 0198507658, ISBN-13: 978-0198507659 โดยเฉพาะตอนที่ 5.5-5.9, 10 และ 16