หลายคน (นอกผู้เชี่ยวชาญผู้เชี่ยวชาญ) ที่คิดว่าพวกเขาเป็นประจำอยู่ในความเป็นจริงเบย์ นี่ทำให้การถกเถียงกันอย่างไร้จุดหมาย ฉันคิดว่า Bayesianism ชนะแล้ว แต่ยังมีชาว Bayesians หลายคนที่คิดว่าพวกเขาเป็นพวกประจำ มีบางคนที่คิดว่าพวกเขาไม่ได้ใช้นักบวชและด้วยเหตุนี้พวกเขาคิดว่าพวกเขาเป็นประจำ นี่คือตรรกะที่อันตราย สิ่งนี้ไม่เกี่ยวกับนักบวช (นักบวชเหมือนกันหรือไม่เหมือนกัน) ความแตกต่างที่แท้จริงนั้นลึกซึ้งยิ่งกว่า
(ฉันไม่เป็นทางการในแผนกสถิติพื้นหลังของฉันคือคณิตศาสตร์และวิทยาการคอมพิวเตอร์ฉันกำลังเขียนเพราะความยากลำบากที่ฉันได้พยายามอภิปรายเรื่องนี้ 'อภิปราย' กับคนอื่นที่ไม่ใช่นักสถิติและแม้กระทั่งในช่วงต้นอาชีพ สถิติ.)
MLE เป็นวิธีการแบบเบย์ บางคนจะพูดว่า "ฉันเป็นประจำเพราะฉันใช้ MLE เพื่อประเมินพารามิเตอร์ของฉัน" ฉันเคยเห็นสิ่งนี้ในวรรณคดีที่ผ่านการตรวจสอบโดยเพื่อน นี่เป็นเรื่องไร้สาระและมีพื้นฐานมาจากตำนานนี้ (ยังไม่ได้กล่าวถึง แต่บอกเป็นนัย ๆ ) ว่าผู้ที่ใช้บ่อยเป็นผู้ใช้เครื่องแบบมาก่อนแทนที่จะเป็นเครื่องแบบที่ไม่ได้ใส่มาก่อน)
ลองวาดตัวเลขหนึ่งตัวจากการแจกแจงแบบปกติด้วยค่าเฉลี่ยที่รู้จักและความแปรปรวนที่ไม่รู้จัก โทรแปรปรวนนี้\μ=0θ
X≡N(μ=0,σ2=θ)
พิจารณาฟังก์ชันความน่าจะเป็น ฟังก์ชั่นนี้มีสองพารามิเตอร์และและผลตอบแทนที่น่าจะได้รับของxxθθx
f(x,θ)=Pσ2=θ(X=x)=12πθ√e−x22θ
คุณสามารถจินตนาการการพล็อตเรื่องนี้ในแผนที่ความร้อนโดยมีบนแกน x และบนแกน y และใช้สี (หรือแกน z) นี่คือพล็อตที่มีเส้นชั้นความสูงและสีxθ
ก่อนสังเกตสองสาม หากคุณแก้ไขค่าเพียงค่าเดียวคุณสามารถนำส่วนแนวนอนที่สอดคล้องกันมาใช้ในแผนผังความร้อน ชิ้นนี้จะให้รูปแบบไฟล์ PDF สำหรับค่าที่\เห็นได้ชัดว่าพื้นที่ใต้เส้นโค้งในชิ้นส่วนนั้นจะเป็น 1 ในทางกลับกันหากคุณกำหนดค่าหนึ่งค่าเป็นแล้วดูที่ชิ้นส่วนแนวตั้งที่สอดคล้องกันดังนั้นจึงไม่มีการรับประกันดังกล่าวเกี่ยวกับพื้นที่ใต้เส้นโค้ง .θθx
ความแตกต่างระหว่างชิ้นนอนและแนวตั้งนี้เป็นสิ่งสำคัญและผมพบว่าการเปรียบเทียบนี้ช่วยให้ผมเข้าใจวิธีการ frequentist ที่จะมีอคติ
เบส์เป็นคนที่พูดว่า
สำหรับค่าของ x ซึ่งค่าของให้ 'สูงพอ' ค่าของ ?θf(x,θ)
อีกทางหนึ่งเบย์อาจรวมถึงก่อนหน้าแต่พวกเขายังคงพูดถึงg(θ)
สำหรับค่าของ x ซึ่งค่าของให้ค่าสูงพอของ ?f ( x , θ ) g ( θ )θf(x,θ)g(θ)
ดังนั้น Bayesian จะแก้ไข x และดูที่ชิ้นส่วนแนวตั้งที่สอดคล้องกันในโครงร่างของเส้นนั้น ในส่วนนี้พื้นที่ใต้เส้นโค้งไม่จำเป็นต้องเป็น 1 (ดังที่ฉันพูดไปก่อนหน้านี้) Bayesian 95% ช่วงเวลาที่น่าเชื่อถือ (CI) คือช่วงเวลาซึ่งมี 95% ของพื้นที่ที่มี ตัวอย่างเช่นหากพื้นที่เป็น 2 พื้นที่ที่อยู่ภายใต้ Bayesian CI ต้องเป็น 1.9
ในทางกลับกันผู้ใช้บ่อยจะไม่สนใจ x และก่อนอื่นให้พิจารณาแก้ไขและจะถามว่า:θ
สำหรับสิ่งนี้ค่าใดของ x ที่จะปรากฏบ่อยที่สุด?θ
ในตัวอย่างนี้ด้วยหนึ่งคำตอบสำหรับคำถามที่พบบ่อยนี้คือ: "สำหรับ 95% ของจะปรากฏขึ้นระหว่างและ "θ x - 3 √N(μ=0,σ2=θ)θx +3 √−3θ√+3θ√
ดังนั้น frequentist มีความกังวลมากขึ้นด้วยแนวเส้นที่สอดคล้องกับค่าคงที่ของ\θ
นี่ไม่ใช่วิธีเดียวในการสร้าง CI ที่ใช้บ่อยมันไม่ใช่สิ่งที่ดี (แคบ) แต่ให้อดทนกับฉันสักครู่
วิธีที่ดีที่สุดในการตีความคำว่า 'interval' ไม่ใช่ช่วงเวลาใน 1-d line แต่ให้คิดว่ามันเป็นพื้นที่บนระนาบ 2-d ด้านบน 'interval' เป็นเซตย่อยของระนาบ 2-d ไม่ใช่เส้น 1-d ใด ๆ หากมีคนเสนอ 'ช่วงเวลา' เราต้องทดสอบว่า 'ช่วงเวลา' นั้นถูกต้องที่ระดับความเชื่อมั่น / ความน่าเชื่อถือ 95%
นักความถี่จะตรวจสอบความถูกต้องของ 'ช่วงเวลา' นี้โดยพิจารณาจากการแบ่งแนวนอนแต่ละครั้งและดูที่พื้นที่ใต้เส้นโค้ง อย่างที่ฉันพูดไปก่อนหน้านี้พื้นที่ใต้เส้นโค้งนี้จะเป็นพื้นที่หนึ่งเสมอ ความต้องการที่สำคัญคือพื้นที่ภายใน 'ช่วงเวลา'มีค่าอย่างน้อย 0.95
ชาวเบย์จะตรวจสอบความถูกต้องโดยดูที่ชิ้นส่วนแนวตั้งแทน อีกครั้งพื้นที่ใต้เส้นโค้งจะถูกเปรียบเทียบกับพื้นที่ย่อยที่อยู่ภายใต้ช่วงเวลา หากหลังเป็นอย่างน้อย 95% ของอดีตดังนั้น 'ช่วงเวลา' คือช่วงเวลาที่น่าเชื่อถือ 95% แบบเบย์
ตอนนี้เรารู้วิธีการทดสอบว่าช่วงเวลาใดช่วงหนึ่งเป็น 'ถูกต้อง' คำถามคือเราจะเลือกตัวเลือกที่ดีที่สุดในตัวเลือกที่ถูกต้องได้อย่างไร นี่อาจเป็นงานศิลปะสีดำ แต่โดยทั่วไปคุณต้องการช่วงเวลาที่แคบที่สุด ทั้งสองแนวทางมีแนวโน้มที่จะเห็นด้วยที่นี่ - ชิ้นส่วนแนวตั้งถูกพิจารณาและเป้าหมายคือทำให้ช่วงเวลาแคบที่สุดเท่าที่จะทำได้ภายในแต่ละชิ้นแนวตั้ง
ฉันไม่ได้พยายามกำหนดช่วงความเชื่อมั่นที่เป็นไปได้ที่แคบที่สุดในตัวอย่างข้างต้น ดูความคิดเห็นโดย @cardinal ด้านล่างสำหรับตัวอย่างของช่วงเวลาที่แคบลง เป้าหมายของฉันคือไม่หาช่วงเวลาที่ดีที่สุด แต่เน้นความแตกต่างระหว่างชิ้นส่วนแนวนอนและแนวตั้งในการพิจารณาความถูกต้อง ช่วงเวลาที่เป็นไปตามเงื่อนไขของช่วงความเชื่อมั่นที่พบบ่อย 95% จะไม่เป็นไปตามเงื่อนไขของช่วงเวลาที่น่าเชื่อถือ 95% ของเบย์และในทางกลับกัน
ทั้งสองวิธีต้องการช่วงเวลาที่แคบนั่นคือเมื่อพิจารณาชิ้นส่วนแนวตั้งหนึ่งชุดเราต้องการสร้างช่วงเวลา (1-d) ในชิ้นนั้นให้แคบที่สุดเท่าที่จะทำได้ ความแตกต่างคือวิธีการบังคับใช้ 95% - ผู้ใช้บ่อยจะดูเฉพาะช่วงเวลาที่เสนอซึ่ง 95% ของพื้นที่ฝานแนวนอนแต่ละแห่งอยู่ภายใต้ช่วงเวลาในขณะที่ Bayesian จะยืนยันว่าแต่ละส่วนแนวตั้งนั้นเป็น 95% ของพื้นที่นั้น ภายใต้ช่วงเวลา
นักสถิติที่ไม่เข้าใจหลายคนไม่เข้าใจสิ่งนี้และพวกเขามุ่งเน้นไปที่ชิ้นส่วนแนวตั้งเท่านั้น สิ่งนี้ทำให้พวกเขาเป็นชาวเบย์แม้ว่าพวกเขาจะคิดเป็นอย่างอื่น