สิ่งที่มีคุณสมบัติเป็นประจำที่ดีหมายถึงอะไร


12

ฉันมักจะได้ยินวลีนี้ แต่ไม่เคยเข้าใจความหมายทั้งหมด วลีที่ว่า "คุณสมบัติ frequentist ดี" มี ~ 2750 ฮิตใน google ในปัจจุบัน 536 ใน scholar.google.com และ4 stats.stackexchange.com

สิ่งที่ใกล้เคียงที่สุดที่ฉันพบกับคำจำกัดความที่ชัดเจนมาจากสไลด์สุดท้ายในการนำเสนอของมหาวิทยาลัยสแตนฟอร์ดซึ่งกล่าวถึง

[T] เขาหมายถึงการรายงานช่วงเวลาความมั่นใจ 95% คือคุณ“ ดักจับ” พารามิเตอร์ที่แท้จริงใน 95% ของการอ้างสิทธิ์ที่คุณทำแม้กระทั่งกับปัญหาการประมาณการที่แตกต่างกัน นี่คือลักษณะที่กำหนดของขั้นตอนการประมาณค่าซึ่งมีคุณสมบัติของนักสะสมประจำที่ดีพวกเขาสามารถตรวจสอบได้เมื่อใช้ซ้ำ ๆ

สะท้อนให้เห็นถึงเรื่องนี้ฉันคิดว่าวลี "คุณสมบัติบ่อย ๆ ดี" หมายถึงการประเมินของวิธีเบย์บางและโดยเฉพาะอย่างยิ่งวิธีเบส์ในการก่อสร้างช่วงเวลา ผมเข้าใจว่าช่วงเวลาแบบเบย์จะหมายถึงการมีค่าที่แท้จริงของพารามิเตอร์ที่มีความน่าจะเป็นพีช่วงเวลาที่พบบ่อยจะหมายถึงการสร้างเช่นว่าหากกระบวนการของการก่อสร้างช่วงเวลาซ้ำหลายครั้งเกี่ยวกับของช่วงเวลาจะมีค่าที่แท้จริงของพารามิเตอร์ ช่วงเวลาแบบเบย์โดยทั่วไปไม่ได้ให้สัญญาใด ๆ เกี่ยวกับสิ่งที่% ของช่วงเวลาจะครอบคลุมถึงมูลค่าที่แท้จริงของพารามิเตอร์ อย่างไรก็ตามวิธีการแบบเบย์บางครั้งก็มีคุณสมบัติที่ถ้าทำซ้ำหลายครั้งพวกเขาครอบคลุมมูลค่าที่แท้จริงเกี่ยวกับp 100 % p 100 %pp100%p100%ของเวลา เมื่อพวกเขามีคุณสมบัตินั้นเราบอกว่าพวกเขามี "คุณสมบัติที่ดีเป็นประจำ"

นั่นถูกต้องใช่ไหม? รูปผมว่าต้องมีมากขึ้นไปกว่านั้นเนื่องจากวลีหมายถึง frequentist ดีคุณสมบัติมากกว่าการมี frequentist ดีคุณสมบัติ


1
ฉันชอบวิธีที่คุณคิดคำถามนี้ ในวันแรกเซอร์แฮโรลด์เจฟฟรีย์พยายามสร้างการแจกแจงแบบเบย์หลังที่มีพฤติกรรมเหมือนฟังก์ชั่นความน่าจะเป็น ดังนั้นจึงต้องสร้างการกระจายก่อนหน้านี้ "สม่ำเสมอ" แนวคิดคือการใช้วิธีการก่อนหน้านี้หมายถึงสิ่งที่เป็นกลางและไม่มีผลต่อการอนุมาน ดังนั้นสิ่งนี้นำไปใช้กับมากกว่าแค่การทำให้ช่วงเวลาที่น่าเชื่อถือดูเหมือนเป็นช่วงความมั่นใจ แต่เจฟฟรีย์วิ่งเข้าไปหาปัญหาเพราะมีบางกรณีที่ "เครื่องแบบ" ก่อนหน้านั้นไม่เหมาะสม
Michael R. Chernick

1
ไม่เหมาะสมหมายความว่าความหนาแน่นก่อนหน้านี้ไม่รวมเข้ากับ 1 ดูเหมือนว่าเจฟฟรีย์เชื่อว่าวิธีเบย์ต้องได้รับการพิสูจน์ด้วยการเห็นด้วยกับวิธีการที่ใช้บ่อย ในที่สุดเบย์ก็ปฏิเสธความคิดนี้เพราะคุณค่าของวิธีการที่พวกเขาอ้างว่ามีข้อมูลก่อนหน้านี้ที่มีอิทธิพลต่อการอนุมานและดังนั้นพวกเขาจึงชอบใช้นักบวช
Michael R. Chernick

2
@MichaelChernick: คุณสามารถให้ข้อมูลอ้างอิงที่แม่นยำเกี่ยวกับ Jeffreys ที่กำลังมองหาคุณสมบัติที่ใช้ประจำสำหรับตัวประมาณค่าของ Bayes ได้หรือไม่? ฉันไม่เคยได้ยินเรื่องนี้เลย และฉันยังสงสัยฟรีย์เป็นที่ทุกคนกังวลเกี่ยวกับการใช้ไพรเออร์ที่ไม่เหมาะสมพวกเขาทั้งหมดมากกว่าทฤษฎีความน่าจะเป็น
ซีอาน

ฉันรักคำถามนี้!
Alexis

1
@ ซีอานตามความเป็นจริงสำหรับรุ่นเบต้า - ทวินามมันเป็น Haldane มาก่อน (ซึ่งไม่เหมาะสม) สิ่งหนึ่งที่นำไปสู่การประเมินบ่อยครั้งไม่ใช่ Jeffreys ก่อน (ซึ่งเหมาะสมในกรณีนี้) ฉันไม่เคยได้ยินมาก่อนว่า Jeffreys กำลังมองหาคุณสมบัติของนักสะสมประจำที่ดีฉันคิดว่าเขากำลังมองหานักบวชที่มีวัตถุประสงค์และโดยที่เขาหมายถึงค่าคงที่ภายใต้
DeltaIV

คำตอบ:


3

สิ่งที่ยุ่งยากเกี่ยวกับคุณสมบัติของผู้ใช้บ่อยคือพวกมันเป็นคุณสมบัติของโพรซีเดอร์มากกว่าคุณสมบัติของผลลัพธ์หรือการอนุมาน ขั้นตอนการปฏิบัติที่ดีทำให้การอ้างถึงถูกต้องตามสัดส่วนที่ระบุในระยะยาว แต่ขั้นตอนแบบเบย์ที่ดีมักจะเป็นวิธีที่ให้ผลการวินิจฉัยที่ถูกต้องในแต่ละกรณี

ตัวอย่างเช่นพิจารณาขั้นตอนแบบเบย์ที่ "ดี" โดยทั่วไปเนื่องจากมีการแจกแจงความน่าจะเป็นหลังหรือช่วงเวลาที่น่าเชื่อถือซึ่งแสดงการรวมกันของหลักฐานอย่างถูกต้อง (ฟังก์ชันความน่าจะเป็น) ที่มีการแจกแจงความน่าจะเป็นก่อน หากข้อมูลก่อนหน้ามีข้อมูลที่ถูกต้อง (พูดมากกว่าความคิดเห็นที่ว่างเปล่าหรือรูปแบบที่ไม่ได้แจ้งล่วงหน้า) รูปแบบหลังหรือช่วงเวลานั้นอาจส่งผลให้อนุมานได้ดีกว่าผลลัพธ์ที่เกิดขึ้นบ่อยครั้งจากข้อมูลเดียวกัน ดีกว่าในแง่ของการนำไปสู่การอนุมานที่แม่นยำยิ่งขึ้นเกี่ยวกับกรณีนี้โดยเฉพาะหรือช่วงเวลาการประเมินที่แคบลงเนื่องจากขั้นตอนจะใช้ข้อมูลที่ถูกต้องก่อนที่กำหนดเอง ในระยะยาวเปอร์เซ็นต์ความครอบคลุมของช่วงเวลาและความถูกต้องของการอนุมานนั้นขึ้นอยู่กับคุณภาพของแต่ละช่วงก่อน

ขอให้สังเกตว่ากระบวนการไม่ได้ระบุวิธีการรับมาก่อนและดังนั้นการบัญชีระยะยาวของการปฏิบัติงานจะสันนิษฐานว่าเก่าก่อนใด ๆ มากกว่าการออกแบบที่กำหนดเองมาก่อนสำหรับแต่ละกรณี

ขั้นตอนแบบเบย์สามารถมีคุณสมบัติที่ใช้บ่อยได้ดี ตัวอย่างเช่นในหลายกรณีขั้นตอนแบบเบย์พร้อมสูตรที่ไม่ได้จัดเตรียมไว้ก่อนหน้านี้จะมีคุณสมบัติที่ดีต่อผู้ใช้เป็นประจำ คุณสมบัติที่ดีเหล่านั้นจะเป็นอุบัติเหตุมากกว่าคุณสมบัติการออกแบบและจะเป็นผลลัพธ์ที่ตรงไปตรงมาของขั้นตอนดังกล่าวซึ่งให้ช่วงเวลาที่คล้ายกันกับขั้นตอนที่ใช้บ่อย

ดังนั้นขั้นตอนแบบเบย์จึงสามารถมีคุณสมบัติด้านการอนุมานที่เหนือกว่าในการทดสอบเดี่ยวในขณะที่มีคุณสมบัตินักสะสมที่ไม่ดีในระยะยาว กระบวนการที่ใช้บ่อยซึ่งมีคุณสมบัติของนักวิ่งระยะยาวที่ดีมักจะมีประสิทธิภาพต่ำในกรณีของการทดลองเดี่ยว


2
ฉันไม่ทำตาม ยกเว้นสำหรับ Empirical Bayes ในขั้นตอน Bayesian ทั้งหมดที่ฉันเห็นก่อนหน้านี้จะถูกเลือกโดยอิสระจากข้อมูล ดังนั้นเมื่อใช้ขั้นตอนดังกล่าวกับชุดข้อมูลหลายชุดที่มาจากกระบวนการสร้างข้อมูลเดียวกัน (นี่คือกรอบการทำงานบ่อย) Bayesian จะใช้ฟังก์ชันโอกาสเดียวกัน (กระบวนการสร้างข้อมูลเหมือนกัน) และก่อนหน้านี้เหมือนกัน (ก่อนคือ เป็นอิสระจากข้อมูลในขั้นตอนเบย์ส่วนใหญ่) แน่นอนเนื่องจากข้อมูลมีการเปลี่ยนแปลงในแต่ละครั้งมูลค่าของโอกาสที่จะเปลี่ยนแปลง แต่รูปแบบของมันจะเหมือนกัน ตอนนี้ถ้าแต่ละคน [1/2]
DeltaIV

2
[2/2] การประมาณการมีความแม่นยำมากขึ้นกระบวนการทั้งหมดจะมีความแม่นยำน้อยลงอย่างไร สิ่งนี้จะเกิดขึ้นได้หากการประมาณแบบเบย์นั้นไม่แม่นยำเสมอไป อย่างไรก็ตามเนื่องจากก่อนหน้านี้ไม่ได้ถูกกำหนดให้เป็นข้อมูลที่สังเกตฉันไม่แน่ใจว่าอะไรทำให้มันแม่นยำมากขึ้นหรือน้อยลงสำหรับแต่ละกรณีและ / หรือ "โดยเฉลี่ย"
DeltaIV

@DeltaV ฉันคิดว่าคุณกำลังจัดการกับชุดอ้างอิงที่ไม่ถูกต้อง คุณสมบัติที่พบบ่อยของกระบวนการเกี่ยวข้องกับประสิทธิภาพในระยะยาวของขั้นตอนที่ใช้ในกรณีใหม่ทั้งหมดไม่ใช่เพียงแค่การทดสอบซ้ำโดยเฉพาะ นั่นเป็นเหตุผลที่ขั้นตอนความเชื่อมั่นช่วงสำหรับสัดส่วนทวินามต้องทำงานกับค่าทั้งหมดของพารามิเตอร์ไม่ใช่เฉพาะค่าที่เกี่ยวข้องกับอินสแตนซ์เฉพาะที่ใช้โพรซีเดอร์ ประเภท 'ระยะยาว' นั้นหมายถึงการปรับแต่งก่อนหน้านี้ที่เหมาะสมกับกรณีที่สงสัยจะไม่เหมาะสมสำหรับการใช้ระยะยาว
Michael Lew

คุณถูกต้องที่ขั้นตอนความเชื่อมั่นแบบประจำจะต้องมีความครอบคลุมเล็กน้อยสำหรับค่าทั้งหมดของพารามิเตอร์ที่ไม่รู้จัก สิ่งนี้ถูกระบุโดยนิวแมนและเพียร์สันอย่างชัดเจนและมักถูกมองข้ามในปัจจุบัน อย่างไรก็ตามเมื่อคุณเลือกก่อนหน้านี้คุณไม่ทราบว่าเป็นค่า "จริง" ของพารามิเตอร์ คุณมีตัวอย่างของคุณเท่านั้นและสิ่งที่ควรทำก่อนหน้านี้เป็นอิสระจากตัวอย่าง ดังนั้นฉันยังไม่เห็นชัดเจนว่าคุณสามารถกำหนดค่าก่อนตามตัวอย่างได้อย่างไร คุณสามารถทำเป็นตัวอย่างจริงได้หรือไม่?
DeltaIV

@DeltaIV ถ้าฉันรู้ว่าพารามิเตอร์ปัจจุบันที่น่าสนใจได้รับการประเมินในการศึกษาก่อนหน้านี้แล้วฉันสามารถกำหนดรูปร่างข้อมูลก่อนตามการประมาณการที่ ก่อนหน้านั้นจะมีความเหมาะสมสำหรับการวิเคราะห์ในปัจจุบันนี้ แต่ไม่มีข้อมูลที่เหมาะสมเทียบเท่าก่อนที่จะพร้อมใช้งานสำหรับชุดของการใช้งานของวิธีการในระยะยาว ดังนั้นการวิเคราะห์สามารถมีคุณสมบัติที่ดีกว่าในกรณีจริงที่แยกได้มากกว่าที่จะปรากฏในระยะยาวบ่อยครั้ง
Michael Lew

2

ฉันจะตอบว่าการวิเคราะห์ของคุณถูกต้อง เพื่อให้ข้อมูลเชิงลึกเพิ่มเติมฉันจะพูดถึงนักบวชที่ตรงกัน

การจับคู่นักบวชเป็นนักบวชที่ออกแบบมาเพื่อสร้างแบบจำลองเบย์ด้วยคุณสมบัติเป็นประจำ โดยเฉพาะอย่างยิ่งพวกมันถูกกำหนดไว้เพื่อให้ช่วงเวลา hpd ที่ได้รับเป็นไปตามความครอบคลุมของช่วงความมั่นใจบ่อย (ดังนั้น 95% ของ 95% hpd มีค่าจริงในระยะยาว) ขอให้สังเกตว่าใน 1d มีวิธีวิเคราะห์: นักบวช Jeffreys กำลังจับคู่นักบวช ในมิติที่สูงกว่านี้ไม่จำเป็นสำหรับกรณี (สำหรับผู้รู้ของฉันแล้วไม่มีผลลัพธ์ที่พิสูจน์ว่านี่ไม่ใช่กรณี)

ในทางปฏิบัติหลักการจับคู่นี้บางครั้งก็นำไปใช้เพื่อปรับค่าพารามิเตอร์บางอย่างของแบบจำลอง: ข้อมูลความจริงภาคพื้นดินถูกนำมาใช้เพื่อเพิ่มประสิทธิภาพพารามิเตอร์เหล่านี้ในแง่ที่ว่าค่าของพวกเขาเพิ่มความครอบคลุมบ่อยครั้งที่สุด . จากการทดลองของฉันเองนี่อาจเป็นงานที่บอบบางมาก


0

หากมีการสนับสนุนใด ๆ ที่ฉันสามารถทำได้ให้ฉันเพิ่มคำชี้แจงก่อนจากนั้นตอบคำถามของคุณโดยตรง มีความสับสนมากมายเกี่ยวกับหัวข้อ (คุณสมบัติผู้ถี่ถ้วนของกระบวนการเบย์) และแม้แต่ความขัดแย้งระหว่างผู้เชี่ยวชาญ ความเข้าใจผิดครั้งแรกคือ "ช่วงเวลาแบบเบย์หมายถึงมีค่าที่แท้จริงของพารามิเตอร์ที่มีความน่าจะเป็น " หากคุณเป็นคนเบย์บริสุทธิ์ (คนที่ไม่ได้ใช้ความคิดบ่อย ๆ ในการประเมินขั้นตอนแบบเบย์) ก็ไม่มีสิ่งใดเช่น "พารามิเตอร์ที่แท้จริง" ปริมาณความสนใจหลักที่เป็นพารามิเตอร์คงที่ในโลกที่พบบ่อยคือตัวแปรสุ่มในโลกของ Bayesian ในฐานะเบย์คุณไม่สามารถกู้คืนค่าที่แท้จริงของพารามิเตอร์ได้ แต่เป็นการกระจายของ "พารามิเตอร์" หรือช่วงเวลาของพวกเขาp

ตอนนี้เพื่อตอบคำถามของคุณ: ไม่มันไม่ได้หมายความถึงการประเมินวิธีการแบบเบย์ การข้ามความแตกต่างและการมุ่งเน้นในขั้นตอนการประมาณค่าเพื่อให้ง่าย: ความบ่อยในสถิติคือความคิดในการประมาณปริมาณคงที่ที่ไม่รู้จักหรือการทดสอบสมมติฐานและประเมินกระบวนการดังกล่าวกับการทำซ้ำตามสมมุติฐานของมัน คุณสามารถใช้เกณฑ์หลายเกณฑ์ในการประเมินกระบวนการ สิ่งที่ทำให้เป็นเกณฑ์ที่พบบ่อยคือคนเราใส่ใจว่าจะเกิดอะไรขึ้นหากมีใครใช้กระบวนการเดียวกันซ้ำแล้วซ้ำอีก ถ้าคุณทำเช่นนั้นคุณสนใจคุณสมบัติของผู้ใช้บ่อย กล่าวอีกนัยหนึ่ง: "คุณสมบัติของผู้ใช้บ่อยคืออะไร" หมายถึง "เกิดอะไรขึ้นถ้าเราทำซ้ำขั้นตอนซ้ำแล้วซ้ำอีก?" ทีนี้สิ่งที่ทำให้คุณสมบัติของผู้ใช้บ่อยนั้นดีเป็นอีกชั้นของเกณฑ์ คุณสมบัติที่พบบ่อยที่สุดที่ถือว่าเป็นคุณสมบัติที่ดีคือความสอดคล้อง (ในการประมาณค่าถ้าคุณสุ่มตัวอย่างตัวประมาณจะรวมกันเป็นค่าคงที่ที่คุณกำลังประเมิน) ประสิทธิภาพ (ถ้าคุณเก็บตัวอย่างไว้ความแปรปรวนของตัวประมาณจะเป็นศูนย์ ดังนั้นคุณจะแม่นยำยิ่งขึ้น) ความน่าจะเป็นที่ครอบคลุม(ในการทำซ้ำหลายขั้นตอนช่วงความมั่นใจ 95% จะมีค่าจริง 95% ของเวลา) สองตัวอย่างแรกเรียกว่าคุณสมบัติตัวอย่างขนาดใหญ่ส่วนที่สามคือคุณสมบัติของนักทำบ่อย ๆ ของเนย์แมนในแง่ที่ว่ามันไม่จำเป็นต้องใช้ผลลัพธ์แบบอะซิมโทติคจำเป็น ดังนั้นโดยรวมแล้วในกรอบบ่อย ๆ มีค่าจริงและไม่รู้จัก คุณประมาณการและคุณมักจะ (ยกเว้นในอุบัติเหตุที่โชคดีหายาก) ผิดในการประเมิน แต่คุณพยายามที่จะช่วยตัวเองโดยการกำหนดให้อย่างน้อยภายใต้การทำซ้ำการคาดคะเนของคุณอย่างไม่มีเงื่อนไขสมมุติคุณจะผิดน้อยลงหรือน้อยลงคุณรู้ว่าคุณจะถูกจำนวนครั้ง ฉันจะไม่พูดคุยหากมันสมเหตุสมผลหรือไม่หรือมีข้อสันนิษฐานเพิ่มเติมที่จำเป็นในการให้เหตุผลเนื่องจากไม่ใช่คำถามของคุณ ตามแนวคิดแล้วนั่นคือคุณสมบัติที่อ้างถึงบ่อยครั้งและเป็นวิธีการที่ดีโดยทั่วไปในบริบทดังกล่าว

ฉันจะปิดบทความนี้โดยชี้ให้คุณเพื่อที่คุณจะตัดสินด้วยตัวเองถ้ามันสมเหตุสมผลและความหมายของขั้นตอนแบบเบย์มีคุณสมบัติเป็นประจำที่ดี (คุณจะพบการอ้างอิงเพิ่มเติมที่นั่น):

  • Little, R. , & others, (2011) Bayes ที่ปรับเทียบแล้วสำหรับสถิติโดยทั่วไปและข้อมูลที่ขาดหายไปโดยเฉพาะ วิทยาศาสตร์สถิติ, 26 (2), 162–174
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.