ตัวประมาณเบย์นั้นมีภูมิคุ้มกันต่อการเลือกอคติ


11

ตัวประมาณของ Bayes มีภูมิคุ้มกันต่อการเลือกอคติหรือไม่?

เอกสารส่วนใหญ่ที่กล่าวถึงการประมาณค่าในมิติที่สูงเช่นข้อมูลลำดับจีโนมทั้งหมดมักจะทำให้เกิดปัญหาอคติในการคัดเลือก ความลำเอียงที่เลือกเกิดขึ้นจากข้อเท็จจริงที่ว่าแม้ว่าเรามีผู้ทำนายที่มีศักยภาพหลายพันคนเท่านั้นที่จะได้รับการคัดเลือกเพียงไม่กี่คนเท่านั้น ดังนั้นกระบวนการจึงมีสองขั้นตอน: (1) เลือกชุดย่อยของตัวทำนาย (2) ทำการอนุมานบนชุดที่เลือกเช่นประมาณอัตราต่อรอง Dawid ในกระดาษที่ขัดกันในปี 1994 ของเขามุ่งเน้นไปที่ตัวประมาณค่าที่เป็นกลางและตัวประมาณ Bayes เขาลดความยุ่งยากของปัญหาในการเลือกเอฟเฟกต์ที่ใหญ่ที่สุดซึ่งอาจเป็นผลการรักษา จากนั้นเขาก็บอกว่าตัวประมาณที่ไม่เอนเอียงได้รับผลกระทบจากอคติการคัดเลือก เขาใช้ตัวอย่าง: สมมติว่า จากนั้นแต่ละอัน

ZiN(δi,1),i=1,,N
Ziเป็นกลางสำหรับ\ปล่อย , ตัวประมาณ อย่างไรก็ตามเอนเอียง ( บวก) สำหรับ\ สูงสุด \ {\ delta_1 \ delta_2 \ ldots \ delta_N \} ข้อความนี้สามารถพิสูจน์ได้อย่างง่ายดายด้วยความไม่เท่าเทียมของ Jensen ดังนั้นหากเรารู้ว่าi _ {\ max}ดัชนีของ\ delta_i ที่ใหญ่ที่สุดเราจะใช้Z_ {i _ {\ max}}เป็นตัวประมาณซึ่งไม่เอนเอียง แต่เนื่องจากเราไม่ทราบสิ่งนี้เราจึงใช้\ gamma_1 (\ mathbf {Z})แทนซึ่งจะกลายเป็นความเอนเอียง (บวก)δiZ=(Z1,Z2,,ZN)T
γ1(Z)=max{Z1,Z2,,ZN}
max{δ1,δ2,,δN}imaxδiZimaxγ1(Z)

ป้อนคำอธิบายรูปภาพที่นี่

แต่คำพูดที่น่าเป็นกังวลของดาวิน, เอฟฟรอนและผู้แต่งคนอื่น ๆ ก็คือตัวประมาณค่าของเบย์นั้นมีภูมิคุ้มกันต่อการเลือกอคติ ถ้าฉันจะวางก่อนหน้านี้บนพูดจากนั้นตัวประมาณค่าของ Bayes ของจะได้รับจาก โดยที่ , ด้วย Gaussian มาตรฐานδiδig(.)δi

E{δiZi}=zi+ddzim(zi)
m(zi)=φ(ziδi)g(δi)dδiφ(.)

หากเรากำหนดตัวประมาณใหม่ของเป็น สิ่งที่คุณเลือกที่จะประมาณการกับ , จะเหมือนถ้าเลือกอยู่บนพื้นฐานของ ครั้งนี้ตามเพราะเป็นเสียงเดียวในZ_iเรายังรู้ว่าย่อเข้าหาศูนย์ด้วยคำศัพท์,δimax

γ2(Z)=max{E{δ1Z1},E{δ2Z2},,E{δNZN}},
iδimaxγ1(Z)iγ2(Z)γ2(Z)ZiE{δiZi}Ziddzim(zi)ซึ่งจะช่วยลดบางส่วนของอคติในเชิงบวกในZ_iแต่เราจะสรุปได้อย่างไรว่าตัวประมาณค่าของเบย์นั้นมีภูมิคุ้มกันต่อการเลือกอคติ ฉันไม่เข้าใจZi

1
เนื่องจากคุณอ้างถึงการอ้างสิทธิ์ในวรรณคดีคุณสามารถโปรดให้สถานการณ์และการอ้างอิงหน้าเต็มเพื่อให้เราสามารถอ่านบริบททั้งหมดของการอ้างสิทธิ์นี้
เบ็น - คืนสถานะโมนิก้า

การกำหนดตัวประมาณค่าเป็นค่าสูงสุดของตัวประมาณค่าแบบเบย์ยังคงเป็นตัวประมาณค่าแบบเบย์หรือไม่?
ซีอาน

ตัวอย่างที่ 1 ในกระดาษ
Chamberlain Foncha

คำตอบ:


4

ดังที่อธิบายไว้ข้างต้นปัญหานี้มาจากการอนุมานการวาดบนดัชนีและค่า (i⁰, μ⁰) ซึ่งเป็นค่าเฉลี่ยที่ใหญ่ที่สุดของตัวอย่าง rvs ปกติ สิ่งที่ฉันพบว่าน่าประหลาดใจในการนำเสนอของ Dawid คือการวิเคราะห์แบบเบย์ไม่ได้ฟังแบบเบย์มากนัก หากได้รับตัวอย่างทั้งหมดวิธีการแบบเบย์ควรสร้างการแจกแจงแบบหลัง (i⁰, μ⁰) แทนที่จะทำตามขั้นตอนการประมาณค่าจากการประมาณi⁰ถึงการประมาณค่าเฉลี่ยที่เกี่ยวข้อง และถ้าจำเป็นตัวประมาณควรมาจากนิยามของฟังก์ชันการสูญเสียที่เฉพาะเจาะจง เมื่อใดก็ตามที่กำหนดจุดที่ใหญ่ที่สุดในตัวอย่างและเฉพาะจุดนั้นเท่านั้นการกระจายตัวของมันก็เปลี่ยนไปดังนั้นฉันจึงค่อนข้างงงงวยกับคำแถลงว่าไม่จำเป็นต้องทำการปรับเปลี่ยน

การสร้างแบบจำลองก่อนหน้านี้ค่อนข้างน่าแปลกใจเช่นกันว่านักบวชที่ควรจะมีส่วนร่วมมากกว่าที่จะเป็นผลิตภัณฑ์ของบรรทัดฐานอิสระเนื่องจากวิธีการเหล่านี้มีการเปรียบเทียบและเปรียบเทียบได้ ตัวอย่างเช่นลำดับชั้นมาก่อนดูเหมือนจะเหมาะสมกว่าโดยมีสถานที่ตั้งและมาตราส่วนที่จะประมาณจากข้อมูลทั้งหมด การสร้างการเชื่อมต่อระหว่างหมายถึง ... การคัดค้านที่เกี่ยวข้องกับการใช้งานของนักบวชที่ไม่เหมาะสมอิสระก็คือค่าเฉลี่ยสูงสุดμ⁰นั้นจะไม่มีการวัดที่ชัดเจน อย่างไรก็ตามฉันไม่คิดว่าการวิพากษ์วิจารณ์ของนักบวชบางคนกับคนอื่นเป็นการโจมตีที่เกี่ยวข้องกับ "ความขัดแย้ง" นี้


1
ดูเหมือนกับฉันว่าการป้องกันที่จำเป็นทั้งหมดควรได้รับการเข้ารหัสไว้ก่อนหน้าซึ่งเชื่อมต่อทุกวิธีที่ไม่รู้จัก หากก่อนหน้านี้สร้างความแตกต่างอย่างมากระหว่างความหมายที่ไม่น่าจะเกิดขึ้นสิ่งนั้นจะสะท้อนให้เห็นในด้านหลังทำให้มันสมบูรณ์แบบ
Frank Harrell

@ ซีอานคุณสามารถยกตัวอย่างของวิธีการที่คุณจะวางก่อนหน้าใน ? (i,μ)
Chamberlain Foncha

@Frank Harrel พิจารณาเช่นและ1) ประมาณการเป็นกลางของ เป็นZ_iประมาณการ Bayes ของคือZ_i) ถ้าเป็นที่ใหญ่ที่สุดเพื่อให้เป็นเพราะ Bayes ประมาณการเป็นเสียงเดียวในZ_iไม่ว่าข้อมูลก่อนหน้าจะเป็นอย่างไรข้อมูลนี้จะไม่เปลี่ยนแปลง อย่างไรก็ตามลด Bayes ในเชิงบวกใน0} แต่ถ้าเลือกผิดตัวประมาณ Bayes จะไม่สามารถแก้ไขได้δiN(a,1)ZiN(δi,1)δiZiδiE(δi|Zi)Zi0ZiE(δi0|Zi0)ZiE(δi0|Zi0)Zi0i0
Chamberlain Foncha

@ChamberlainFoncha: ตัวประมาณของ Bayes เป็นเพียงเมื่อเป็นอิสระก่อน การร่วมกันก่อนหน้าและทำให้พวกเขาพึ่งพาจริง ๆ E[δi|Zi]δiiμi
ซีอาน

และก่อนหน้านี้เป็นที่ยอมรับจากมุมมองแบบเบย์เช่นเครื่องแบบกระจายดัชนีและลำดับชั้นก่อนใน 's μi
ซีอาน

1

แม้ว่าคำตอบที่เข้าใจง่ายจะเป็นเพียงคำพูดที่ถูกต้อง สมมติสำหรับการทดสอบนี้แล้วหลังสำหรับมัน2) ความจริงที่ต่อต้านการหยั่งรู้นี้ค่อนข้างคล้ายกับ Bayes ที่มีภูมิคุ้มกันต่อ (ความลับ) การหยุด แต่เนิ่น ๆ (นั่นก็เป็นเรื่องที่ต่อต้านได้ง่ายมาก)μ 5 N ( x 5 , σ 2 )i=5μ5N(x5,σ2)

การใช้เหตุผลแบบเบย์จะนำไปสู่ข้อสรุปที่ผิดพลาดหากสำหรับการทดลองแต่ละครั้ง (ลองนึกภาพคุณซ้ำสองสามครั้ง) เฉพาะผลลัพธ์สำหรับความหลากหลายที่ดีที่สุดเท่านั้นที่จะถูกเก็บไว้ จะมีการเลือกข้อมูลและวิธีการแบบเบย์นั้นไม่ชัดเจนในการเลือกข้อมูล จริงๆแล้วไม่มีวิธีการทางสถิติใดที่สามารถป้องกันการเลือกข้อมูลได้

หากการเลือกดังกล่าวเสร็จสิ้นการใช้เหตุผลแบบเบย์อย่างสมบูรณ์ในการพิจารณาการเลือกนี้จะช่วยแก้ไขภาพลวงตาได้อย่างง่ายดาย

อย่างไรก็ตามประโยค "ตัวประมาณเบย์นั้นมีภูมิคุ้มกันต่อการเลือกอคติ" ค่อนข้างอันตราย เป็นเรื่องง่ายที่จะจินตนาการถึงสถานการณ์ที่ "การเลือก" หมายถึงอย่างอื่นเช่นการเลือกตัวแปรอธิบายหรือการเลือกข้อมูล เบย์ไม่ได้รับการยกเว้นอย่างชัดเจน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.