Bayesian ยอมรับว่ามีค่าพารามิเตอร์คงที่หนึ่งค่าหรือไม่


39

ในการวิเคราะห์ข้อมูลแบบเบย์พารามิเตอร์จะถือว่าเป็นตัวแปรสุ่ม สิ่งนี้เกิดจากแนวคิดเรื่องความน่าจะเป็นแบบเบย์แบบอัตนัย แต่ Bayesians ในทางทฤษฎียอมรับว่ามีค่าคงที่ที่แท้จริงเพียงค่าเดียวใน 'โลกแห่งความจริง'

ดูเหมือนว่าคำตอบที่ชัดเจนคือ 'ใช่' เพราะจากนั้นพยายามประเมินพารามิเตอร์เกือบจะไร้สาระ การอ้างอิงทางวิชาการสำหรับคำตอบนี้จะได้รับการชื่นชมอย่างมาก


2
ให้พารามิเตอร์นั้นกับฉันและฉันจะกำหนดการแจกแจงให้ :-)
Anne van Rossum

คำตอบ:


42

IMHO "ใช่"! นี่คือหนึ่งในคำพูดที่ฉันชอบโดยกรีนแลนด์ (2006: 767):

มันมักจะพูด (ไม่ถูกต้อง) ว่า 'พารามิเตอร์ได้รับการแก้ไขตามที่ถูกแก้ไขโดยผู้ใช้บ่อย แต่เป็นการสุ่มโดย Bayesian' สำหรับผู้ใช้บ่อยและ Bayesians ค่าของพารามิเตอร์อาจได้รับการแก้ไขตั้งแต่เริ่มต้นหรืออาจถูกสร้างขึ้นจากกลไกการสุ่มทางร่างกาย ไม่ว่าในกรณีใดทั้งสองสมมติว่าได้ใช้ค่าคงที่ที่เราต้องการทราบ Bayesian ใช้แบบจำลองความน่าจะเป็นทางการเพื่อแสดงความไม่แน่นอนส่วนบุคคลเกี่ยวกับคุณค่านั้น 'ความสุ่ม' ในโมเดลเหล่านี้แสดงถึงความไม่แน่นอนส่วนบุคคลเกี่ยวกับค่าของพารามิเตอร์ ไม่ใช่คุณสมบัติของพารามิเตอร์ (แม้ว่าเราควรหวังว่ามันจะสะท้อนคุณสมบัติของกลไกที่สร้างพารามิเตอร์ได้อย่างถูกต้อง)

กรีนแลนด์, S. (2006) มุมมองแบบเบย์สำหรับการวิจัยทางระบาดวิทยา: I. พื้นฐานและวิธีการพื้นฐาน วารสารระบาดวิทยาระหว่างประเทศ , 35 (3), 765–774


2
มีความแตกต่างเล็กน้อยไม่มีใครโต้แย้งได้ว่า (ตำแหน่งโมเมนตัม) ของอนุภาคเป็น "พารามิเตอร์" ที่เราอาจลองประเมิน? บางคนอาจโต้แย้งว่าไม่มีค่า "คงที่" ของพารามิเตอร์นี้และเราควรถือว่ามันเป็นการกระจายตัว เกี่ยวกับสิ่งแปลกปลอมโดยเฉพาะเป็นการกระจายมากกว่าค่าคงที่ดูเหมือนว่าเป็นสิ่งที่ธรรมชาติทำในบางสถานการณ์ ฉันไม่คิดว่าเหตุผลนี้ดึงดูดความสนใจของชาวเบย์ในทางปฏิบัติมาก แต่ฉันคิดว่าจะตอบคำถามของ OP อย่างเต็มที่บางการอภิปรายถึงลักษณะของการสุ่มนั้นเป็นสิ่งจำเป็น
ผู้ชาย

3
ฉันไม่เห็นสิ่งใดที่ 'ไม่ตรงกับความต้องการ' เกี่ยวกับการพิจารณาการกระจายเป็นเป้าหมายของการอนุมาน อันที่จริงแล้วการจัดทำดัชนีโดยใช้พารามิเตอร์นั้นเป็นทางเลือกเช่นเราอาจยืนยันความไม่แน่นอนของตัวเองโดยใช้การแจกแจงผ่านฟังก์ชั่นโดยตรง (ดูที่ Neal และ Williams ในกระบวนการ Gaussian) และเราไม่จำเป็นต้องมีมุมมองที่เฉพาะเจาะจงของ 'การสุ่ม' เพื่อแสดงถึงความไม่แน่นอนด้วยแคลคูลัสความน่าจะเป็น การอนุมานจากการสุ่มตัวอย่าง (ทฤษฎี) อาจต้องการทฤษฎีดังกล่าว แต่เท่าที่ฉันสามารถเห็น Bayesianism ไม่ได้ (หรืออย่างน้อยก็ไม่จำเป็นต้องเป็น)
conjugateprior

2
ฉันไม่เห็นด้วยที่ Bayesian สันนิษฐานว่าพารามิเตอร์มีค่าคงที่และเป็นเพียงความไม่แน่นอนส่วนตัวของพวกเขาที่ผลักดันให้พวกเขากำหนดพารามิเตอร์เป็นการกระจายแทนที่จะเป็นจุด ฉันพยายามที่จะขยายในคำตอบของฉัน ความไม่แน่นอนส่วนบุคคล / ทางทฤษฎีของคุณเป็นส่วนหนึ่งของการกระจายตัว แต่สำหรับผมแล้วแบบจำลองของคุณนั้นมีค่าเฉลี่ยอยู่ในตัวแปรที่เหลือจากตัวแบบและสร้างการกระจายตัวแม้ว่าคุณจะเป็นนักบวชส่วนตัวอย่างแม่นยำก็ตาม
Wayne

29

แนวคิดเกี่ยวกับความน่าจะเป็นแบบเบย์นั้นไม่จำเป็นต้องเป็นเรื่องส่วนตัว (cf Jaynes) ความแตกต่างที่สำคัญที่นี่คือ Bayesian พยายามที่จะกำหนดสถานะของความรู้ของเขา / เธอเกี่ยวกับมูลค่าของพารามิเตอร์โดยการรวมการกระจายก่อนหน้าสำหรับค่าที่เป็นไปได้กับความน่าจะเป็นซึ่งสรุปข้อมูลที่มีอยู่ในการสังเกตบางอย่าง ดังนั้นในฐานะที่เป็น Bayesian ฉันจะบอกว่าฉันมีความสุขกับความคิดที่ว่าพารามิเตอร์มีค่าจริงซึ่งไม่ทราบแน่ชัดและจุดประสงค์ของการแจกแจงหลังคือการสรุปสิ่งที่ฉันรู้เกี่ยวกับคุณค่าที่เป็นไปได้ ขึ้นอยู่กับสมมติฐานก่อนหน้าและข้อสังเกตของฉัน

ตอนนี้เมื่อฉันสร้างแบบจำลองรูปแบบไม่ใช่ความจริง ดังนั้นในบางกรณีพารามิเตอร์ในคำถามจะมีอยู่ในความเป็นจริง (เช่นน้ำหนักเฉลี่ยของวอมแบต) และในบางคำถามก็ไม่ได้ (เช่นค่าที่แท้จริงของพารามิเตอร์การถดถอย - โมเดลการถดถอยเป็นเพียงตัวอย่างของผลลัพธ์ของ กฎทางกายภาพที่ควบคุมระบบซึ่งอาจไม่ได้ถูกจับโดยแบบจำลองการถดถอยทั้งหมด) ดังนั้นการบอกว่ามีค่าพารามิเตอร์คงที่หนึ่งค่าในโลกแห่งความจริงไม่จำเป็นต้องเป็นจริง

ในทางกลับกันฉันขอแนะนำให้ผู้ใช้บ่อยที่สุดจะบอกว่ามีค่าจริงสำหรับสถิติ แต่พวกเขาไม่รู้ว่ามันคืออะไร แต่พวกเขามีตัวประมาณค่าและช่วงความเชื่อมั่นของพวกเขาซึ่ง (ในแง่หนึ่ง) ) ประเมินความไม่แน่นอนของพวกเขาเกี่ยวกับความน่าเชื่อถือของค่าต่าง ๆ (แต่แนวคิดเรื่องความน่าจะเป็นที่บ่อยครั้งทำให้พวกเขาไม่สามารถแสดงสิ่งนี้ได้โดยตรง)


ฉันมักจะคิดว่า "ความน่าจะเป็นอัตนัย" ถูกเรียกว่าอัตนัยเพราะพวกเขาอ้างถึงคุณสมบัติของผู้ทำการคำนวณ (เช่นความรู้ของเธอ) มากกว่าทรัพย์สินของความเป็นจริงวัตถุประสงค์ (เช่นการกระจายน้ำหนักของลูกเต๋าที่ไม่สมบูรณ์ - ยุติธรรม)
nikie

1
α

ฉันรู้ แต่พวกเขายังมีความน่าจะเป็นอัตวิสัยใช่มั้ย เพราะพวกเขายังคงอธิบายความรู้ของผู้เข้าร่วมการวิจัยเกี่ยวกับพารามิเตอร์บางตัว (ซึ่งสำหรับผู้ที่ใช้บ่อยจะไม่เป็นตัวแปรสุ่มเลย)
nikie

ไม่จำเป็นต้องมีหัวเรื่อง ชุดของหุ่นยนต์หรือคอมพิวเตอร์ทุกเครื่องสามารถทำการคำนวณแบบเดียวกันและมาถึงข้อสรุปเดียวกันไม่ว่าจะใช้วิธีเบส์เซียนประจำ มันเป็นรัฐของความรู้โดยไม่คำนึงถึงเรื่องการดำเนินการคำนวณซึ่งเป็นเหตุผลที่มันเป็นไปตามวัตถุประสงค์มากกว่าอัตนัย
Dikran Marsupial

16

ในประเด็นหลักของคุณในการวิเคราะห์ข้อมูลแบบเบย์ (ฉบับที่ 3, 93) Gelman ก็เขียนเช่นกัน

จากมุมมองของการวิเคราะห์ข้อมูลแบบเบย์เรามักจะสามารถตีความการประมาณจุดแบบคลาสสิกเป็นแบบสรุปที่แน่นอนหรือโดยประมาณตามแบบจำลองความน่าจะเป็นแบบเต็มนัยโดยนัย ในความจริงแล้วเราสามารถใช้ทฤษฎีแบบซีมโทติคเพื่อสร้างข้ออ้างเชิงทฤษฎีแบบเบส์สำหรับการอนุมานโอกาสสูงสุดแบบคลาสสิก

ดังนั้นอาจไม่ใช่ Bayesians ที่ควร "ยอมรับ" ที่จริงแล้วมีค่าพารามิเตอร์จริงเพียงอย่างเดียว แต่ผู้ที่ใช้บ่อยควรสนใจสถิติของ Bayesian เพื่อปรับขั้นตอนการประมาณค่าของพวกเขา! (ฉันพูดแบบนี้ด้วยลิ้นอย่างแน่นหนาในแก้ม)

ราคา(θ|Y)

แต่ความคิดที่ว่ามีพารามิเตอร์เดียวในธรรมชาติหรือในระบบสังคมเป็นเพียงสมมติฐานที่ทำให้เข้าใจง่าย อาจมีกระบวนการหรูหราที่สร้างผลลัพธ์ที่สังเกตได้ แต่การค้นพบว่าระบบนั้นซับซ้อนอย่างไม่น่าเชื่อ สมมติว่ามีค่าพารามิเตอร์คงที่เดียวช่วยลดความยุ่งยากของปัญหาได้อย่างมาก ฉันคิดว่าสิ่งนี้จะตัดประเด็นหลักของคำถามของคุณ: Bayesians ไม่ควร "ยอมรับ" เพื่อทำให้การทำให้เข้าใจง่ายนี้มากกว่าที่ควรเป็นประจำ


คุณคิดอย่างละเอียดหรือไม่ว่าทำไมคุณถึงปฏิเสธการอนุมานแบบเบย์โดยพิจารณาจากความน่าจะเป็นเชิงอัตวิสัย ตำราการเกริ่นนำที่ฉันได้อ่าน (Kruschke, Lynch) ดูเหมือนว่าจะเป็นแบบนั้น มันเป็นเพียงบางส่วนหรือไม่ (มาจากก่อนหน้านี้)?
ATJ

@ ATJ ฉันหวังว่าสิ่งนี้จะชี้แจงประเด็นของฉัน มีข้อโต้แย้งอื่น ๆ ที่เราสามารถก้าวไปได้ แต่จุดยึดที่แท้จริงสำหรับฉันคือการอนุมานโดยนัยที่ว่าสถิติแบบเบย์นั้นเป็นอัตนัยในรูปแบบที่กระบวนทัศน์อื่นไม่ได้เป็น ตัวอย่างเช่นฉันจะเถียงกับตัวละครในคำพูดของแบร์นด์เพราะดูเหมือนว่า "ส่วนตัว" เพื่อสนับสนุนวิธีการประมาณค่าแบบไม่ลำเอียงเหนือกรอบของความผันแปรด้านหลัง
Reinstate Monica

@ ATJ ตำราแนะนำบอกเล่าเรื่องราวเพื่อกระตุ้นวิธีการ บางอย่างเช่นเรื่องนี้อาจเป็นแรงบันดาลใจให้กับวิธีการต่างๆ แต่นั่นไม่ได้หมายความว่าเรื่องราวนั้นมีอิทธิพลอย่างมากต่อสมมติฐานที่ผู้คนใช้ในการฝึกวิธีการเหล่านั้น (และเรื่องราวอาจไร้สาระ: ตัวอย่างเช่นความคิดที่ว่าความน่าจะเป็นที่เกี่ยวข้องกับสถิติสามารถกำหนดได้ในแง่ของความถี่ในทางที่บางครั้งตำราตำราแนะนำเบื้องต้นบอกว่าไม่สมเหตุสมผล - เอกสาร "15 อาร์กิวเมนต์" ของ Google Alan Hajek นั่นไม่ได้หมายความว่าสถิติผู้ใช้งานบ่อยไม่ทำงาน แต่ก็มี)
ดาวอังคาร

8

คุณคิดว่ามี "พารามิเตอร์คงที่ที่แท้จริง" เดียวสำหรับบางสิ่งบางอย่างเช่นการมีส่วนร่วมของการดื่มนมเพื่อการเจริญเติบโตของเด็กหรือไม่? หรือเพื่อลดขนาดของเนื้องอกตามปริมาณของสารเคมี X ที่คุณฉีดเข้าไปในร่างกายของผู้ป่วย? เลือกโมเดลที่คุณคุ้นเคยและถามตัวคุณเองว่าคุณเชื่อจริงหรือไม่ว่ามีค่าจริงค่าสากลที่แม่นยำและแน่นอนสำหรับแต่ละพารามิเตอร์แม้ในทางทฤษฎี

ไม่สนใจข้อผิดพลาดในการวัดเพียงดูที่แบบของคุณราวกับว่าการวัดทั้งหมดนั้นมีความแม่นยำอย่างสมบูรณ์แบบและแม่นยำอย่างไม่สิ้นสุด ระบุโมเดลของคุณคุณคิดว่าพารามิเตอร์แต่ละตัวมีค่าจุดเฉพาะตามความเป็นจริงหรือไม่

ข้อเท็จจริงที่ว่าคุณมีแบบจำลองแสดงว่าคุณกำลังทิ้งรายละเอียดบางอย่างเอาไว้ แบบจำลองของคุณจะมีจำนวนที่ไม่แน่ชัดเพราะคุณเฉลี่ยค่าพารามิเตอร์ / ตัวแปรที่คุณไม่ได้ทำเพื่อที่จะสร้างแบบจำลอง - เป็นการแสดงถึงความเป็นจริงที่ง่ายขึ้น (เช่นเดียวกับที่คุณไม่ได้ทำแผนที่ 1: 1 ของดาวเคราะห์เสร็จสมบูรณ์พร้อมรายละเอียดทั้งหมด แต่จะเป็นแผนที่ 1: 10,000,000 หรือความเรียบง่ายเช่นนี้แผนที่เป็นแบบจำลอง)

เมื่อระบุว่าคุณเฉลี่ยค่าเฉลี่ยของตัวแปรด้านซ้ายพารามิเตอร์สำหรับตัวแปรที่คุณรวมไว้ในแบบจำลองของคุณจะเป็นการแจกแจงไม่ใช่ค่าจุด

นั่นเป็นเพียงส่วนหนึ่งของปรัชญา Bayesian - ฉันเพิกเฉยต่อความไม่แน่นอนเชิงทฤษฎี, ความไม่แน่นอนในการวัด, นักบวช ฯลฯ - แต่สำหรับฉันแล้วความคิดที่ว่าพารามิเตอร์ของคุณมีการแจกแจงทำให้เข้าใจได้ง่ายในลักษณะเดียวกับสถิติเชิงพรรณนา การกระจาย


6

แต่ Bayesians ในทางทฤษฎียอมรับว่ามีค่าคงที่ที่แท้จริงเพียงค่าเดียวใน 'โลกแห่งความจริง'

θ0θ0


2

ถ้าเราไปและจับคู่ Bayesianism กับจักรวาลที่กำหนดขึ้น (ก่อนที่คุณจะพูดอะไรกับคำว่า 'ควอนตัม' ในนั้นอารมณ์ขันฉันและจำได้ว่านี่ไม่ใช่ฟิสิกส์

ทำให้สมมติฐานของเราชัดเจน:

  1. เรามีตัวแทน Bayesian ที่เป็นส่วนหนึ่งและสังเกตการณ์จักรวาลที่กำหนดขึ้น
  2. เอเจนต์มีทรัพยากรการคำนวณ จำกัด

ตอนนี้จักรวาลที่กำหนดขึ้นอาจเป็นที่ที่อะตอมเป็นลูกบอลบิลเลียดเล็ก ๆ ของนิวตัน มันอาจจะไม่ใช่ควอนตัมทั้งหมด สมมติว่ามันเป็น

ตัวแทนตอนนี้พลิกเหรียญยุติธรรม ลองคิดดูสักครู่เหรียญที่เป็นธรรมประกอบขึ้นในจักรวาลที่กำหนดไว้อย่างไร เหรียญที่มีอัตราส่วนความน่าจะเป็น 50/50 หรือไม่?

แต่มันถูกกำหนดไว้แล้ว! ด้วยพลังการประมวลผลที่เพียงพอคุณสามารถคำนวณได้ว่าเหรียญจะลงสู่พื้นดินอย่างไรโดยการจำลองรูปแบบของเหรียญที่พลิกในลักษณะเดียวกัน

ในจักรวาลที่กำหนดขึ้นได้เหรียญที่ยุติธรรมจะเป็นแผ่นโลหะที่มีความหนาแน่นสม่ำเสมอ ไม่มีแรงบังคับให้ใช้เวลากับหน้าหนึ่งลงมากกว่าอีกหน้าหนึ่ง (ลองคิดดูว่าฟังก์ชั่นลูกเต๋ามีน้ำหนักอย่างไร)

ตัวแทนจึงพลิกเหรียญที่ยุติธรรม ทว่าตัวแทนยังไม่แข็งแกร่งพอ ไม่มีตาแหลมคมพอที่จะวัดว่าเหรียญหมุนอย่างไรเมื่อมันพลิก แต่มันเบลอ

ดังนั้นมันจึงบอกว่า "เหรียญนี้จะขึ้นฝั่งด้วยความน่าจะเป็น 50%" การขาดข้อมูลนำไปสู่ความน่าจะเป็น

เราอาจดูที่ช่องว่างของการโยนเหรียญ ระบบพิกัดหลายมิติขนาดใหญ่พร้อมแกนที่เกี่ยวข้องกับทิศทางการโยนแรงการโยนการหมุนของเหรียญความเร็วและทิศทางของลมและอื่น ๆ จุดเดียวในพื้นที่นี้สอดคล้องกับ coinflip เดียวที่เป็นไปได้

ถ้าเราถามตัวแทนจากก่อนถึงสีในระบบพิกัดที่มีการไล่ระดับสีเทาที่สอดคล้องกับการมอบหมายความน่าจะเป็นของหัวสำหรับการโยนทุกครั้งที่ได้รับ

หากเราค่อยๆให้คอมพิวเตอร์ภายในที่มีประสิทธิภาพมากขึ้นซึ่งใช้ในการคำนวณความน่าจะเป็นของหัวมันจะสามารถทำให้สีมีความฉลาดมากขึ้น ในที่สุดเมื่อเราให้คอมพิวเตอร์ภายในที่ทรงพลังที่สุดทำให้มันรอบรู้มันจะทาสีกระดานหมากรุกที่แปลกประหลาด

เหรียญที่เป็นธรรมไม่ได้ทำมาจากความน่าจะเป็นที่ทำจากโลหะ ความน่าจะเป็นมีอยู่ในโครงสร้างการคำนวณเท่านั้น ดังนั้น Bayesian พูดว่า


-3

มีนักบวชที่ไม่เหมาะสมเช่นเจฟฟรีย์ซึ่งมีความสัมพันธ์บางอย่างกับเมทริกซ์ข้อมูลฟิชเชอร์ จากนั้นมันจะไม่เป็นอัตวิสัย


2
คุณช่วยอธิบายเพิ่มเติมเกี่ยวกับความสัมพันธ์ในอดีตของเจฟฟรีย์กับความสัมพันธ์ของข้อมูลฟิชเชอร์ได้อย่างไรซึ่งการอนุมานแบบเบย์นั้นไม่ใช่เรื่องส่วนตัว ดังที่ฉันเข้าใจแล้วเหตุผลหลักในการใช้งานก่อนหน้าของ Jeffreys ก็คือมันไม่แปรเปลี่ยนไปจากการกำหนดพารามิเตอร์ทางเลือกของโมเดล นอกจากนี้ในการตั้งค่าหลายมิติก่อนหน้าของ Jeffreys เหล่านี้สามารถให้ข้อมูลได้สูงและผลลัพธ์นั้นเป็นที่ถกเถียงกัน (Gelman, BDA 3, p. 53) สิ่งนี้บ่อนทำลาย 'ความเที่ยงธรรม' หรือไม่?
Reinstate Monica

@ user777 เนื่องจากมันขึ้นอยู่กับพารามิเตอร์ของความหนาแน่นในมือมันเป็นวัตถุประสงค์ สมมติว่าฉันเพิ่มความน่าจะเป็นคูณด้วย 1 ฉันจะได้รับ subjetive ก่อนความน่าจะเป็นหรือไม่? เนื่องจากความน่าจะเป็นหลังนั้นสัมพันธ์กับความน่าจะเป็น x ก่อนหน้า
นักวิเคราะห์

และบ่อยครั้งที่ต้องเรียกใช้สัจพจน์ของ The True Model หากพวกเขาต้องการใช้โอกาส ... :)
นักวิเคราะห์
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.