พวกเราเป็นผู้ใช้ชีวิตประจำวันเพียงแค่บอกเป็นนัย / ไม่เต็มใจเบย์หรือไม่?


15

สำหรับปัญหาการอนุมานที่กำหนดเรารู้ว่าวิธีการแบบเบย์มักจะแตกต่างกันทั้งในรูปแบบและผลที่ได้จากวิธี fequentist ผู้ใช้บ่อย (มักจะรวมถึงฉัน) มักจะชี้ให้เห็นว่าวิธีการของพวกเขาไม่จำเป็นต้องมีก่อนและด้วยเหตุนี้ "ข้อมูลที่ขับเคลื่อน" มากกว่า "การตัดสินใจที่ขับเคลื่อน" แน่นอนว่า Bayesian สามารถชี้ไปที่นักบวชที่ไม่ให้ข้อมูลหรือใช้ประโยชน์ได้เพียงแค่ใช้การกระจายก่อนหน้านี้จริงๆ

ความกังวลของฉันโดยเฉพาะอย่างยิ่งหลังจากที่รู้สึกถึงความอับอายขายหน้าในความเป็นกลางของฉันนั่นอาจเป็นวิธีการ "วัตถุประสงค์" ของฉันที่อ้างว่าเป็นสูตรในกรอบของ Bayesian แม้ว่าจะมีรูปแบบข้อมูลและรูปแบบแปลก ๆ ในกรณีนั้นฉันเพิ่งรู้ตัวถึงความอลหม่านก่อนหน้านี้อย่างมีความสุขและแบบจำลองวิธีการที่ใช้บ่อยของฉันบอกเป็นนัย ๆ ?

ถ้าชาวเบย์ชี้ให้เห็นการกำหนดเช่นนี้ฉันคิดว่าปฏิกิริยาแรกของฉันคือการพูดว่า "ก็ดีที่คุณสามารถทำได้ แต่นั่นไม่ใช่วิธีที่ฉันคิดเกี่ยวกับปัญหา!" อย่างไรก็ตามใครสนใจว่าฉันคิดอย่างไรหรือฉันกำหนดมันอย่างไร หากกระบวนการของฉันมีค่าทางสถิติ / เชิงคณิตศาสตร์เทียบเท่ากับแบบจำลอง Bayesian บางรุ่นฉันก็จะอนุมาน Bayesian โดยไม่เจตนา ( โดยไม่เจตนา !)

คำถามจริงด้านล่าง

การตระหนักถึงสิ่งนี้ได้ทำลายสิ่งล่อใจใด ๆ แต่ผมไม่แน่ใจว่าถ้าเป็นความจริงที่ว่ากระบวนทัศน์แบบเบย์สามารถรองรับขั้นตอนการ frequentist ทั้งหมด (อีกครั้งให้คชกรรมเลือกที่เหมาะสมน่าจะเป็นก่อน) ฉันรู้ว่าการสนทนาเป็นเท็จ

ฉันถามสิ่งนี้เพราะฉันเพิ่งโพสต์คำถามเกี่ยวกับการอนุมานตามเงื่อนไขซึ่งนำฉันไปสู่บทความต่อไปนี้: ที่นี่ (ดู 3.9.5,3.9.6)

พวกเขาชี้ให้เห็นผลลัพธ์ที่เป็นที่รู้จักกันดีของบาซึว่าสามารถมีได้มากกว่าหนึ่งสถิติขึ้นทะเบียนขอร้องคำถามที่ "ส่วนย่อยที่เกี่ยวข้อง" มีความเกี่ยวข้องมากที่สุด ยิ่งแย่ไปกว่านั้นพวกเขาแสดงตัวอย่างที่สองถึงแม้ว่าคุณจะมีสถิติพิเศษที่ไม่ซ้ำกัน แต่ก็ไม่ได้กำจัดส่วนย่อยอื่น ๆ ที่เกี่ยวข้อง

พวกเขายังสรุปได้ว่ามีเพียงวิธีการแบบเบย์ (หรือวิธีการที่เทียบเท่ากับพวกเขา) เท่านั้นที่สามารถหลีกเลี่ยงปัญหานี้ได้


อาจไม่ใช่กรณีที่ Bayesian Stats Fequentist Stats - นั่นเป็นคำถามของฉันสำหรับกลุ่มนี้ที่นี่ แต่ปรากฏว่าตัวเลือกพื้นฐานระหว่างกระบวนทัศน์ทั้งสองนั้นอยู่ในปรัชญาน้อยกว่าในเป้าหมาย: คุณต้องการความแม่นยำตามเงื่อนไขสูงหรือข้อผิดพลาดที่ไม่มีเงื่อนไขต่ำ:

  • ดูเหมือนว่าจะมีความแม่นยำตามเงื่อนไขสูงเมื่อเราต้องวิเคราะห์อินสแตนซ์เอกพจน์ - เราต้องการให้ถูกต้องสำหรับการอนุมานนี้ถึงแม้ว่าข้อเท็จจริงที่ว่าวิธีนี้อาจไม่เหมาะสมหรือถูกต้องสำหรับชุดข้อมูลถัดไป (hyper-conditionality / specialization)

  • ข้อผิดพลาดที่ไม่มีเงื่อนไขต่ำมีความเหมาะสมเมื่อหากเราเต็มใจทำการอนุมานที่ไม่ถูกต้องตามเงื่อนไขในบางกรณีตราบใดที่ข้อผิดพลาดในระยะยาวของเราถูกย่อให้เล็กสุดหรือควบคุม สุจริตหลังจากเขียนสิ่งนี้ฉันไม่แน่ใจว่าทำไมฉันถึงต้องการสิ่งนี้เว้นแต่ฉันจะได้รับการรัดเวลาและไม่สามารถทำการวิเคราะห์แบบเบย์ ... hmmm

ฉันมักจะชอบการอนุมาน fequentist ตามโอกาสเนื่องจากฉันได้รับบางส่วน (asymptotic / โดยประมาณ) จากฟังก์ชั่นความน่าจะเป็น แต่ไม่จำเป็นต้องเล่นซอก่อนหน้านี้ - แต่ฉันรู้สึกคุ้นเคยกับการอนุมานแบบเบย์โดยเฉพาะอย่างยิ่ง ฉันเห็นคำศัพท์การทำให้เป็นมาตรฐานก่อนหน้านี้สำหรับการอนุมานตัวอย่างขนาดเล็ก

ขออภัยสำหรับด้านข้าง ความช่วยเหลือใด ๆ สำหรับปัญหาหลักของฉันคือการชื่นชม


1
การแก้ไขโพสต์ดูเหมือนจะทำให้ลิงก์สับสน แต่มีข้อมูลไม่เพียงพอสำหรับฉันที่จะแก้ไข
Dikran Marsupial

@DikranMarsupial ขอบคุณสำหรับการสังเกตเห็นว่า ฉันเพิ่มกลับมาในลิงค์

คำตอบ:


3

ฉันจะยืนยันว่าบ่อยครั้งที่บ่อยครั้ง "โดยปริยาย / ไม่รู้ Bayesians" ในทางปฏิบัติเรามักจะต้องการเหตุผลที่น่าจะเป็นไปได้เกี่ยวกับสิ่งต่าง ๆ ที่ไม่มีความถี่ในระยะยาว ตัวอย่างคลาสสิกที่เป็น Null Hypothesis Statistics Testing (NHST) ซึ่งสิ่งที่เราอยากรู้คือความน่าจะเป็นสัมพัทธ์ของ Null และสมมติฐานของการวิจัยเป็นจริง แต่เราไม่สามารถทำสิ่งนี้ในการตั้งสมมติฐานบ่อย ๆ เพราะความจริงของสมมติฐานเฉพาะไม่มี ความถี่ระยะยาว (ไม่สำคัญ) - เป็นจริงหรือไม่ก็ได้ NHST ที่พบบ่อยได้แก้ไขสิ่งนี้โดยการแทนที่คำถามที่แตกต่าง "ความน่าจะเป็นที่จะสังเกตผลลัพธ์อย่างน้อยที่สุดภายใต้สมมติฐานว่าง" แล้วเปรียบเทียบกับเกณฑ์ที่กำหนดไว้ล่วงหน้า อย่างไรก็ตามขั้นตอนนี้ไม่ได้มีเหตุผล ทำให้เราสามารถสรุปอะไรก็ได้เกี่ยวกับว่า H0 หรือ H1 เป็นจริงหรือไม่และในการทำเช่นนั้นเรากำลังก้าวออกจากกรอบการทำงานประจำไปสู่ ​​Bayesian (โดยทั่วไปคืออัตนัย) ซึ่งเราสรุปได้ว่าความน่าจะเป็นในการสังเกต ต่ำมากจนเราไม่สามารถเชื่อได้ว่า H0 นั้นน่าจะเป็นจริงอีกต่อไป (โปรดทราบว่านี่เป็นการกำหนดความน่าจะเป็นโดยนัยให้กับสมมติฐานเฉพาะ)

αพี(H0)พี(H1)

ป้อนคำอธิบายรูปภาพที่นี่

α

ช่วงความเชื่อมั่นที่มีเนื้อหามักจะใช้ (และตีความว่าเป็น) ช่วงเวลาที่เราสามารถคาดหวังที่จะเห็นการสังเกตด้วยความน่าจะเป็นที่กำหนดซึ่งอีกครั้งคือการตีความแบบเบย์

นักสถิติอุดมคติควรตระหนักถึงประโยชน์และข้อเสียของวิธีการทั้งสองและเตรียมที่จะใช้กรอบที่เหมาะสมสำหรับการประยุกต์ใช้ในมือ โดยพื้นฐานแล้วเราควรตั้งเป้าหมายที่จะใช้การวิเคราะห์ที่ให้คำตอบที่ตรงที่สุดกับคำถามที่เราต้องการคำตอบ (และไม่แทนที่คำตอบที่ต่างกันอย่างเงียบ ๆ ) ดังนั้นแนวทางแบบประจำอาจจะมีประสิทธิภาพมากที่สุดที่เราสนใจในระยะยาว วิธีการแบบเบย์ในกรณีที่ไม่เป็นเช่นนั้น

H0


2
พี<0.05

3
ฉันคิดว่ามันทำงานเป็นคำวิจารณ์ของสถิติ "โมฆะพิธีกรรม" ซึ่ง NHST ถูกใช้เป็นสูตรจากตำราอาหารสถิติโดยไม่ต้องคิด / เข้าใจขั้นตอน (อาจรวมถึงฉันเมื่อฉันเริ่มออกไป
Dikran Marsupial

2
ฉันคิดว่าปัญหาใหญ่ของ NHST นั้นน้อยกว่า ritualized p <0.05 และมากกว่านั้นซึ่งมันเป็นการ จำกัด พื้นที่ของสมมติฐาน ฉันหมายถึงพวกเขาไม่ได้พิจารณา (ตามสมมติฐาน) ด้วยเหตุผลอื่น ๆ อีกมากมายที่จะมืดมากกว่า "ดวงอาทิตย์ระเบิด" นี่คือสิ่งที่ฉันไม่ชอบเกี่ยวกับ NHST ... มันเป็นสิ่งอนุรักษ์นิยมต่อ null นอกจากนี้ฉันสงสัยว่าพลังของการทดสอบนี้จะเป็นอย่างไร

1
H0

@DikranMarsupial เห็นด้วย! ฟิชเชอร์มองเห็นพวกเขาช่วยในการทดลองทางการเกษตรซึ่งเป็นที่ที่ค่า p มาจาก การประเมินสารกำจัดศัตรูพืชและปุ๋ยไม่มีอะไรที่เหมือนกับการประเมินคำถามอัตถิภาวนิยมแบบไม่ลอกเลียนแบบ ... เป็นเครื่องมือที่ผิดสำหรับงาน

4

Bayesians และ Frequentists ไม่เพียง แต่แตกต่างกันในวิธีการที่พวกเขาได้รับการอนุมานหรือวิธีการอนุมานที่คล้ายกันหรือแตกต่างกันสามารถมีความไม่แน่นอนทางเลือกก่อนบางอย่าง ความแตกต่างที่สำคัญคือวิธีที่พวกเขาตีความความน่าจะเป็น:

ความน่าจะเป็นแบบเบย์ :

ความน่าจะเป็นแบบเบย์คือการตีความแนวคิดหนึ่งของความน่าจะเป็น ตรงกันข้ามกับการตีความความน่าจะเป็นความถี่หรือความโน้มเอียงของปรากฏการณ์บางอย่างความน่าจะเป็นแบบเบย์คือปริมาณที่ได้รับมอบหมายให้เป็นตัวแทนของความรู้หรือสถานะของความเชื่อ

ความน่าจะเป็นผู้พบบ่อย :

ความน่าจะเป็นของผู้ใช้บ่อยหรือความเป็นประจำคือการตีความความน่าจะเป็นมาตรฐาน มันกำหนดความน่าจะเป็นของเหตุการณ์เป็นขีด จำกัด ของความถี่สัมพัทธ์ในการทดลองจำนวนมาก การตีความนี้สนับสนุนความต้องการทางสถิติของนักวิทยาศาสตร์การทดลองและการสำรวจความคิดเห็น ความน่าจะเป็นสามารถพบได้ (ในหลักการ) โดยกระบวนการเป้าหมายที่ทำซ้ำได้ (และเป็นความผิดพลาดทางความคิด) มันไม่รองรับทุกความต้องการ นักพนันต้องการการประมาณราคาโดยไม่ต้องทำการทดลอง

คำจำกัดความทั้งสองนี้แสดงถึงแนวทางที่ไม่สามารถแก้ไขได้สองวิธีในการกำหนดแนวคิดของความน่าจะเป็น (อย่างน้อยก็จนถึงตอนนี้) ดังนั้นจึงมีความแตกต่างพื้นฐานระหว่างพื้นที่ทั้งสองนี้มากกว่าว่าคุณจะได้รับตัวประมาณค่าที่คล้ายกันหรือข้อสรุปเดียวกันในแบบจำลองพารามิเตอร์หรือแบบไม่พารามิเตอร์


1
ฉันไม่คิดว่าพวกเขาจะเข้ากันไม่ได้อย่างสมบูรณ์ความถี่ในระยะยาวเป็นพื้นฐานที่เหมาะสมอย่างยิ่งสำหรับสถานะของความรู้หรือความเชื่อ
Dikran Marsupial

@DikranMarsupial จริง ๆ แล้วนี่เป็นปัญหาเปิดในปรัชญาวิทยาศาสตร์ ฉันเห็นประเด็นของคุณแล้ว แต่การปรองดองนั้นไม่ตรงไปตรงมา
Pollo Anabolico

ยูnเสื้อผมโอnaล.ล.Y

แน่นอนว่าผู้ใช้ประจำจะเทียบเท่ากันได้หากมีการใช้อะนาล็อกประจำทุกขั้นตอนแบบเบย์ซึ่งไม่เป็นความจริงเพราะเบย์สามารถพูดถึงความน่าจะเป็นสำหรับสิ่งต่าง ๆ โดยไม่ใช้ความถี่ในระยะยาว
Dikran Marsupial

@DikranMarsupial ใช่นั่นคือเหตุผลที่ฉันถามว่า fequentist เป็นส่วนหนึ่งของ Bayesian (ฉันยอมรับว่าการสนทนาเป็นที่รู้กันว่าเป็นเท็จ)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.