ลองคิดเหมือนเบย์เซียนลองดูบ่อยครั้ง: นั่นหมายความว่ายังไง?


35

ฉันกำลังดูสไลด์บรรยายในหลักสูตรวิทยาศาสตร์ข้อมูลที่สามารถพบได้ที่นี่:

https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf

ฉันโชคไม่ดีที่ไม่สามารถดูวิดีโอสำหรับการบรรยายนี้และ ณ จุดหนึ่งบนสไลด์พรีเซนเตอร์มีข้อความต่อไปนี้:

หลักการสำคัญบางประการ

คิดเหมือนชาว Bayesian ทำเครื่องหมายเหมือนเป็นผู้ใช้บ่อย (การกระทบยอด)

ไม่มีใครรู้ว่าสิ่งที่จริงหมายถึงอะไร ฉันมีความรู้สึกว่ามีความเข้าใจที่ดีเกี่ยวกับโรงเรียนแห่งความคิดสองแห่งที่จะรวบรวมจากสิ่งนี้


2
คิดว่าอาจเกี่ยวข้องกับการตรวจสอบรูปแบบ: ดูทำไม Bayesian จึงไม่ได้รับอนุญาตให้ดูสิ่งตกค้าง .
Scortchi - Reinstate Monica

@Scortchi จากสิ่งที่ฉันรวบรวมไม่จำเป็นต้องทำอะไรกับการแยกการฝึกอบรมการตรวจสอบความถูกต้องและชุดข้อมูลการทดสอบในทางใดทางหนึ่งหรืออาจเป็นแบบ Bayesian ไม่ได้รับอนุญาตให้ปรับระดับนักบวชแม้ในระหว่างขั้นตอนการฝึกอบรม ที่นี่) อย่างไรก็ตามฉันยังคงสับสนกับความหมายของการเช็คเหมือนเป็นนัก ...
Luca

1
Bayesian ที่ "เหมาะสม" จะไม่ปรับ Priors ของตนเอง แต่จะอัพเดตเฉพาะพวกเขาตามข้อมูลใหม่โดยใช้ทฤษฎีบทของ Bayes แต่ฉันแค่คาดเดาว่า "หลักการสำคัญ" นี้อาจเกิดขึ้นได้อย่างไร
Scortchi - Reinstate Monica

4
ฉันไม่สามารถโหลดลิงค์ได้ ฉันเดาว่าพวกเขาหมายถึงแม้ว่าคุณจะใช้วิธีการแบบเบย์คุณควรใส่ใจเกี่ยวกับลักษณะการทำงานของผู้ใช้บ่อย: ถ้าคุณสร้างช่วงเวลาที่น่าเชื่อถือ 95% ที่แน่นหนาที่สุด แต่ในทางปฏิบัติครอบคลุมพารามิเตอร์จริงที่น่าสนใจ 20% ของเวลา คุณควรกังวล Bayesian ที่แข็งเกินไปอาจพูดว่า "ไม่" (แต่มีน้อยมากที่ Bayesians ของความแข็งแกร่งดังกล่าวมีอยู่จริง)
หน้าผา AB

3
มองไปข้างหน้าสู่สไลด์ในอนาคตพวกเขาเห็นชอบ Empirical Bayes สามารถมองเห็นได้บนสไลด์ชุด
หน้าผา AB

คำตอบ:


32

ความแตกต่างที่สำคัญระหว่าง Bayesian และโรงเรียนสถิติเกิดขึ้นเนื่องจากความแตกต่างในการตีความของความน่าจะเป็น ความน่าจะเป็นแบบเบย์คือคำแถลงเกี่ยวกับความเชื่อส่วนบุคคลที่เหตุการณ์ (หรือมี) เกิดขึ้น ความน่าจะเป็นประจำคือคำสั่งเกี่ยวกับสัดส่วนของเหตุการณ์ที่คล้ายกันที่เกิดขึ้นในขีด จำกัด เมื่อจำนวนเหตุการณ์เหล่านั้นเพิ่มขึ้น

สำหรับฉัน "การคิดแบบเบย์" หมายถึงการอัปเดตความเชื่อส่วนตัวของคุณเมื่อมีข้อมูลใหม่เกิดขึ้นและ "ตรวจสอบ [หรือกังวล] เหมือนผู้ใช้บ่อย" หมายถึงการเกี่ยวข้องกับประสิทธิภาพของกระบวนการทางสถิติที่รวบรวมตลอดเวลาที่ใช้ เช่นความครอบคลุมของช่วงเวลาที่น่าเชื่อถืออัตราความผิดพลาดของ Type I / II คืออะไร ฯลฯ


1
ขอบคุณสำหรับคำตอบ. รัดกุมและมีประสิทธิภาพแม้สำหรับคนธรรมดาอย่างฉัน!
Luca

2
เป็นไปไม่ได้ที่จะตรวจสอบหรือกังวลเหมือนชาวเบย์โดยการตรวจสอบอิทธิพลของนักบวชหรือการใช้ผู้ที่ไม่ให้ข้อมูล สิ่งนี้ใช้ได้เฉพาะกับการวิเคราะห์ตามลำดับหรือไม่ มีงานจำนวนมากเกี่ยวกับการที่สถิติแบบเบย์และบ่อยครั้งตัดกับการวิเคราะห์ตามลำดับ "การปรับปรุงความเชื่อ" นั้นไม่สำคัญและสถิติเชิงลึกสามารถทำได้อย่างเข้มงวดในการตั้งค่าผู้ใช้บ่อย
AdamO

1
ใช่มันเป็นไปได้ที่จะกังวลเช่น Bayesian เช่นการตรวจสอบอิทธิพลของคุณก่อน ไม่คำตอบของฉันไม่เพียง แต่ใช้กับการวิเคราะห์ตามลำดับเช่นข้อมูลใหม่อาจเกิดขึ้นทั้งหมดในครั้งเดียว
jaradniemi

15

สถิติแบบเบย์สรุปความเชื่อในขณะที่สถิติผู้ใช้บ่อยสรุปหลักฐาน ชาวเบย์มองว่าความน่าจะเป็นระดับความเชื่อ การใช้เหตุผลแบบรวมและแบบก่อกำเนิดนี้มีประโยชน์สำหรับการกำหนดสมมติฐาน ยกตัวอย่างเช่น Bayesians อาจกำหนดความน่าจะเป็นบางอย่างให้กับความคิดที่ว่าดวงจันทร์ทำจากชีสสีเขียวโดยไม่คำนึงว่านักบินอวกาศสามารถเดินทางไปที่นั่นเพื่อตรวจสอบสิ่งนี้ได้จริงหรือไม่ สมมติฐานนี้อาจได้รับการสนับสนุนจากแนวคิดที่ว่าจากระยะไกลดวงจันทร์จะมองเหมือนชีสสีเขียว บ่อยครั้งที่ผู้ตั้งสมมติฐานไม่สามารถตั้งสมมติฐานที่เป็นมากกว่าคนธรรมดาสามัญและพวกเขาไม่สามารถพูดได้ว่าหลักฐานสนับสนุนสมมติฐานหนึ่งมากกว่าอีกสมมติฐานหนึ่ง โอกาสสูงสุดแม้เพียงสร้างสถิติซึ่งเป็น "ที่สุดสอดคล้องกับสิ่งที่ถูกสังเกต" อย่างเป็นทางการสถิติแบบเบย์ช่วยให้เราคิดนอกกรอบและเสนอความคิดที่ป้องกันได้จากข้อมูล แต่นี่เป็นสมมติฐานที่สร้างขึ้นโดยธรรมชาติ

สถิติที่ใช้บ่อยที่สุดจะถูกนำมาใช้เพื่อยืนยันสมมติฐาน เมื่อการทดสอบดำเนินไปด้วยดีสถิติที่ใช้บ่อยจะให้บริบท "ผู้สังเกตการณ์อิสระ" หรือ "เชิงประจักษ์" ต่อการค้นพบโดยนักบวช ซึ่งสอดคล้องกับปรัชญาของ Karl Popper จุดของหลักฐานไม่ได้เป็นการประกาศความคิดบางอย่าง หลักฐานจำนวนมากสอดคล้องกับสมมติฐานที่ไม่ถูกต้อง หลักฐานที่เป็นเท็จสามารถทำให้เชื่อได้

อิทธิพลของนักบวชโดยทั่วไปถือว่าเป็นอคติในการใช้เหตุผลเชิงสถิติ ดังที่คุณทราบเราสามารถคิดหาเหตุผลมากมายว่าทำไมสิ่งต่าง ๆ เกิดขึ้น ในทางจิตวิทยาหลายคนเชื่อว่าอคติผู้สังเกตการณ์ของเราเป็นผลมาจากนักบวชในสมองของเราที่ทำให้เราไม่ต้องถ่วงน้ำหนักอย่างที่เห็น "ความหวังเมฆสังเกต" ในฐานะแม่สาธุคุณพูดในเนินทราย ตกใจทำให้ความคิดนี้เข้มงวด

สิ่งนี้มีความสำคัญทางประวัติศาสตร์ที่ยิ่งใหญ่ในการทดลองทางวิทยาศาสตร์ที่ยิ่งใหญ่ที่สุดในยุคของเรา ยกตัวอย่างเช่นจอห์นสโนว์ได้รวบรวมหลักฐานการระบาดของโรคอหิวาตกโรคอย่างพิถีพิถันและสรุปว่าอหิวาตกโรคไม่ได้เกิดจากการกีดกันทางศีลธรรมและชี้ให้เห็นว่าหลักฐานมีความสอดคล้องอย่างมากกับการปนเปื้อนของน้ำเสีย: หมายเหตุเขาไม่ได้สรุปสิ่งนี้หิมะค้นพบก่อนวันที่ค้นพบแบคทีเรียและไม่มีกลไกหรือความเข้าใจสาเหตุ พบวาทกรรมที่คล้ายกันในแหล่งกำเนิดของสายพันธุ์ เราไม่รู้จริง ๆ ว่าดวงจันทร์นั้นทำจากชีสสีเขียวหรือไม่จนกว่านักบินอวกาศจะตกลงสู่พื้นผิวและเก็บตัวอย่าง ณ จุดนั้นผู้โพสต์ของชาวเบย์ได้กำหนดความน่าจะเป็นที่ต่ำมากสำหรับความเป็นไปได้อื่น ๆ และผู้ที่ใช้บ่อยที่สุดสามารถกล่าวได้ว่าตัวอย่างไม่สอดคล้องกับสิ่งใดยกเว้นฝุ่นจากดวงจันทร์

โดยสรุปแล้วสถิติแบบเบย์นั้นสามารถคลี่คลายไปสู่การสร้างสมมติฐาน การทำให้มั่นใจว่าข้อมูลถูกรวบรวมอย่างอิสระในความพยายามเหล่านี้เป็นหนึ่งในความท้าทายที่ยิ่งใหญ่ที่สุดที่นักสถิติสมัยใหม่เผชิญ


1
ขอบคุณสำหรับคำตอบ. Plenty of evidence is consistent with incorrect hypothesesอะไรที่คุณหมายถึงเมื่อคุณพูด
Luca

2
@Luca ตัวอย่างทางสถิติทั่วไปอาจพบได้ในการทำให้สับสน ตัวอย่างเช่นฉันอาจพูดว่า "การสูบบุหรี่ช่วยให้ปอดของวัยรุ่นทำงานได้ดีขึ้น" ฉันสามารถไปหาเหตุผลเข้าข้างตนเองเพิ่มเติมโดยบอกว่าการสูบบุหรี่เป็นตัวกระตุ้นที่ส่งเสริมการออกกำลังกายที่ดีขึ้นความอยากอาหารที่ดีต่อสุขภาพและส่งเสริมการขัดเกลาทางสังคมที่ดีขึ้น ถ้าฉันรวบรวมข้อมูลพวกเขาจะแสดงให้เห็นว่าวัยรุ่นที่สูบบุหรี่มีการทำงานของปอดดีขึ้น ข้อสรุปที่เชื่อมโยงนั้นถูกต้อง แต่สาเหตุที่เป็นเท็จ ความสัมพันธ์นั้นสับสนตามอายุเนื่องจากเด็กโตมักจะสูบบุหรี่มากกว่า
AdamO

ขอขอบคุณ! ฉันได้เรียนรู้มากมายจากคำตอบที่เขียนดีมากนี้
Luca

5

ตามCliff ABความเห็นของ OP ดูเหมือนว่าพวกเขากำลังมุ่งหน้าสู่ปรัชญาของ Empirical Bayesian มีโรงเรียนแห่งความคิดหลักสามแห่งคือ Bayesian และEmpirical Bayesคาดการณ์นักบวชจากข้อมูล ที่ไม่สอดคล้องกับคำพูด (ซึ่งหมายถึง Bayes ล่วงหน้ากังวลเหมือนเหมือนกันบ่อยครั้งหลังจากนั้น) แต่เราไม่ควรมองข้ามCliff ABความคิดเห็นที่ยอดเยี่ยม

นอกจากนี้ยังมีและอาจเป็นโรงเรียนแห่งหนึ่งของ Bayesian คิดว่าคุณไม่จำเป็นต้องตรวจสอบอะไรหลังจากขั้นตอน Bayesian ความคิดที่ทันสมัยกว่านี้จะใช้การตรวจสอบแบบคาดการณ์ล่วงหน้าและบางทีวิธีตรวจสอบคำตอบของคุณแบบสองครั้งคือสิ่งที่คำพูดอ้างถึง

นอกจากนี้ปรัชญาที่เกี่ยวข้องกับขั้นตอนบ่อยครั้งมากกว่าการอนุมานจากข้อมูล ดังนั้นบางทีนั่นก็เป็นเงื่อนงำความหมายของคำพูดด้วย


ฉันคิดว่าคุณพูดถึงความคิดเห็นแรกของฉันและความคิดเห็นที่สองของฉันคือหลังจากตรวจสอบอย่างใกล้ชิดคุณถูกต้องแล้วว่าพวกเขาอ้างถึง Empirical Bayes โดยเฉพาะ ฉันผิดหวังจริง ๆ ที่อ้างว่าเป็นเพียงการรับรองของ Empirical Bayes มากกว่าการโทรทั่วไปเพื่อพิจารณาข้อดีของทั้งสองโรงเรียนแห่งความคิด โอ้ดี
หน้าผา AB

2

ในบริบทของคลาสวิทยาศาสตร์ข้อมูลนี้การตีความ "ตรวจสอบเหมือนเป็นประจำ" ของฉันคือการที่คุณประเมินประสิทธิภาพของฟังก์ชันการทำนายหรือฟังก์ชันการตัดสินใจของคุณในข้อมูลการตรวจสอบที่ถูกระงับ คำแนะนำในการ "คิดแบบเบย์" เป็นการแสดงออกถึงความคิดเห็นที่ฟังก์ชั่นการทำนายที่ได้มาจากวิธีการแบบเบย์โดยทั่วไปจะให้ผลลัพธ์ที่ดี


(แสดงเป็นผู้สนับสนุนของปีศาจ :) ทำไม Bayesian approach ควรให้ "ผลลัพธ์ที่ดี" และไม่บ่อยนัก?
ทิม

วิธีการแบบเบย์เป็นตัวกำหนดเกี่ยวกับวิธีการ สถิติของผู้ใช้บ่อยสามารถมองได้ว่าเป็นส่วนหนึ่งของทฤษฎีการตัดสินใจและให้กรอบในการประเมินฟังก์ชั่นการตัดสินใจใด ๆ (ไม่ว่าจะอยู่บนพื้นฐานของแบบเบย์ วิธีการบางอย่างเช่นวิธีความเป็นไปได้สูงสุดมักใช้ในบริบทของผู้ที่ใช้บ่อยเพราะมีคุณสมบัติของนักสะสมที่ดี (เช่นไม่แสดงอาการพวกเขาทำในสิ่งที่ถูกต้องและพวกเขาจะไปได้เร็วกว่าวิธีอื่น ๆ ) วิธีการแบบเบย์สามารถนำมาใช้บ่อยโดยผู้ใช้ แต่พวกเขาจะมีเหตุผลที่แตกต่างกันสำหรับการใช้งาน
DavidR

วิธีการแบบเบย์มีจำนวนมากเหมือนกันกับทฤษฎีการตัดสินใจ ฉันยังไม่คิดว่าวิธีการแบบเบย์สามารถใช้ในบริบทบ่อย ๆ (คุณจะจินตนาการถึงการใช้นักบวชในบริบทของการเป็นประจำได้อย่างไร) - มันค่อนข้างเป็นวิธีอื่น: วิธีการหลายอย่างในการตีความแบบเบส์ ฉันไม่คิดว่าจะมีประเด็นในการพูดคุยเรื่องนี้สิ่งที่ฉันพูดว่างบของคุณเล็กน้อยเกินความจริง
ทิม

หนึ่งสามารถพิสูจน์คุณสมบัติบ่อยๆที่ดีเกี่ยวกับวิธี Bayesian ดังนั้นในการทำสิ่งที่ Bayesian ค่อนข้างปลอดภัยตราบใดที่คุณมีข้อมูลเพียงพอ
DavidR

1
สมมติว่าฉันต้องการประเมินความน่าจะเป็น p ของหัวในการโยนเหรียญ ในฐานะ Bayesian ฉันจะเริ่มด้วยความน่าจะเป็นก่อนหน้านี้ฉันจะสังเกตข้อมูลบางอย่างแล้วฉันจะได้ภาพหลังบน p เราต้องหาค่าประมาณของ p และฉันเลือกใช้ค่าเฉลี่ยของการกระจายหลังของฉันเป็นค่าประมาณ ทั้งหมดบอกว่านี่อธิบายวิธีการจากข้อมูลไปยังการประมาณจุด วิธีนี้สามารถประเมินได้ในวิธีที่ใช้บ่อย: เช่นมันมีอคติหรือไม่? สอดคล้อง? มีประสิทธิภาพเชิงเส้นกำกับหรือไม่ ความจริงที่ว่าก่อนหน้านี้มีส่วนเกี่ยวข้องไม่ควรกังวลกับผู้ที่พบบ่อย
DavidR

1

ดูเหมือนว่า "คิดเหมือนแบบเบย์ตรวจสอบเหมือนเป็นผู้ใช้บ่อย" หมายถึงวิธีการหนึ่งในการออกแบบและวิเคราะห์ทางสถิติ ตามที่ฉันเข้าใจแล้วการคิดแบบเบย์เกี่ยวข้องกับความเชื่อบางอย่างเกี่ยวกับสถานการณ์ก่อนหน้านี้ (จากการทดลองหรือสถิติ) สมมติว่าตัวอย่างเช่นคะแนนการอ่านเฉลี่ยสำหรับนักเรียนชั้นประถม 4 เป็น 80 คำต่อนาทีและการแทรกแซงบางอย่างอาจเพิ่มขึ้นเป็น 90 คำต่อนาที . สิ่งเหล่านี้เป็นความเชื่อบนพื้นฐานของการศึกษาและสมมติฐานก่อนหน้านี้ การคิดเป็นประจำคาดการณ์การค้นพบ (ของการแทรกแซง) เพื่อให้ได้ช่วงความเชื่อมั่นหรือสถิติอื่น ๆ ที่อิงตามความถี่เชิงทฤษฎีและปฏิบัติหรือความน่าจะเป็นของผลลัพธ์เหล่านี้เกิดขึ้นอีกครั้ง (เช่นวิธี "บ่อย") ตัวอย่างเช่นคะแนนการอ่านหลังการแทรกแซงอาจเป็น 91 คำต่อนาทีโดยมีช่วงความมั่นใจ 95% ที่ 85-97 คำต่อนาทีและค่า p-value (ค่าความน่าจะเป็น) ที่เกี่ยวข้องซึ่งแตกต่างจากคะแนนก่อนการแทรกแซง ดังนั้น 95% ของเวลาคะแนนการอ่านใหม่จะอยู่ระหว่าง 85 ถึง 97 คำต่อนาทีหลังจากการแทรกแซง ดังนั้น "คิดว่าเป็น Bayesian" --- กล่าวคือตั้งทฤษฎีตั้งสมมติฐานดูหลักฐานก่อนหน้านี้และ "ตรวจสอบเหมือนเป็นประจำ" --- คือผลการทดลองเหล่านี้เกิดขึ้นบ่อยเพียงใดและมีแนวโน้มว่าจะเกิดขึ้นเนื่องจาก โอกาสมากกว่าการแทรกแซง คะแนนการอ่านใหม่จะอยู่ระหว่าง 85 ถึง 97 คำต่อนาทีหลังจากการแทรกแซง ดังนั้น "คิดว่าเป็น Bayesian" --- กล่าวคือตั้งทฤษฎีตั้งสมมติฐานดูหลักฐานก่อนหน้านี้และ "ตรวจสอบเหมือนเป็นประจำ" --- คือผลการทดลองเหล่านี้เกิดขึ้นบ่อยเพียงใดและมีแนวโน้มว่าจะเกิดขึ้นเนื่องจาก โอกาสมากกว่าการแทรกแซง คะแนนการอ่านใหม่จะอยู่ระหว่าง 85 ถึง 97 คำต่อนาทีหลังจากการแทรกแซง ดังนั้น "คิดว่าเป็น Bayesian" --- กล่าวคือตั้งทฤษฎีตั้งสมมติฐานดูหลักฐานก่อนหน้านี้และ "ตรวจสอบเหมือนเป็นประจำ" --- คือผลการทดลองเหล่านี้เกิดขึ้นบ่อยเพียงใดและมีแนวโน้มว่าจะเกิดขึ้นเนื่องจาก โอกาสมากกว่าการแทรกแซง


2
ประโยคสุดท้ายของคุณ - ส่วน "ตรวจสอบเหมือนเป็นประจำ" - ไม่มีส่วนเกี่ยวข้องกับการตั้งค่าบ่อย ๆ : การประมาณแบบเบส์จะบอกคุณว่า "บ่อยแค่ไหน" เราคาดหวังว่าจะเกิดอะไรขึ้นหรือ "มีโอกาสมากแค่ไหน ...
Tim
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.