พื้นหลังของฉันส่วนใหญ่อยู่ในการเรียนรู้ของเครื่องและฉันพยายามที่จะเรียนรู้ว่าการทดสอบสมมติฐานแบบเบย์หมายถึงอะไร ฉันโอเคกับการตีความความน่าจะเป็นแบบเบย์และฉันคุ้นเคยกับมันในบริบทของตัวแบบกราฟิกที่น่าจะเป็น อย่างไรก็ตามสิ่งที่ทำให้ฉันสับสนคือความหมายของคำว่า "สมมติฐาน" ในบริบทของการอนุมานเชิงสถิติ
ฉันคิดว่าฉันส่วนใหญ่สับสนเกี่ยวกับคำศัพท์ที่ฉันคุ้นเคยกับการเรียนรู้ของเครื่องเทียบกับสิ่งที่ใช้ในสถิติและการอนุมาน
ในบริบทของการเรียนรู้ภายใต้การดูแลผมตามปกติคิดว่าสมมติฐานที่เป็นฟังก์ชั่นการคาดการณ์ที่แมตัวอย่างป้ายชื่อของมันคือ{Y} อย่างไรก็ตามสำหรับฉันแล้วคำว่าสมมติฐานในการอ่านที่ฉันทำไม่มีความหมายเหมือนกัน ให้ฉันวางแยกอ่านที่ฉันกำลังอ่าน:
ถ้าคุณอ่านอย่างระมัดระวังมันก็บอกว่า:
มีรูปแบบที่แตกต่างกันสำหรับข้อมูลที่สังเกตได้ ...
พวกเขาใช้คำว่า model สำหรับฉันรูปแบบคำทำให้ฉันคิดว่าชุดของฟังก์ชั่นคือเราเลือกฟังก์ชั่นการทำนายที่เฉพาะเจาะจง เช่นคลาสสมมุติฐานของฟังก์ชัน ตัวอย่างเช่นอาจเป็นคลาสสมมุติฐานของฟังก์ชันกำลังสอง (พหุนามของระดับ 2) อย่างไรก็ตามสำหรับฉันแล้วพวกเขาใช้แบบจำลองคำและสมมติฐานเป็นคำพ้องในสารสกัดนี้ (สำหรับฉันพวกเขาเป็นคำที่แตกต่างอย่างสิ้นเชิง)
จากนั้นจะกล่าวถึงว่าเราสามารถทำให้นักบวชเป็นสมมติฐาน (สิ่งที่สมเหตุสมผลอย่างสมบูรณ์ในการตั้งค่าแบบเบย์):
นอกจากนี้เรายังสามารถระบุลักษณะข้อมูลด้วยสมมติฐานปัจจุบัน:
และอัปเดตข้อมูลปัจจุบันของเราที่เชื่อว่าได้รับข้อมูลบางอย่าง (และกฎของ Baye):
อย่างไรก็ตามฉันคิดว่าฉันคุ้นเคยกับการนำการประมาณค่าแบบเบย์ไปยังพารามิเตอร์เฉพาะ (พูด ) จากคลาสสมมติฐานมากกว่าระดับสมมติฐานทั้งหมด โดยพื้นฐานแล้วดูเหมือนว่า "สมมติฐาน" เหล่านี้ไม่เหมือนสมมติฐานจากบริบทการเรียนรู้ของเครื่องจักรที่ฉันคุ้นเคยดูเหมือนว่าฉันว่าสมมติฐานเหล่านี้คล้ายกับพารามิเตอร์เฉพาะมากกว่าคลาสสมมติฐาน
เมื่อมาถึงจุดนี้ฉันเชื่อว่า "สมมติฐาน" มีความหมายเช่นเดียวกับในฟังก์ชั่นการทำนาย ( ตัวอย่างเช่นพารามิเตอร์ของพารามิเตอร์ ) แต่ฉันคิดว่าฉันผิด ...
เพื่อทำให้ความสับสนของฉันแย่ลงยิ่งขึ้นภายหลังการอ่านเดียวกันนี้ก็ดำเนินต่อไปเพื่อระบุ "สมมติฐาน" ที่เฉพาะเจาะจงสำหรับตัวอย่างการฝึกอบรมแต่ละอย่างที่พวกเขาสังเกตเห็น ให้ฉันวางแยกสิ่งที่ฉันหมายถึง:
เหตุผลที่ทำให้ฉันสับสนคือถ้าฉันตีความสมมุติฐานเป็นพารามิเตอร์ดังนั้นสำหรับฉันแล้วมันไม่มีเหตุผลที่จะระบุพารามิเตอร์เฉพาะสำหรับแต่ละค่าตัวอย่างที่เราเห็น ณ จุดนี้ฉันได้ข้อสรุปว่าฉันไม่รู้จริง ๆ ว่าพวกเขาหมายถึงอะไรโดยสมมติฐานดังนั้นฉันจึงโพสต์คำถามนี้
แต่ผมไม่ได้อย่างเต็มที่ให้ขึ้นฉันวิจัยสิ่งที่หมายถึงสมมติฐานในสถิติ frequentistและพบว่าต่อไปนี้khan วิดีโอสถาบันการศึกษา วิดีโอที่จริงทำให้จำนวนมากรู้สึกถึงฉัน(บางทีคุณอาจจะ frequentist ครับ :) อย่างไรก็ตามดูเหมือนว่าพวกเขาได้รับข้อมูลมากมาย (เช่น "กลุ่มตัวอย่าง") และจากคุณสมบัติของกลุ่มตัวอย่างพวกเขาตัดสินใจว่าจะยอมรับหรือปฏิเสธสมมติฐานว่างเกี่ยวกับข้อมูล อย่างไรก็ตามในบริบทBayesianที่ฉันอ่านดูเหมือนว่าสำหรับแต่ละข้อมูล [จุด] เวกเตอร์ที่สังเกตพวกเขา "ติดป้ายกำกับ" ด้วยสมมติฐานที่มี "การทดสอบอัตราส่วนความน่าจะเป็น":
วิธีที่พวกเขากำหนดสมมติฐานให้กับแต่ละตัวอย่างข้อมูลแม้ดูเหมือนว่าการตั้งค่าการเรียนรู้ภายใต้การดูแลคือเรากำลังติดป้ายกำกับให้กับชุดฝึกอบรมแต่ละชุด อย่างไรก็ตามฉันไม่คิดว่าพวกเขากำลังทำอะไรในบริบทนี้ พวกเขากำลังทำอะไร? การกำหนดสมมติฐานให้กับตัวอย่างข้อมูลแต่ละชุดหมายความว่าอย่างไร สมมติฐานคืออะไร ตัวแบบคำว่าอะไร?
โดยทั่วไปหลังจากคำอธิบายที่ยาวนานของความสับสนของฉันมีใครรู้ว่าการทดสอบสมมติฐานแบบเบส์หมายถึงอะไรในบริบทนี้
หากคุณต้องการคำชี้แจงใด ๆ หรือสิ่งใดเพื่อปรับปรุงคำถามของฉันหรือเพื่อให้คำถามมีเหตุผลฉันรู้สึกยินดีที่จะช่วยเหลือ :)
ในการค้นหาคำตอบของฉันฉันพบสิ่งที่มีประโยชน์บางอย่างที่เกี่ยวข้องกับการทดสอบสมมติฐานทางสถิติ:
อันนี้แนะนำให้รู้จักกับหัวข้อที่ดีถ้าคุณมาจากพื้นหลัง CS (เช่นฉัน):
การแนะนำการทดสอบสมมติฐานทางสถิติที่ดีสำหรับนักวิทยาศาสตร์คอมพิวเตอร์คืออะไร
เมื่อถึงจุดหนึ่งฉันถามเกี่ยวกับ "พารามิเตอร์เริ่มต้น" (ซึ่งฉันควรจะกำหนดสิ่งที่ฉันหมายถึงฉันคิดว่ามันเป็นคำมาตรฐาน แต่มันไม่ได้ดังนั้นที่นี่ฉันจะอยู่มัน) และฉันคิดว่าสิ่งที่ฉันหมายถึงอย่างแท้จริงเป็นอย่างไร คุณระบุพารามิเตอร์สำหรับแต่ละสมมติฐานที่คุณมี ตัวอย่างเช่นคุณจะตัดสินใจได้อย่างไรว่าสมมติฐานว่างของคุณคืออะไรและพารามิเตอร์ของมัน มีคำถามที่เกี่ยวข้องกับสิ่งนั้น: