การอนุมานที่ไม่มีความเป็นไปได้ - หมายความว่าอย่างไร


11

เมื่อเร็ว ๆ นี้ฉันได้ตระหนักถึงวิธีการ 'ไร้ความน่าจะเป็น' ซึ่งถูกรวบรวมในวรรณคดี อย่างไรก็ตามฉันไม่ชัดเจนเกี่ยวกับความหมายของวิธีการอนุมานหรือการเพิ่มประสิทธิภาพที่จะไม่มีโอกาสเกิดขึ้น

ในการเรียนรู้ของเครื่องเป้าหมายมักจะเพิ่มความน่าจะเป็นของพารามิเตอร์บางอย่างให้เหมาะสมกับฟังก์ชั่นเช่นน้ำหนักบนเครือข่ายประสาท

ดังนั้นอะไรคือปรัชญาของวิธีการที่ปราศจากโอกาสและทำไมเครือข่ายที่เป็นปฏิปักษ์เช่น GAN จึงอยู่ในหมวดหมู่นี้

คำตอบ:


10

มีตัวอย่างหลายวิธีที่ไม่ได้ขึ้นอยู่กับความน่าจะเป็นในสถิติ (ฉันไม่รู้เกี่ยวกับการเรียนรู้ของเครื่อง) ตัวอย่างบางส่วน:

  1. ฟิชเชอร์การทดสอบอย่างมีนัยสำคัญที่บริสุทธิ์ ขึ้นอยู่กับสมมติฐานว่างที่กำหนดไว้อย่างชัดเจนเท่านั้น (เช่นไม่มีความแตกต่างระหว่างนมก่อนและนมครั้งสุดท้ายในการทดลอง Lady Tasting Tea สมมติฐานนี้นำไปสู่การแจกแจงสมมติฐานว่างจากนั้น p-value ไม่มีโอกาสเกี่ยวข้อง ไม่สามารถให้พื้นฐานสำหรับการวิเคราะห์พลังงาน (ไม่มีทางเลือกที่กำหนดอย่างเป็นทางการ) หรือช่วงความมั่นใจ (ไม่มีพารามิเตอร์ที่กำหนดอย่างเป็นทางการ)

  2. ที่เกี่ยวข้องกับ 1. คือการทดสอบการสุ่มความแตกต่างระหว่างการทดสอบการสุ่มและการทดสอบการเปลี่ยนรูปซึ่งในรูปแบบพื้นฐานที่สุดคือการทดสอบที่สำคัญอย่างแท้จริง

  3. การบูตสแตรปทำได้โดยไม่จำเป็นต้องมีฟังก์ชั่นความน่าจะเป็น แต่มีการเชื่อมต่อกับความคิดน่าจะเป็นตัวอย่างเชิงประจักษ์ความน่าจะเป็น

  4. วิธีการตามอันดับมักจะไม่ใช้โอกาส

  5. สถิติที่แข็งแกร่งมาก

  6. ช่วงความเชื่อมั่นสำหรับค่ามัธยฐาน (หรือค่าอื่น ๆ ) สามารถขึ้นอยู่กับสถิติการสั่งซื้อ ไม่มีโอกาสเกี่ยวข้องกับการคำนวณ ช่วงความเชื่อมั่นสำหรับค่ามัธยฐาน , ประมาณการที่ดีที่สุดสำหรับความแปรปรวนของค่ามัธยฐานเชิงประจักษ์

  7. V Vapnik มีความคิดของการเรียนรู้ transductiveซึ่งดูเหมือนว่าจะเกี่ยวข้องกับการhttps://en.wikipedia.org/wiki/Epilogismตามที่กล่าวไว้ในหงส์ดำ Taleb และ Black Swan

  8. N(μ,σ2)N(9.37,2.122)

ในขณะที่คุณมีโอกาสฟังก์ชั่นมีเครื่องจักรอันยิ่งใหญ่ที่จะสร้าง Bayesians ไม่สามารถทำได้โดยไม่ต้องและคนอื่น ๆ ส่วนใหญ่จะใช้โอกาสในการส่วนใหญ่ แต่มันก็ชี้ให้เห็นในความคิดเห็นว่าแม้ Bayesians พยายามที่จะทำโดยไม่ต้องดู Approximate_Bayesian_computation แม้จะมีข้อความใหม่ในหัวข้อนั้น

แต่พวกเขามาจากไหน ในการรับฟังก์ชั่นความน่าจะเป็นในแบบปกติเราต้องมีข้อสันนิษฐานมากมายซึ่งยากที่จะพิสูจน์ได้

เป็นที่น่าสนใจที่จะถามว่าเราสามารถสร้างฟังก์ชั่นความน่าจะเป็นได้หรือไม่จากวิธีการที่ไม่มีโอกาสนี้ ตัวอย่างเช่นจุดที่ 6 ด้านบนเราสามารถสร้างฟังก์ชันความน่าจะเป็นสำหรับค่ามัธยฐานจากช่วงความเชื่อมั่น (ครอบครัว) คำนวณจากสถิติการสั่งซื้อได้หรือไม่ ฉันควรถามว่าเป็นคำถามแยกต่างหาก ...

คำถามสุดท้ายของคุณเกี่ยวกับ GAN ฉันต้องจากไปเพื่อคนอื่น


7
(+1) แต่ดูการคำนวณแบบเบย์โดยประมาณ (ฉันรู้สึกว่า "ปราศจากความน่าจะเป็น" ใช้สำหรับขั้นตอนที่คุณคาดหวังว่าจะต้องใช้ฟังก์ชั่นความเป็นไปได้มากขึ้น แต่ไม่จำเป็นต้องใช้มากกว่าการทดสอบแบบสุ่มและสิ่งที่คุณไม่เห็นได้ชัด t.)
Scortchi - Reinstate Monica

9

โดยเฉพาะ [ล่าสุด] วิธีการน่าจะเป็นฟรีเป็น rewording ของอัลกอริเอบีซีที่เอบีซียืนสำหรับการคำนวณแบบเบย์โดยประมาณ สิ่งนี้ตั้งใจที่จะครอบคลุมวิธีการอนุมานที่ไม่ต้องการการใช้ฟังก์ชันความน่าจะเป็นแบบปิด แต่ยังคงตั้งใจที่จะศึกษาแบบจำลองทางสถิติที่เฉพาะเจาะจง พวกเขาเป็นอิสระจากความยากลำบากในการคำนวณที่ติดอยู่กับความน่าจะเป็น แต่ไม่ใช่จากตัวแบบที่สร้างโอกาสนี้ ดูตัวอย่าง

  1. Grelaud, A; Marin, JM; โรเบิร์ต, C; Rodolphe, F; Tally, F (2009) "วิธีที่ไม่มีความเป็นไปได้สำหรับการเลือกรุ่นในฟิลด์สุ่มของกิ๊บส์" การวิเคราะห์แบบเบส์ 3: 427-442
  2. Ratmann, O; Andrieu, C; Wiuf, C; Richardson, S (2009) "การวิจารณ์แบบจำลองโดยอาศัยการอนุมานแบบไม่มีความเป็นไปได้พร้อมกับการประยุกต์ใช้กับวิวัฒนาการเครือข่ายโปรตีน" การดำเนินการของ National Academy of Sciences ของสหรัฐอเมริกา 106: 10,576-10,581
  3. Bazin, E. , Dawson, KJ, & Beaumont, MA (2010) การอนุมานที่ไม่มีความเป็นไปได้ของโครงสร้างประชากรและการดัดแปลงในแบบจำลองลำดับชั้นแบบเบย์ พันธุศาสตร์ 185 (2), 587-602
  4. Didelot, X; Everitt, RG; Johansen, AM; Lawson, DJ (2011) "การประเมินแบบจำลองความเป็นอิสระโดยปราศจากความน่าจะเป็น" การวิเคราะห์แบบเบส์ 6: 49-76
  5. Gutmann เมตรและ Corander เจ (2016) เบส์เพิ่มประสิทธิภาพสำหรับการอนุมานโอกาสฟรีของรูปแบบจำลองตามสถิติ วารสารเครื่องการเรียนรู้การวิจัย

2

เพื่อเพิ่มบทสวดคำตอบสถิติแบบอะซิมโทติคนั้นปราศจากความเป็นไปได้

เป็น "โอกาส" ที่นี่หมายถึงรูปแบบความน่าจะเป็นสำหรับข้อมูล ฉันไม่อาจสนใจได้ แต่ฉันอาจพบตัวประมาณอย่างง่ายเช่นค่าเฉลี่ยซึ่งเป็นข้อมูลสรุปที่เพียงพอและฉันต้องการทำการอนุมานเกี่ยวกับค่าเฉลี่ยของการแจกแจง (สมมติว่ามีอยู่ซึ่งมักจะเป็นสมมติฐานที่สมเหตุสมผล)

โดยทฤษฎีบทขีด จำกัด กลางค่าเฉลี่ยมีการแจกแจงแบบปกติใกล้เคียงในขนาดใหญ่ N เมื่อความแปรปรวนยังมีอยู่ ฉันสามารถสร้างการทดสอบที่สอดคล้องกัน (กำลังไปที่ 1 เนื่องจาก N ไปที่ระยะอนันต์เมื่อโมฆะเป็นเท็จ) ที่มีขนาดที่ถูกต้อง ในขณะที่ฉันมีรูปแบบความน่าจะเป็น (นั่นคือเท็จ) สำหรับการกระจายตัวตัวอย่างของค่าเฉลี่ยในขนาดตัวอย่างที่ จำกัด แต่ฉันสามารถรับการอนุมานที่ถูกต้องและการประเมินที่เป็นกลางเพื่อเพิ่ม "สรุปข้อมูลที่เป็นประโยชน์" ของฉัน (ค่าเฉลี่ย)

ควรสังเกตว่าการทดสอบบนพื้นฐานของ 95% CI สำหรับค่ามัธยฐาน (เช่นตัวเลือกที่ 6 ในคำตอบของ @ kjetilbhalvorsen) ก็ขึ้นอยู่กับทฤษฎีขีด จำกัด กลางเพื่อแสดงว่าพวกเขามีความสอดคล้องกัน ดังนั้นจึงไม่บ้าที่จะพิจารณาการทดสอบ T แบบง่าย ๆ ว่าเป็นการทดสอบแบบ "ไม่มีพารามิเตอร์" หรือ "ไม่ใช่ความน่าจะเป็น"


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.