ตัวอย่างของสถิติแบบเบย์ที่สามารถประมาณค่าพารามิเตอร์ที่มีความท้าทายอย่างมากในการประมาณค่าด้วยวิธีการที่ใช้บ่อย


9

สถิติแบบเบย์ยืนยันว่า "สถิติแบบเบย์สามารถประมาณค่าพารามิเตอร์ที่มีความท้าทายมากในการประมาณค่าด้วยวิธีการที่ใช้บ่อย" ข้อความต่อไปนี้นำมาจากเอกสาร SAS นี้บอกว่าเหมือนกันหรือไม่

มันให้การอนุมานที่มีเงื่อนไขกับข้อมูลและเป็นที่แน่นอนโดยไม่ต้องพึ่งพาการประมาณเชิงเส้นกำกับ การอนุมานตัวอย่างขนาดเล็กดำเนินไปในลักษณะเดียวกับที่มีตัวอย่างขนาดใหญ่ การวิเคราะห์แบบเบย์ยังสามารถประมาณฟังก์ชั่นของพารามิเตอร์ได้โดยตรงโดยไม่ต้องใช้วิธี "ปลั๊กอิน" (วิธีการประมาณฟังก์ชั่นโดยการเสียบพารามิเตอร์ที่ประมาณไว้ในฟังก์ชั่น)

ฉันเห็นข้อความที่คล้ายกันในหนังสือเรียนบางเล่ม แต่ไม่จำที่ มีใครช่วยอธิบายสิ่งนี้ให้ฉันฟังได้ไหม


ความน่าจะเป็นที่ดวงอาทิตย์ขึ้นในวันพรุ่งนี้คืออะไร? en.wikipedia.org/wiki/Sunrise_problem ตัวอย่างนี้อาจไม่สำคัญกว่าที่คุณคาดหวังไว้
Hugh

คุณสามารถใส่คำพูดลงในคำถามของคุณได้โดยตรงหรือไม่? ดูเหมือนว่าชื่อจะไม่เกี่ยวข้องกับสัญลักษณ์แสดงหัวข้อย่อยที่สอง
ฮิวจ์

1
คำแถลงในเครื่องหมายคำพูดนั้นไม่ดีในที่ (a) "แน่นอน" ไม่ได้หมายถึงสิ่งใดที่มีและ (b) การวิจารณ์ปลั๊กอินใช้เฉพาะเมื่อพิจารณาจากด้านหลังเต็มรูปแบบและไม่ใช่อีกการประมาณรวมถึงขึ้นอยู่กับฟังก์ชันการสูญเสียที่เลือก สำหรับการประเมิน ดูคำถามอื่น ๆ นี้ได้คำตอบบางอย่าง
ซีอาน

คำตอบ:


8

ฉันมีคำคัดค้านโดยอ้างว่า:

  1. "Frequentism" เป็นวิธีการอนุมานที่ขึ้นอยู่กับคุณสมบัติความถี่ของตัวประมาณค่าที่เลือก นี่คือความคิดที่คลุมเครือซึ่งไม่ได้ระบุว่าผู้ประเมินจะต้องมาบรรจบกันและถ้าพวกเขาทำภายใต้วิธีที่พวกเขาต้องมาบรรจบกัน ยกตัวอย่างเช่นความเป็นกลางเป็นความคิดที่เกิดขึ้นบ่อย ๆ แต่มันไม่สามารถยึดถือฟังก์ชันใด ๆ และทุก ๆ [ของพารามิเตอร์ ] ที่น่าสนใจตั้งแต่การเก็บรวบรวมการแปลงของที่อนุญาตให้ตัวประมาณที่เป็นกลางมีข้อ จำกัด มาก นอกจากนี้ตัวประมาณบ่อยครั้งไม่ได้ถูกจัดทำโดยกระบวนทัศน์ แต่ต้องเลือกก่อนที่จะถูกประเมิน ในความหมายนั้นตัวประมาณแบบเบย์เป็นตัวประมาณแบบถี่ถ้ามันเป็นไปตามคุณสมบัติของผู้ใช้บ่อยθθ
  2. การอนุมานที่ผลิตโดยวิธีการแบบเบย์จะขึ้นอยู่กับการกระจายหลังตัวแทนจากความหนาแน่น{D}) ผมไม่เข้าใจว่าคำว่า "แน่นอน" สามารถแนบมันจะไม่ซ้ำกันที่เกี่ยวข้องกับการกระจายก่อนและมันก็ตรงมาโดย Bayes ทฤษฎีบท แต่ก็ไม่ได้กลับแน่นอนอนุมานในการที่ประมาณการจุดคือไม่จริงค่าของพารามิเตอร์และมันผลิตที่แน่นอนงบน่าจะเป็นเพียงในกรอบที่ได้รับจากคู่ก่อน x โอกาสπ(θ|D)π(θ|D)π(θ)θ. การเปลี่ยนหนึ่งคำในคู่จะทำการแก้ไขหลังและการอนุมานในขณะที่ไม่มีข้อโต้แย้งทั่วไปสำหรับการปกป้องก่อนหน้าเดียวหรือโอกาส
  3. ข้อความน่าจะเป็นอื่น ๆ เช่น“ พารามิเตอร์ที่แท้จริงมีความน่าจะเป็น 0.95 ของการลดลงในช่วงเวลาที่น่าเชื่อถือ 95%” ที่พบในหน้าเดียวกันของเอกสาร SAS นี้มีความหมายเทียบกับกรอบของการแจกแจงหลัง แต่ไม่ใช่ค่าสัมบูรณ์
  4. จากมุมมองของการคำนวณมันเป็นความจริงที่ว่าวิธีการแบบเบย์อาจกลับคำตอบที่แน่นอนหรือโดยประมาณในกรณีที่วิธีการแบบคลาสสิกมาตรฐานล้มเหลว นี่เป็นกรณีตัวอย่างของตัวแปรแฝง [หรือขาดหายไป] โมเดลโดยที่คือความหนาแน่นของรอยต่อสำหรับคู่และเมื่อไม่ได้สังเกตประมาณของและด้านหลังโดยการจำลองของคู่อาจพิสูจน์ได้ง่ายกว่าการได้มา ความเป็นไปได้สูงสุด ตัวอย่างที่ใช้งานได้จริงของการตั้งค่านี้คือแบบจำลองการรวมตัวของคิงแมนในพันธุศาสตร์ประชากร
    f(x|θ)=g(x,z|θ)dz
    g(x,z|θ)(X,Z)Zθ(θ,Z)ที่วิวัฒนาการของประชากรจากบรรพบุรุษร่วมกันเกี่ยวข้องกับเหตุการณ์ที่แฝงอยู่บนต้นไม้ไบนารี โมเดลนี้สามารถจัดการได้โดยการอนุมานแบบเบย์ผ่านอัลกอริธึมที่เรียกว่า ABC แม้ว่าจะมีการแก้ปัญหาซอฟต์แวร์ที่ไม่ใช่เบย์อยู่ก็ตาม
  5. อย่างไรก็ตามแม้ในกรณีเช่นนี้ฉันไม่คิดว่าการอนุมานแบบเบย์เป็นวิธีแก้ปัญหาที่เป็นไปได้เท่านั้น เทคนิคการเรียนรู้ด้วยเครื่องจักรเช่นอวนประสาทป่าสุ่มการเรียนรู้ลึกสามารถจำแนกได้ว่าเป็นวิธีการที่ใช้กันบ่อยเพราะพวกเขาทำการฝึกอบรมบนตัวอย่างโดยการตรวจสอบความถูกต้องข้ามข้อผิดพลาดหรือเกณฑ์ระยะทางที่สามารถมองเห็นได้ ประมาณโดยค่าเฉลี่ยตัวอย่าง ยกตัวอย่างเช่นรุ่น Coalescent คิงแมนยังสามารถจัดการโดยมติซอฟแวร์ที่ไม่ใช่แบบเบย์
  6. ประเด็นสุดท้ายคือสำหรับการประเมินจุดแนวทางเบย์อาจสร้างการประมาณการแบบปลั๊กอิน สำหรับฟังก์ชั่นการสูญเสียบางอย่างที่ผมเรียกว่าการสูญเสียที่แท้จริงประมาณการ Bayes ของการแปลงเป็นแปลงของประมาณการของเบส์\h(θ)h(θ^)θ

คำตอบนั้นดีเท่าที่จะไป ฉันคัดค้านที่จะชี้ไปที่ข้อ 5 เนื่องจากมันให้ความสำคัญกับวิธีการ ML ซึ่งเป็นประสิทธิภาพที่เหนือกว่าซึ่งยังไม่ได้รับการพิสูจน์โดยทฤษฎี นอกจากนี้ "... โมเดลที่แท้จริง ... " หมายความว่าอย่างไร ไม่ต้องสงสัยเลยว่าวิธีการเหล่านี้ได้รับความนิยม แต่โดยทั่วไปความนิยมนั้นก็เป็นธรรมโดยความสามารถของพวกเขา น่าเสียดายที่ข้อมูลเชิงลึกการวินิจฉัยจำนวนมากที่นำเสนอโดยวิธีการที่ไม่ใช่ ML Bayesian และวิธีการที่พบบ่อยจะหายไปเมื่อใช้วิธีการดังกล่าว โดยเฉพาะการตรวจสอบข้ามสามารถให้อัตราความผิดพลาดสูงกว่าเทคนิคอื่น ๆ ดู Efron, 1983, 1986, JASA
Jan Galkowski

ขอบคุณ ที่จริงแล้วฉันไม่ได้มอบวิธีการ ML ด้วยพลัง "เหนือชั้น" เพียงแค่กล่าวถึงคำตอบ ML ที่อาจเสนอสำหรับรุ่นที่ซับซ้อน และโดย "ตัวแบบที่แท้จริง" ฉันหมายถึงการประเมินผลการปฏิบัติงานของวิธีการที่สมมติว่า (ผิด) ว่าข้อมูลนั้นผลิตโดยแบบจำลองดังกล่าว ซึ่งเป็นข้อบกพร่องของการวิเคราะห์ทางสถิติส่วนใหญ่ imo
ซีอาน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.