Bayesian: "สวัสดีผู้เรียนเครื่องจักร!"
ผู้เรียนบ่อย: "สวัสดีผู้เรียนรู้จากเครื่อง!"
การเรียนรู้ของเครื่อง: "ฉันได้ยินว่าพวกคุณเก่งในเรื่องของข้อมูลนี่คือข้อมูลบางส่วน"
F: "ใช่ลองเขียนแบบจำลองแล้วคำนวณ MLE"
B: "เฮ้, F นั่นไม่ใช่สิ่งที่คุณบอกฉันเมื่อวานนี้! ฉันมีข้อมูลที่ไม่เปลี่ยนแปลงและฉันต้องการประเมินความแปรปรวนและฉันคำนวณ MLE จากนั้นคุณพุ่งฉันและบอกให้ฉันหารด้วยแทน โดยnn−1n . "
F: "อ๋อใช่ขอบคุณที่เตือนฉันฉันมักจะคิดว่าฉันควรใช้ MLE สำหรับทุกสิ่ง แต่ฉันสนใจในตัวประมาณค่าที่เป็นกลางและอื่น ๆ "
ML: "เอ๊ะสิ่งที่เป็นปรัชญานี้คืออะไรมันจะช่วยฉันได้ไหม"
F: "โอเคตัวประมาณค่าเป็นกล่องดำคุณใส่ข้อมูลลงไปและให้ตัวเลขออกมาเรามักจะไม่สนใจว่ากล่องถูกสร้างขึ้นมาอย่างไรเกี่ยวกับหลักการที่ใช้ในการออกแบบมันตัวอย่างเช่นฉัน ไม่ทราบวิธีรับกฎ "÷(n−1)
ML: "งั้นคุณสนใจอะไร?
F: "การประเมินผล"
ML: "ฉันชอบเสียงของสิ่งนั้น"
F: "กล่องดำเป็นกล่องดำถ้าใครบางคนอ้างว่าตัวประมาณหนึ่งตัวนั้นเป็นตัวประมาณค่าที่ไม่ลำเอียงสำหรับจากนั้นเราลองใช้ค่าหลาย ๆ ตัวในการสร้างตัวอย่างจำนวนมากจากแต่ละแบบจำลองที่สมมติขึ้นมา ตัวประมาณและหาค่าประมาณโดยประมาณถ้าเราสามารถพิสูจน์ได้ว่าค่าที่คาดหวังนั้นเท่ากับค่าจริงสำหรับทุกค่าเราก็จะบอกว่ามันไม่เอนเอียงเลย "θ θθθθ
ML: "ฟังดูดี! มันฟังดูเหมือนว่าผู้เล่นบ่อย ๆ เป็นคนที่จริงจังคุณจะตัดสินผลจากกล่องดำแต่ละกล่องการประเมินเป็นกุญแจสำคัญ"
F: "แน่นอน! ฉันเข้าใจว่าพวกคุณใช้วิธีการที่คล้ายกันการตรวจสอบข้ามหรือบางสิ่งบางอย่าง แต่นั่นฟังดูยุ่งเหยิงสำหรับฉัน"
ML: "ยุ่งเหรอ?"
F: "ความคิดในการทดสอบตัวประมาณของคุณเกี่ยวกับข้อมูลจริงนั้นเป็นอันตรายสำหรับฉันข้อมูลเชิงประจักษ์ที่คุณใช้อาจมีปัญหาทุกประเภทและอาจไม่ทำงานตามแบบที่เราตกลงกันไว้สำหรับการประเมินผล"
ML: "สิ่งที่ฉันคิดว่าคุณบอกว่าคุณต้องการพิสูจน์ผลบางอย่างที่ประมาณการของคุณมักจะเป็นที่เป็นกลางสำหรับทุก? ."θ
F: "ใช่ในขณะที่วิธีการของคุณอาจทำงานบนหนึ่งชุดข้อมูล (ชุดข้อมูลที่มีข้อมูลรถไฟและการทดสอบ) ที่คุณใช้ในการประเมินผลของฉันฉันสามารถพิสูจน์ได้ว่าเหมืองของฉันจะทำงานได้ตลอดเวลา"
ML: "สำหรับชุดข้อมูลทั้งหมดหรือไม่"
F: "ไม่"
ML: "ดังนั้นวิธีการของฉันได้รับการตรวจสอบข้ามในหนึ่งชุดข้อมูลคุณยังไม่ได้ทดสอบของคุณในชุดข้อมูลจริง ๆ ?"
F: "ถูกต้อง"
ML: "นั่นทำให้ฉันเป็นผู้นำ! วิธีการของฉันดีกว่าของคุณมันทำนายว่ามะเร็ง 90% ของเวลา 'การพิสูจน์' ของคุณจะใช้ได้เฉพาะถ้าชุดข้อมูลทั้งหมดทำงานตามรูปแบบที่คุณคิดไว้"
F: "เอ็มม์ใช่ฉันคิดว่า"
ML: "และช่วงเวลานั้นครอบคลุม 95% แต่ฉันไม่ควรแปลกใจถ้ามันมีค่าที่ถูกต้องคือ 20% ของเวลา?"θ
F: "ถูกต้องยกเว้นว่าข้อมูลนั้นเป็น iid จริง (หรืออะไรก็ตาม) หลักฐานของฉันก็ไร้ประโยชน์"
ML: "ดังนั้นการประเมินของฉันจึงน่าเชื่อถือและครอบคลุมมากกว่านี้ใช้ได้กับชุดข้อมูลที่ฉันได้ลองมาแล้ว แต่อย่างน้อยพวกเขาก็เป็นชุดข้อมูลจริงหูดและอื่น ๆ ทั้งหมดคุณอยู่ที่นั่นพยายามเรียกร้องให้คุณอนุรักษ์นิยมมากกว่า 'และ' ละเอียด 'และคุณสนใจในการตรวจสอบแบบจำลองและสิ่งของต่างๆ "
B: (คำอุทาน) "เฮ้พวกขอโทษที่จะขัดจังหวะฉันชอบที่จะก้าวเข้ามาและสร้างความสมดุลให้กับสิ่งต่าง ๆ บางทีอาจจะแสดงให้เห็นถึงปัญหาอื่น ๆ แต่ฉันชอบดูเพื่อนร่วมงานของฉันบ่อย ๆ
F: "ว้าว!"
ML: "โอเคเด็ก ๆ ทุกอย่างเกี่ยวกับการประเมินผู้ประเมินเป็นกล่องดำข้อมูลเข้ามาข้อมูลออกมาเราอนุมัติหรือไม่อนุมัติผู้ประเมินตามวิธีการดำเนินการภายใต้การประเมินเราไม่สนใจ เกี่ยวกับ 'สูตร' หรือ 'หลักการออกแบบ' ที่ใช้
F: "ใช่ แต่เรามีแนวคิดที่แตกต่างกันมากเกี่ยวกับการประเมินที่สำคัญ ML จะทำการฝึกอบรมและทดสอบข้อมูลจริงในขณะที่ฉันจะทำการประเมินที่กว้างกว่า (เพราะเกี่ยวข้องกับการพิสูจน์ที่ใช้กันอย่างกว้างขวาง) และ ยังมีข้อ จำกัด มากขึ้น (เพราะฉันไม่รู้ว่าชุดข้อมูลของคุณมาจากสมมติฐานการสร้างแบบจำลองที่ฉันใช้ขณะออกแบบการประเมินผลของฉันหรือไม่) "
ML: "คุณใช้การประเมินแบบใด B"
F: (คำอุทาน) "เฮ้อย่าทำให้ฉันหัวเราะเขาไม่ได้ประเมินอะไรเลยเขาแค่ใช้ความเชื่อส่วนตัวและวิ่งไปกับมันหรืออะไรทำนองนั้น"
B: "นั่นคือการตีความทั่วไป แต่ก็เป็นไปได้ที่จะนิยาม Bayesianism โดยการประเมินที่ต้องการจากนั้นเราสามารถใช้ความคิดที่ว่าไม่มีใครสนใจว่ามีอะไรอยู่ในกล่องดำเราใส่ใจเฉพาะวิธีการประเมินที่แตกต่างกัน"
B ดำเนินการต่อ: "ตัวอย่างคลาสสิก: การทดสอบทางการแพทย์ผลลัพธ์ของการตรวจเลือดนั้นเป็นทั้งบวกหรือลบผู้ที่สนใจบ่อย ๆ จะเป็นคนที่สุขภาพดีสัดส่วนที่ได้รับผลลบและในทำนองเดียวกันสัดส่วนของผู้ป่วยที่จะป่วย ได้ผลเป็นบวกผู้ที่ใช้บ่อยจะคำนวณสิ่งเหล่านี้สำหรับวิธีการตรวจเลือดแต่ละครั้งที่อยู่ระหว่างการพิจารณาและจากนั้นแนะนำให้เราใช้การทดสอบที่ได้คะแนนที่ดีที่สุด "
F: "แน่นอนคุณต้องการอะไรอีก
B: "แล้วคนเหล่านั้นที่ได้ผลการทดสอบเป็นบวกพวกเขาจะต้องการรู้ว่า 'คนที่ได้รับผลบวกจะต้องป่วยกี่คน? และ 'ผู้ที่ได้ผลลัพธ์เป็นลบมีสุขภาพกี่คน' "
ML: "อ่าใช่นั่นเป็นคำถามที่ดีกว่าที่จะถาม"
F: "HERESY!"
B: "เราจะไปที่นี่อีกครั้งเขาไม่ชอบสิ่งที่กำลังจะเกิดขึ้น"
ML: "นี่มันเกี่ยวกับ 'นักบวช' ใช่ไหม?"
F: "ชั่วร้าย"
B: "อย่างไรก็ตามใช่คุณคิดถูก ML เพื่อคำนวณสัดส่วนของคนที่มีผลบวกที่ป่วยคุณต้องทำหนึ่งในสองสิ่งหนึ่งทางเลือกคือทำการทดสอบกับผู้คนจำนวนมากและเพียงสังเกต สัดส่วนที่เกี่ยวข้องตัวอย่างเช่นมีกี่คนที่เสียชีวิตด้วยโรคนี้ "
ML: "ฟังดูเหมือนฉันใช้รถไฟและการทดสอบ"
B: "แต่คุณสามารถคำนวณตัวเลขเหล่านี้ล่วงหน้าหากคุณยินดีที่จะทำการสันนิษฐานเกี่ยวกับอัตราการเจ็บป่วยในประชากรผู้ใช้บ่อยก็ทำให้การคำนวณของเขาล่วงหน้า แต่ไม่ต้องใช้อัตราการเจ็บป่วยระดับประชากรนี้"
F: "ข้อสมมติฐานที่ได้รับการสนับสนุนเพิ่มเติม"
B: "โอ้หุบปากก่อนหน้านี้คุณถูกค้นพบ ML ค้นพบว่าคุณชื่นชอบสมมติฐานที่ไม่มีมูลความจริงเช่นเดียวกับใครความน่าจะเป็นของความคุ้มครองที่ 'พิสูจน์แล้ว' ของคุณจะไม่ซ้อนกันในโลกแห่งความเป็นจริง ทำไมข้อสันนิษฐานก่อนหน้าของฉันจึงแตกต่างอย่างมากคุณเรียกฉันว่าบ้า แต่คุณแสร้งว่าข้อสันนิษฐานของคุณนั้นเป็นผลงานของการวิเคราะห์แบบอนุรักษ์นิยมที่มั่นคงไม่มีสมมติฐาน "
B (ต่อ): "อย่างไรก็ตาม ML อย่างที่ฉันพูด Bayesians ชอบการประเมินผลแบบต่าง ๆ เรามีความสนใจในการ จำกัด ข้อมูลที่สังเกตได้และการคำนวณความแม่นยำของตัวประมาณของเราเราไม่สามารถทำการประเมินนี้โดยไม่ใช้ ก่อนหน้านี้ แต่สิ่งที่น่าสนใจคือเมื่อเราตัดสินใจเกี่ยวกับการประเมินรูปแบบนี้และเมื่อเราเลือกก่อนหน้านี้เราจะมี 'สูตร' อัตโนมัติเพื่อสร้างตัวประมาณที่เหมาะสมผู้ใช้บ่อยไม่มีสูตรดังกล่าวหากเขาต้องการ ตัวประมาณแบบเอนเอียงสำหรับโมเดลที่ซับซ้อนเขาไม่มีวิธีอัตโนมัติในการสร้างตัวประมาณที่เหมาะสม "
ML: "แล้วคุณจะทำอย่างไรคุณสามารถสร้างเครื่องมือประมาณค่าอัตโนมัติ"
B: "ใช่ฉันไม่มีวิธีอัตโนมัติในการสร้างตัวประมาณที่ไม่เอนเอียงเพราะฉันคิดว่าอคติเป็นวิธีที่ไม่ดีในการประเมินตัวประมาณ แต่ให้การประมาณตามข้อมูลที่ฉันชอบและก่อนหน้านี้ฉัน สามารถเชื่อมต่อก่อนและโอกาสที่จะให้ฉันประมาณ "
ML: "งั้นเรามาสรุปกันเราทุกคนมีวิธีต่าง ๆ ในการประเมินวิธีการของเราและเราอาจไม่เคยเห็นด้วยว่าวิธีใดดีที่สุด"
B: "นั่นไม่ยุติธรรมเราสามารถผสมและจับคู่พวกเขาถ้าเรามีข้อมูลการฝึกอบรมที่มีป้ายกำกับที่ดีเราควรทดสอบกับมันและโดยทั่วไปแล้วเราทุกคนควรทดสอบสมมติฐานให้มากที่สุดเท่าที่จะทำได้ 'การพิสูจน์อาจสนุกเช่นกันการทำนายประสิทธิภาพภายใต้แบบจำลองบางประการของการสร้างข้อมูล "
F: "ใช่แล้วเราจะเน้นการประเมินและที่จริงฉันจะหยุดยั้งคุณสมบัติตัวอย่างที่ไม่มีที่สิ้นสุดฉันขอให้นักวิทยาศาสตร์ให้ตัวอย่างที่ไม่มีที่สิ้นสุดแก่พวกเขา แต่พวกเขาก็ยังไม่ได้ทำ ถึงเวลาที่ฉันจะโฟกัสอีกครั้งบนตัวอย่าง จำกัด "
ML: "งั้นเรามีคำถามสุดท้ายคำถามหนึ่งเราโต้เถียงกันมากเกี่ยวกับวิธีประเมินวิธีของเรา แต่เราจะสร้างวิธีการของเราได้อย่างไร"
B: "Ah. เมื่อก่อนหน้านี้เรา Bayesians มีวิธีการทั่วไปที่ทรงพลังกว่านี้มันอาจซับซ้อน แต่เราสามารถเขียนอัลกอริทึมบางอย่างได้เสมอ (อาจเป็น MCMC ที่ไร้เดียงสา) ที่จะสุ่มตัวอย่างจากคนหลังของเรา "
F (คำอุทาน): "แต่มันอาจมีอคติ"
B: "วิธีการของคุณอาจต้องการฉันขอเตือนคุณว่า MLE มักจะลำเอียง? บางครั้งคุณมีความยากลำบากอย่างมากในการหาตัวประมาณค่าที่เป็นกลางและแม้กระทั่งเมื่อคุณมีตัวประมาณโง่ (สำหรับแบบจำลองที่ซับซ้อนจริงๆ) ที่จะบอกว่า ความแปรปรวนเป็นลบและคุณเรียกมันว่าเป็นกลางไม่เอนเอียงใช่ แต่มีประโยชน์ไม่มี! "
ML: "โอเคพวกคุณคุยโวอีกครั้งฉันขอถามคุณเอฟคุณเคยเปรียบเทียบความลำเอียงของวิธีการของคุณกับความเอนเอียงของวิธีการของ B เมื่อคุณทำงานด้วยปัญหาเดียวกันหรือไม่?"
F: "ใช่จริง ๆ แล้วฉันเกลียดที่จะยอมรับ แต่บางครั้งแนวทางของ B มีอคติและMSEต่ำกว่าตัวประมาณของฉัน!"
ML: "บทเรียนที่นี่คือในขณะที่เราไม่เห็นด้วยเล็กน้อยในการประเมินผลเราไม่มีใครผูกขาดวิธีการสร้างเครื่องมือประเมินที่มีคุณสมบัติที่เราต้องการ"
B: "ใช่เราควรอ่านงานของกันและกันให้มากขึ้นเราสามารถให้แรงบันดาลใจให้กับนักประมาณค่าได้เราอาจพบว่าตัวประมาณของคนอื่นนั้นทำงานได้ดีมากนอกกรอบปัญหาของเราเอง"
F: "และฉันควรหยุดยั้งเรื่องอคติตัวประมาณที่ไม่เอนเอียงอาจมีความแปรปรวนที่ไร้สาระฉันคิดว่าพวกเราทุกคนต้อง 'รับผิดชอบ' สำหรับตัวเลือกที่เราทำในการประเมินและคุณสมบัติที่เราต้องการเห็นในตัวประมาณของเรา เราไม่สามารถอยู่เบื้องหลังปรัชญาได้ลองใช้การประเมินทั้งหมดที่คุณทำได้และฉันจะคอยดูวรรณกรรม Bayesian เพื่อรับแนวคิดใหม่สำหรับการประมาณค่า! "
B: "อันที่จริงผู้คนจำนวนมากไม่รู้จริง ๆ ว่าปรัชญาของพวกเขาคืออะไรฉันไม่แน่ใจด้วยซ้ำว่าตัวเองถ้าฉันใช้สูตรแบบเบย์แล้วพิสูจน์ผลลัพธ์ทางทฤษฎีที่ดีนั่นไม่ได้หมายความว่าฉัน เป็นบ่อยครั้งหรือไม่นักประพันธ์สนใจเกี่ยวกับบทพิสูจน์ข้างต้นเกี่ยวกับประสิทธิภาพเขาไม่สนใจสูตรอาหารและถ้าฉันทำแบบทดสอบและทดสอบแทน (หรือเช่นกัน) นั่นหมายความว่าฉันเป็นเครื่องเรียนรู้หรือไม่? "
ML: "ดูเหมือนว่าพวกเราทุกคนค่อนข้างคล้ายกันแล้ว"