วิธีแก้ปัญหารถถังเยอรมัน


10

มีข้อพิสูจน์ทางคณิตศาสตร์อย่างเป็นทางการหรือไม่ว่าวิธีแก้ปัญหาของปัญหารถถังเยอรมันนั้นเป็นฟังก์ชั่นเฉพาะพารามิเตอร์k (จำนวนตัวอย่างที่สังเกต) และm (ค่าสูงสุดระหว่างตัวอย่างที่สังเกต) กล่าวอีกนัยหนึ่งสามารถพิสูจน์ได้ว่าวิธีแก้ปัญหาเป็นอิสระจากค่าตัวอย่างอื่นนอกเหนือจากค่าสูงสุดหรือไม่


3
สิ่งที่คุณกำลังขอเป็นวิธีการที่แสดงให้เห็นว่าสูงสุดตัวอย่างเพียงพอสำหรับพารามิเตอร์ระบุขอบเขตบนของเครื่องแบบกระจายต่อเนื่องตั้งแต่ 1 ถึง\ theta θθ
Scortchi - Reinstate Monica

2
ฟิชเชอร์ Neyman ตีนเป็ดทฤษฎีบทฟังก์ชั่นความเป็นไปได้น่าจะเป็นของสังเกตตัวอย่าง (โดยสรุปสูงสุด ) ที่กำหนดพารามิเตอร์ (จำนวนรถถัง) สามารถเขียนได้อย่างสมบูรณ์ในแง่ของและ \ Pr (M = m | n , k) = \ start {คดี} 0 & \ text {if} m> n \\ \ frac {\ binom {m - 1} {k - 1}} {\ binom nk} & \ text {if} m \ leq n, \ end {cases} นั่นจะเป็นคำตอบหรือไม่? kmnkm
Pr(M=m|n,k)={0if m>n(m1k1)(nk)if mn,
Sextus Empiricus

@Scortchi ที่ถูกต้องขอบคุณสำหรับการ rephrasing ในทางที่ชัดเจนสำหรับฉัน
Bogdan Alexandru

@ MartijnWeterings no; โดยพื้นฐานแล้วฉันกำลังถาม (อ้างถึงความคิดเห็นของ Scortchi ด้านบน) เพื่อพิสูจน์ว่าตัวอย่างสูงสุดนั้นเพียงพอสำหรับการแก้ปัญหาโดยไม่ต้องคำนวณโซลูชันจริง
Bogdan Alexandru

ดังนั้นคุณไม่ได้มองหาทฤษฎีบทการแยกตัวประกอบฟิชเชอร์เนย์แมนเป็นข้อพิสูจน์?
Sextus Empiricus

คำตอบ:


15

ความเป็นไปได้

ปัญหาที่พบบ่อยในทฤษฎีความน่าจะเป็นหมายถึงความน่าจะเป็นของการสังเกตกำหนดรูปแบบที่แน่นอนและกำหนดพารามิเตอร์ (ลองเรียกมันว่า ) ที่เกี่ยวข้อง เช่นความน่าจะเป็นสำหรับสถานการณ์เฉพาะในเกมไพ่หรือเกมลูกเต๋ามักจะตรงไปตรงมามากx1,x2,...,xnθ

อย่างไรก็ตามในสถานการณ์จริงที่เรากำลังเผชิญกับสถานการณ์ผกผัน ( สถิติเชิงอนุมาน ) นั่นคือ: การสังเกตจะได้รับและในขณะนี้รูปแบบเป็นที่ไม่รู้จักหรืออย่างน้อยเราไม่ทราบว่าพารามิเตอร์บาง\x1,x2,...,xkθ

ในประเภทของปัญหาเหล่านี้เรามักจะอ้างถึงคำที่เรียกว่าน่าจะเป็นของพารามิเตอร์ที่ซึ่งเป็นอัตราการเชื่อในเฉพาะพารามิเตอร์สังเกตให้x_k คำนี้แสดงว่าเป็นสัดส่วนกับความน่าจะเป็นสำหรับการสังเกตสมมติว่าพารามิเตอร์ modelน่าจะเป็นจริงตามสมมุติฐาน L(θ)θx1,x2,..xkx1,x2,..xkθ

L(θ,x1,x2,..xk)probability observations x1,x2,..xk given θ 

สำหรับค่าพารามิเตอร์ที่กำหนดความน่าจะเป็นที่แน่นอนมากขึ้นการสังเกตคือ (สัมพันธ์กับความน่าจะเป็นกับค่าพารามิเตอร์อื่น ๆ ) ยิ่งการสังเกตสนับสนุนพารามิเตอร์นี้มากขึ้นเท่านั้น (หรือทฤษฎี / สมมติฐานที่ถือว่าพารามิเตอร์นี้) . ความเป็นไปได้สูง (ที่สัมพันธ์กัน) จะช่วยเสริมความเชื่อมั่นของเราเกี่ยวกับค่าพารามิเตอร์นั้น (มีปรัชญามากขึ้นที่จะพูดเกี่ยวกับเรื่องนี้)θx1,x2,..xn


ความเป็นไปได้ในปัญหารถถังเยอรมัน

ตอนนี้สำหรับปัญหารถถังเยอรมันฟังก์ชั่นความน่าจะเป็นสำหรับกลุ่มตัวอย่างคือ:x1,x2,..xk

L(θ,x1,x2,..xk)=Pr(x1,x2,..xk,θ)={0if max(x1,x2,..xk)>θ(θk)1if max(x1,x2,..xk)θ,

ไม่ว่าคุณจะสังเกตตัวอย่าง {1, 2, 10} หรือตัวอย่าง {8, 9, 10} ไม่ควรเรื่องเมื่อกลุ่มตัวอย่างได้รับการพิจารณาจากการกระจายชุดพารามิเตอร์\ตัวอย่างทั้งสองมีความเป็นไปได้ที่จะเกิดความเท่าเทียมกันและใช้ความคิดที่เป็นไปได้ตัวอย่างหนึ่งไม่ได้บอกเกี่ยวกับพารามิเตอร์มากกว่าตัวอย่างอื่นθ(θ3)1θ

ค่าสูง {8, 9, 10} อาจทำให้คุณคิด / เชื่อว่าควรสูงกว่า แต่มันเป็นเพียงค่า {10} ที่ให้ข้อมูลที่เกี่ยวข้องกับคุณอย่างแท้จริงเกี่ยวกับความน่าจะเป็นของ (ค่า 10 บอกคุณว่าจะสิบหรือสูงกว่าค่าอื่น ๆ ที่ 8 และ 9 ไม่ได้มีส่วนร่วมอะไรกับข้อมูลนี้ )θθθ


ทฤษฎีการแยกตัวประกอบฟิชเชอร์เนย์แมน

ทฤษฎีนี้บอกคุณว่าสถิติบางอย่าง (เช่นฟังก์ชั่นบางอย่างของการสังเกตเช่นค่าเฉลี่ยมัธยฐานหรือค่าเฉลี่ยในปัญหารถถังเยอรมัน) มีเพียงพอ (เมื่อมีข้อมูลทั้งหมด) เมื่อ คุณสามารถแยกตัวประกอบในฟังก์ชันความน่าจะเป็นคำที่ขึ้นอยู่กับการสังเกตอื่น ๆซึ่งปัจจัยนี้ไม่ได้ขึ้นอยู่กับทั้งพารามิเตอร์และ (และ ส่วนของฟังก์ชั่นความน่าจะเป็นที่เกี่ยวข้องกับข้อมูลด้วยค่าพารามิเตอร์สมมุติขึ้นอยู่กับสถิติ แต่ไม่ใช่ข้อมูล / การสังเกตทั้งหมด)T(x1,x2,,xk)x1,x2,,xkθx1,x2,,xk

กรณีของปัญหารถถังเยอรมันนั้นง่ายมาก คุณสามารถเห็นได้ว่าการแสดงออกทั้งหมดสำหรับความน่าจะเป็นข้างต้นนั้นขึ้นอยู่กับสถิติและค่าที่เหลือไม่สำคัญmax(x1,x2,..xk)x1,x2,..xk


เกมเล็ก ๆ น้อย ๆ เช่น

สมมติว่าเราเล่นเกมต่อไปนี้ซ้ำ ๆ :ตัวเองเป็นตัวแปรสุ่มและวาดด้วยความน่าจะเป็นอย่างใดอย่างหนึ่งเท่ากับ 100 หรือ 110 แล้วเราวาดตัวอย่างx_1,θx1,x2,...,xk

เราต้องการเลือกกลยุทธ์สำหรับการคาดเดาโดยพิจารณาจากที่เพิ่มความน่าจะเป็นของเราในการคาดเดาอย่างถูกต้องθx1,x2,...,xkθ

กลยุทธ์ที่เหมาะสมคือการเลือก 100 ยกเว้นหนึ่งในตัวเลขในตัวอย่างคือ> 100

เราอาจถูกล่อลวงให้เลือกค่าพารามิเตอร์ 110 แล้วเมื่อหลายมักจะมีค่าสูงเกือบร้อย (แต่ไม่เกินร้อย) แต่นั่นอาจจะผิด ความน่าจะเป็นของการสังเกตดังกล่าวจะใหญ่ขึ้นเมื่อค่าพารามิเตอร์ที่แท้จริงคือ 100 มากกว่าเมื่อมันคือ 110 ดังนั้นหากเราเดาว่าในสถานการณ์เช่นนี้ 100 เป็นค่าพารามิเตอร์เราจะมีโอกาสน้อยที่จะทำผิดพลาด (เนื่องจาก สถานการณ์ที่มีค่าสูงเกือบร้อย แต่ยังต่ำกว่าจะเกิดขึ้นบ่อยครั้งในกรณีที่มูลค่าที่แท้จริงคือ 100 แทนที่จะเป็นกรณีที่มูลค่าที่แท้จริงคือ 110)x1,x2,...,xk


ยอดเยี่ยมสิ่งที่ฉันต้องการ! มีเพียงความคิดเห็นเดียวในวงเล็บล่าสุดของคุณ: คุณกำลังพูดว่า "ค่าสูงเกือบร้อยค่าเหล่านี้เกิดขึ้นบ่อยครั้งมากขึ้น ... " ซึ่งฉันเข้าใจว่าทำไมมันถึงเป็นจริง แต่เพื่อชี้แจง: ค่าใด ๆระหว่าง 1 ถึง 100 มีแนวโน้มที่จะเกิดขึ้น เมื่อหากพารามิเตอร์คือ 100 (โดยหลักแล้วความน่าจะเป็นสำหรับแต่ละหมายเลขใน 1-100 คือ 1 / พารามิเตอร์)
Bogdan Alexandru

นอกจากนี้ตอนนี้ความคิดเห็นเริ่มต้นของคุณในโพสต์ของฉันสมเหตุสมผล - ถ้าฉันรู้วิธีใช้แนวคิดเหล่านี้ความคิดเห็นของคุณน่าจะเป็นคำใบ้ที่ฉันต้องการเพื่อพิสูจน์ ขอบคุณอีกครั้ง!
Bogdan Alexandru

@BogdanAlexandru คุณพูดถูก มันเป็นจริงสำหรับค่าใด ๆ ระหว่าง 1-100 นั่นคือแนวคิดที่แยบยลเรามักจะคิดว่าค่าที่สังเกตได้สูงกว่านั้นเป็นข้อพิสูจน์เพิ่มเติมสำหรับค่าพารามิเตอร์บางค่ามากกว่าค่าที่สังเกตได้ต่ำ แต่สำหรับตัวเลขใด ๆ มีแนวโน้มเท่ากันและดังนั้น / ไม่ควรมีส่วนร่วมอะไรกับเรา ยกเว้นค่าสูงสุดที่เราสังเกต แต่ถึงแม้จะเป็นเกมที่ฉันเลือกได้ระหว่างสองค่ามันเป็นเช่นนั้นแม้ค่าสูงสุดจะไม่ให้ข้อมูลเพิ่มเติมเมื่อสูงหรือต่ำยกเว้นรอบร้อยขอบเขต)
Sextus Empiricus

ความคิดเห็นเริ่มต้นของฉันอาจจะหนักเกินไป แต่ฉันแค่อยากจะดูว่าคำตอบแบบไหนที่จำเป็น โดยเฉพาะอย่างยิ่งฉันพบว่าคำว่า 'พิสูจน์' ค่อนข้างแข็งแกร่งและกำลังสงสัยว่าคุณกำลังมองหาทฤษฎีการแยกตัวประกอบ (ซึ่งจะเป็นคำถามที่ตอบโดยใช่เมื่อคุณไม่รู้ทฤษฎีบทนั้น) หรือว่าคุณกำลังมองหาบางสิ่งที่คลุมเครือมากขึ้นและ ปรัชญาเช่นเดียวกับแนวความคิดที่ท้าทายของสถิติ / ความน่าจะเป็นและการก้าวข้ามทฤษฎีดังกล่าวเพื่อค้นหา "การพิสูจน์" ประเภทอื่น
Sextus Empiricus

อ่านดีเกี่ยวกับความตั้งใจของฉันแล้ว! ขอบคุณอีกครั้ง.
Bogdan Alexandru

0

คุณยังไม่ได้เสนอสูตรที่แม่นยำของ "ปัญหา" ดังนั้นจึงไม่ชัดเจนว่าสิ่งที่คุณขอให้ได้รับการพิสูจน์ จากมุมมองของเบย์ความน่าจะเป็นหลังนั้นขึ้นอยู่กับข้อมูลทั้งหมด อย่างไรก็ตามการสังเกตแต่ละหมายเลขเฉพาะจะสนับสนุนหมายเลขนั้นมากที่สุด นั่นคือจากการสังเกตใด ๆอัตราต่อรองระหว่างหลังและก่อนจะยิ่งใหญ่กว่าสำหรับสมมติฐาน "จำนวนรถถังที่แท้จริงคือ " มากกว่าที่จะเป็นสำหรับ "จำนวนรถถังที่แท้จริงคือ [หมายเลขอื่นที่ไม่ใช่ ]" ดังนั้นถ้าเราเริ่มต้นด้วยเครื่องแบบก่อนหน้านี้จะมีด้านหลังสูงที่สุดหลังจากเห็นการสังเกตการณ์นั้นnnnn

พิจารณากรณีที่เรามีจุดข้อมูลและสมมติฐานNเห็นได้ชัดว่าคนหลังสำหรับเป็นศูนย์ และของเราสำหรับจะใหญ่กว่ารุ่นก่อนหน้า เหตุผลในเรื่องนี้คือในการให้เหตุผลแบบเบย์การไม่มีหลักฐานเป็นหลักฐานการขาด เมื่อใดก็ตามที่เรามีโอกาสที่เราสามารถทำการสังเกตการณ์ที่จะลดความน่าจะเป็นของเราลง แต่ไม่เพิ่มความน่าจะเป็น เนื่องจากเราสามารถเห็นซึ่งจะทำให้ posteriors ของเราสำหรับเป็นศูนย์ความจริงที่ว่าเราไม่เห็นมันหมายความว่าเราควรเพิ่ม posteriors ของเราสำหรับ13N=10,13,15N=10N=13,1516N=13,15N=13,15Nแต่โปรดทราบว่ายิ่งจำนวนน้อยเราก็ยิ่งเห็นว่าจะมีการยกเว้นหมายเลขนั้นมากขึ้น สำหรับเราจะได้ปฏิเสธสมมติฐานที่ว่าหลังจากที่ได้เห็น... แต่สำหรับเราจะต้องมีอย่างน้อยเพื่อปฏิเสธสมมติฐาน เนื่องจากสมมติฐานคือหลอกมากกว่าความจริงที่ว่าเราไม่ได้บิดเบือนเป็นหลักฐานเพิ่มเติมสำหรับกว่าไม่ทุจริตหลักฐานNN=1314,15,16,...N=1516N=13N=15N=13N=13N=15N=15

ดังนั้นทุกครั้งที่เราเห็นจุดข้อมูลมันตั้งค่าด้านหลังของทุกสิ่งที่อยู่ด้านล่างเป็นศูนย์และเพิ่มด้านหลังของทุกสิ่งอื่นด้วยตัวเลขที่เล็กลงจะได้รับการกระตุ้นมากที่สุด ดังนั้นจำนวนที่เพิ่มขึ้นโดยรวมที่ใหญ่ที่สุดจะเป็นจำนวนที่เล็กที่สุดซึ่งไม่ได้ตั้งไว้ที่ศูนย์หลังคือค่าสูงสุดของการสังเกต

ตัวเลขที่น้อยกว่าค่าสูงสุดจะมีผลต่อการเพิ่มจำนวนสูงสุดที่ได้รับมากขึ้น แต่จะไม่ส่งผลต่อแนวโน้มทั่วไปของการเพิ่มค่าสูงสุดที่ใหญ่ที่สุด พิจารณาตัวอย่างข้างต้นที่เราได้เห็นแล้ว13หากจำนวนถัดไปที่เราเห็นคือจะมีผลกระทบอะไรบ้าง ช่วยได้มากกว่าแต่ทั้งคู่ถูกปฏิเสธไปแล้วดังนั้นมันจึงไม่เกี่ยวข้องกัน มันช่วยมากกว่าแต่ได้รับการช่วยเหลือมากกว่าดังนั้นจึงไม่ส่งผลกระทบต่อจำนวนที่ได้รับการช่วยเหลือมากที่สุด1355613151315


ตัวอย่างนี้ขึ้นอยู่กับสถานการณ์เป็นอย่างมากและคำสั่งนั้นไม่ใช่เรื่องทั่วไป ตัวอย่างเช่นหากก่อนหน้านี้คือ 50% สำหรับ 13 และ 50% เป็นเวลา 15 การสังเกต 13 ไม่เช่นนั้น"ผู้โพสต์ของเราสำหรับ N = 13, 15 จะใหญ่กว่าเดิม" การสังเกตสามารถลดลงหลังเทียบกับก่อน .
Sextus Empiricus

นอกจากนี้การสังเกตตัวเลขเพิ่มเติมเพิ่มเติมสามารถเปลี่ยนการอนุมานได้ ในกรณี"ถ้าหมายเลขถัดไปที่เราเห็นคือ 5 ... "จากนั้นผู้หลังจะยังคงเปลี่ยนแม้ว่าตัวเลขจะถูก 'ช่วยออก' แล้วตัวเลขเพิ่มเติมก็สามารถเพิ่ม "การช่วยเหลือ" (เช่นเมื่อคุณสุ่มตัวเลขทั้งหมด 1,2, ... 12, 13 ดังนั้นสิ่งนี้จะเพิ่มด้านหลังสำหรับ 13 มากกว่าเมื่อคุณเพียงแค่ตัวอย่างที่ 13)
Sextus Empiricus
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.