ปรับปรุงตัวประมาณขั้นต่ำ


9

สมมติว่าผมมีค่าบวกในการประมาณการของพวกเขาและสอดคล้องประมาณการเป็นกลางผลิตโดยตัวประมาณคือ ,เป็นต้นnμ1,μ2,...,μnnμ1^,μ2^,...,μn^E[μ1^]=μ1E[μ2^]=μ2

ฉันต้องการประมาณโดยใช้การประมาณการในมือ เห็นได้ชัดว่าไร้เดียงสามีอคติต่ำกว่า min(μ1,μ2,...,μn)min(μ1^,μ2^,...,μn^)

E[min(μ1^,μ2^,...,μn^)]min(μ1,μ2,...,μn)

สมมติว่าฉันยังมีเมทริกซ์ความแปรปรวนร่วมของตัวประมาณอยู่ในมือ เป็นไปได้ไหมที่จะได้รับการประเมินขั้นต่ำแบบไม่เอนเอียง (หรือมีอคติน้อยกว่า) โดยใช้การประมาณที่กำหนดและเมทริกซ์ความแปรปรวนร่วม?Cov(μ1^,μ2^,...,μn^)=Σ


คุณยินดีที่จะใช้วิธีการแบบเบย์เซีย MCMC หรือคุณต้องการสูตรปิดบางอย่าง?
Martin Modrák

แต่วิธีการสุ่มตัวอย่างแบบง่าย ๆ ก็โอเค? (นอกจากนี้คุณไม่จำเป็นต้องมีนักบวชอย่างเคร่งครัดสำหรับการวิเคราะห์แบบเบย์ แต่เป็นอีกเรื่องหนึ่ง)
Martin Modrák

@ MartinModrákฉันไม่เคยมีประสบการณ์กับวิธีการสุ่มตัวอย่าง ถ้าฉันทำแบบเบย์ฉันมักจะทำสิ่งที่ผันง่าย ๆ แต่ถ้าคุณคิดว่านี่เป็นวิธีที่จะไปฉันจะไปข้างหน้าและเรียนรู้
Cagdas Ozgenc

คุณรู้อะไรเกี่ยวกับค่าประมาณเหล่านี้อีกบ้าง คุณรู้การแสดงออกหรือไม่ คุณรู้การกระจายตัวของข้อมูลที่ใช้ในการประมาณค่าพารามิเตอร์เหล่านี้หรือไม่?
Wij

@wij ฉันสามารถลองประมาณช่วงเวลาอื่น ๆ ของตัวประมาณค่าได้หากจำเป็น ฉันไม่มีการแสดงออกเชิงวิเคราะห์สำหรับการกระจายตัวประมาณ โซลูชันไม่ควร (ตามความต้องการของฉัน) ขึ้นอยู่กับการกระจายของข้อมูลเอง
Cagdas Ozgenc

คำตอบ:


4

ฉันไม่มีคำตอบที่ชัดเจนเกี่ยวกับการดำรงอยู่ของตัวประมาณค่าที่เป็นกลาง อย่างไรก็ตามในแง่ของข้อผิดพลาดในการประมาณค่าการประมาณเป็นปัญหาที่ยากโดยทั่วไปmin(μ1,,μn)

ตัวอย่างเช่นสมมติและmu_n) Letเป็นปริมาณเป้าหมายและเป็นค่าประมาณของ\ถ้าเราใช้ตัวประมาณค่า "ไร้เดียงสาโดยที่จากนั้นข้อผิดพลาดโดยประมาณนั้นอยู่บนขอบเขตโดย สูงถึงคงที่ (โปรดทราบว่าข้อผิดพลาดโดยประมาณสำหรับแต่ละคือ ) แน่นอนถ้าY1,,YNN(μ,σ2I)μ=(μ1,,μn)θ=miniμiθ^θθ^=mini(Y¯i)Yi¯=1Nj=1NYi,jL2

E[θ^θ]2σ2lognN
μiσ2Nμi's อยู่ห่างไกลจากแต่ละอื่น ๆ และมีขนาดเล็กมากข้อผิดพลาดประมาณการควรจะลดลงไป {N} อย่างไรก็ตามในกรณีที่เลวร้ายที่สุดไม่มีการประมาณของทำงานได้ดีกว่าตัวประเมินที่ไร้เดียงสา คุณสามารถแสดงให้เห็นอย่างแม่นยำว่า ที่ infimum จะใช้เวลามากกว่า estiamte ไปได้ทั้งหมดของขึ้นอยู่กับตัวอย่างและ supremum จะใช้เวลามากกว่าการกำหนดค่าทั้งหมดที่เป็นไปได้ของ 'sσσ2Nθ
infθ^supμ1,,μnE[θ^θ]2σ2lognN
θY1,,YNμi

ดังนั้นตัวประมาณที่ไร้เดียงสานั้นย่อเล็กสุดให้มากที่สุดจนถึงค่าคงที่และไม่มีการประมาณที่ดีกว่าของในแง่นี้θ


ข้อมูลเพิ่มเติมที่ให้มาไม่ได้ช่วยอะไรเลย? สถิติเพิ่มเติมใดที่จะมีประโยชน์
Cagdas Ozgenc

ขออภัยที่ทำให้เกิดความสับสน ฉันไม่ได้หมายความว่าข้อมูลเพิ่มเติม (ความแปรปรวนร่วม) ไม่เป็นประโยชน์ ฉันแค่อยากจะชี้ให้เห็นว่าการประมาณค่าต่ำสุดของจำนวนประชากรหมายถึงเป็นเรื่องยากในธรรมชาติ ข้อมูลความแปรปรวนร่วมควรเป็นประโยชน์ ตัวอย่างเช่นในกรณีปกติถ้าเรามีความสัมพันธ์ที่สมบูรณ์แบบสำหรับคู่ที่เป็นไปได้ทั้งหมดมันหมายถึงการสังเกตแบบสุ่มนั้นมาจากค่าเฉลี่ยที่แตกต่างกัน + คำที่มีเสียงทั่วไป ในกรณีนี้ตัวประมาณที่ไร้เดียงสา (ค่าเฉลี่ยตัวอย่างต่ำสุด) จะไม่เอนเอียง
JaeHyeok Shin

3

แก้ไข:คำตอบต่อไปนี้แตกต่างจากคำถามที่ถาม - มันมีกรอบราวกับว่าถูกพิจารณาแบบสุ่ม แต่ไม่ทำงานเมื่อได้รับการแก้ไขซึ่งอาจเป็นสิ่งที่ OP คิดไว้ หากได้รับการแก้ไขฉันไม่มีคำตอบที่ดีกว่าμμμmin(μ^1,...,μ^n)


หากเราพิจารณาการประมาณค่าเฉลี่ยและความแปรปรวนร่วมเท่านั้นเราสามารถปฏิบัติต่อเป็นตัวอย่างเดียวจากการแจกแจงแบบปกติหลายตัวแปร วิธีง่ายๆในการประมาณค่าต่ำสุดคือการดึงตัวอย่างจำนวนมากจากคำนวณค่าต่ำสุดของตัวอย่างแต่ละตัวอย่างจากนั้นใช้ค่าเฉลี่ยของค่าต่ำสุดเหล่านั้น(μ1,...,μn)MVN(μ^,Σ)

ขั้นตอนข้างต้นและข้อ จำกัด ของมันสามารถเข้าใจได้ในศัพท์เบย์ - รับโน้ตจากWikipedia บน MVNถ้าคือความแปรปรวนร่วมที่รู้จักกันของตัวประมาณค่าและเรามีหนึ่งการสังเกตการกระจายหลังร่วมคือโดยที่และเกิดขึ้นจากที่ก่อนที่จะสังเกตข้อมูลใด ๆ ที่เรานำมาก่อน ) เนื่องจากคุณอาจไม่เต็มใจที่จะใส่นักบวชลงบนเราสามารถใช้ขีด จำกัด เป็นทำให้แบนก่อนและด้านหลังกลายเป็นΣμMVN(μ^+mλ01+m,1n+mΣ)λ0mμMVN(λ0,m1Σμm0μMVN(μ^,Σ). อย่างไรก็ตามเมื่อพิจารณาก่อนที่เราจะทำการสันนิษฐานว่าองค์ประกอบของแตกต่างกันมาก (ถ้าจำนวนจริงทั้งหมดมีแนวโน้มเท่ากันการได้รับค่าที่คล้ายกันนั้นไม่น่าเป็นไปได้มาก)μ

การจำลองอย่างรวดเร็วแสดงให้เห็นว่าการประเมินด้วยขั้นตอนนี้จะประเมินค่าเล็กน้อยเมื่อองค์ประกอบของต่างกันมากและ underestimatesต่ำกว่าเมื่อองค์ประกอบมีความคล้ายคลึงกัน หนึ่งอาจโต้แย้งว่าไม่มีความรู้ก่อนหน้านี้เป็นพฤติกรรมที่ถูกต้อง หากคุณมีความยินดีที่จะให้รัฐอย่างน้อยบางข้อมูลก่อน (เช่น ) ผลที่อาจจะกลายเป็นบิตประพฤติที่ดีกว่าสำหรับกรณีการใช้งานของคุณmin(μ)μmin(μ)m=0.1

หากคุณยินดีที่จะสมมติโครงสร้างเพิ่มเติมคุณอาจเลือกการกระจายที่ดีกว่า multivariete ปกติ นอกจากนี้มันอาจสมเหตุสมผลที่จะใช้Stanหรือตัวอย่าง MCMC อื่น ๆ เพื่อให้พอดีกับค่าประมาณของในตอนแรก นี่จะทำให้คุณได้กลุ่มตัวอย่างที่สะท้อนถึงความไม่แน่นอนในตัวประมาณรวมถึงโครงสร้างความแปรปรวนร่วมของพวกเขา (อาจจะสมบูรณ์กว่าที่ MVN สามารถให้ได้) คุณสามารถคำนวณขั้นต่ำสำหรับแต่ละตัวอย่างเพื่อรับการแจกแจงหลังส่วนเกินอีกครั้งและใช้ค่าเฉลี่ยของการแจกแจงนี้หากคุณต้องการการประมาณจุดμ(μ1,...,μn)


โปรดทราบว่าฉันไม่ได้พยายามประมาณค่าตัวแปรสุ่มต่ำสุด ฉันพยายามประเมินพารามิเตอร์ต่ำสุดที่ N ดูเหมือนว่าข้อเสนอแนะของคุณคือการประมาณค่าสำหรับในขณะที่ฉันต้องการค่าประมาณE[min(μ1^,μ2^,...,μn^)]min(μ1,μ2,...,μn)
Cagdas Ozgenc

ฉันพยายามแก้ไขคำตอบเพื่ออธิบายเหตุผลหวังว่าจะช่วยได้
Martin Modrák

ดังนั้นวิธีการสุ่มตัวอย่างนี้ให้ผลลัพธ์ที่ดีกว่าเมื่อเปรียบเทียบกับซึ่งทำงานได้ดีเมื่ออยู่ไกล ห่างกันและดูถูกเมื่อพวกเขาอยู่ใกล้ เพื่อให้มีประโยชน์ควรทำงานเมื่อปิด min(μ1^,μ2^,...,μn^)μi
Cagdas Ozgenc

โปรดทราบว่าทั้งหมดเป็นตัวเลขบวกดังนั้นคุณไม่ต้องการส่วนเชิงลบของเส้นจริง μi
Cagdas Ozgenc

1
คุณถูกต้องที่ฉันไม่สนใจสัญญาณและฉันไม่เห็นวิธีง่ายๆในการรองรับพวกเขา นอกจากนี้ยังประมาณการที่ผมเสนอไม่ทำงานได้ดีขึ้นเมื่อถือว่าสุ่ม แต่มันเป็นเรื่องเลวร้ายยิ่งกว่าสำหรับการแก้ไข\ฉันไม่คิดว่าฉันจะสามารถกอบกู้สิ่งนี้ได้และฉันไม่แน่ใจว่าอะไรเป็นวิธีที่ดีที่สุดในการไปข้างหน้า - ฉันมีแนวโน้มที่จะพยายามลบคำตอบเนื่องจากมันไม่ได้ตอบคำถามจริงๆ แต่ (ฉันหวังว่า) อาจเป็นประโยชน์กับใครบางคน μmin(μ^)μ
Martin Modrák
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.