เหตุใดคำจำกัดความของตัวประมาณที่สอดคล้องกันจึงเป็นเช่นนั้น แล้วนิยามทางเลือกของความสอดคล้องล่ะ


14

อ้างอิงจากวิกิพีเดีย:

ในสถิติการประมาณการที่สอดคล้องกันหรือประมาณการสอดคล้อง asymptotically เป็นประมาณการ-กฎสำหรับการประมาณการของพารามิเตอร์การคำนวณθ -having ทรัพย์สินที่เป็นจำนวนจุดข้อมูลที่ใช้เพิ่มขึ้นเรื่อย ๆ ตามลำดับที่เกิดจากลู่ประมาณการในความน่าจะเป็นθ .

ที่จะทำให้คำสั่งนี้ช่วยให้แม่นยำθเป็นค่าของพารามิเตอร์ที่แท้จริงคุณต้องการที่จะประเมินและให้θ ( S n )เป็นกฎสำหรับการประเมินพารามิเตอร์นี้เป็นหน้าที่ของข้อมูล จากนั้นคำจำกัดความของความสอดคล้องของตัวประมาณสามารถแสดงด้วยวิธีต่อไปนี้:θ^(Sn)

limnPr[|θ(Sn^)θ|ϵ]=0

คำถามของฉันดูเหมือนผิวเผินตั้งแต่แรกเห็น แต่เป็น: ทำไมคำว่า "ความสอดคล้อง / สอดคล้องกัน" ใช้เพื่ออธิบายพฤติกรรมของตัวประมาณนี้

เหตุผลที่ฉันสนใจเรื่องนี้ก็เพราะว่าสำหรับฉันโดยสังหรณ์ใจคำที่สอดคล้องกันหมายถึงสิ่งที่แตกต่าง (หรืออย่างน้อยก็ดูเหมือนจะแตกต่างจากฉันบางทีพวกเขาอาจจะแสดงให้เห็นว่าเท่ากัน) ให้ฉันบอกความหมายของตัวอย่างด้วย พูดว่า "คุณ" มีความสม่ำเสมอ "ดี" (สำหรับคำนิยามบางอย่างของความดี) จากนั้นก็หมายความว่าทุกครั้งที่คุณมีโอกาสที่จะพิสูจน์ / แสดงให้ฉันเห็นว่าคุณเป็นคนดีจริง ๆ คุณพิสูจน์ฉันว่าคุณเป็นคนดีทุกครั้ง (หรืออย่างน้อยก็ในเวลาส่วนใหญ่)

ให้ใช้สัญชาตญาณของฉันเพื่อกำหนดความสอดคล้องของตัวประมาณ ขอให้ "คุณ" เป็นฟังก์ชั่นการคำนวณθและปล่อยให้ "ดี" หมายถึงวิธีการที่คุณจะห่างไกลจากการประมาณการจริงθ * (ดีในL 1ความรู้สึกบรรทัดฐานทำไมไม่) จากนั้นนิยามที่ดีกว่าของความสอดคล้องจะเป็น:θ^θl1

n,Sn,Pr[|θ(Sn^)θ|ϵ]<δ

แม้ว่ามันอาจจะเป็นความหมายที่มีประโยชน์น้อยของความมั่นคงก็จะทำให้รู้สึกมากขึ้นกับผมในทางที่ผมจะกำหนดความสอดคล้องเพราะสำหรับการฝึกอบรม / ชุดตัวอย่างที่คุณโยนในการประมาณการของฉันθผมจะสามารถทำผลงานได้ดี คือฉันจะทำดีอย่างต่อเนื่อง ฉันรู้ว่ามันไม่สมจริงที่จะทำเพื่อ n ทั้งหมด (อาจเป็นไปไม่ได้) แต่เราสามารถแก้ไขคำจำกัดความนี้ได้โดยพูดว่า:θ^

n0,nn0,Sn,Pr[|θ(Sn^)θ|ϵ]<δ

เช่นมีขนาดใหญ่พอ n ตัวประมาณของเราจะไม่แย่กว่า (เช่นไม่เกินϵห่างจาก "ความจริง") จากจริงθ ( n 0พยายามจับสัญชาตญาณที่คุณต้องการอย่างน้อยจำนวนหนึ่ง ตัวอย่างเพื่อเรียนรู้ / ประเมินสิ่งใด ๆ และเมื่อคุณได้ตัวเลขครบแล้วตัวประมาณของคุณจะใช้เวลาส่วนใหญ่ถ้ามันสอดคล้องกันในแบบที่เราพยายามกำหนดไว้)ϵϵθn0

แต่ความหมายก่อนหน้านี้คือการที่แข็งแกร่งบางทีเราอาจจะช่วยให้เรามีความน่าจะเป็นที่ต่ำของการห่างไกลจากสำหรับส่วนมากของชุดการฝึกอบรมที่มีขนาดn n 0 (คือไม่จำเป็นต้องนี้สำหรับS nแต่เหนือ การกระจายตัวของS nหรืออะไรทำนองนั้น) ดังนั้นเราจะมีข้อผิดพลาดสูงเพียงเล็กน้อยมากสำหรับชุดตัวอย่าง / การฝึกอบรมส่วนใหญ่ที่เรามีθnn0SnSn

อย่างไรก็ตามคำถามของฉันคือคำจำกัดความที่นำเสนอเหล่านี้ของ "ความสอดคล้อง" จริง ๆ แล้วเหมือนกับคำจำกัดความ "อย่างเป็นทางการ" ของความมั่นคง แต่การเทียบเคียงนั้นยากที่จะพิสูจน์ หากคุณรู้ว่าหลักฐานโปรดแบ่งปัน! หรือสัญชาตญาณของฉันปิดตัวลงอย่างสมบูรณ์และมีเหตุผลที่ลึกกว่าสำหรับการเลือกความสอดคล้องของนิยามในแบบที่มันมักจะถูกกำหนดเป็นอย่างไร ทำไมความสอดคล้อง ("เป็นทางการ") จึงกำหนดวิธีการที่สอดคล้องกัน

ความคิดของฉันเกี่ยวกับการพิสูจน์ผู้สมัครสำหรับความเท่าเทียมบางประเภทหรือบางทีความคล้ายคลึงกันระหว่างแนวคิดเรื่องความมั่นคงและความคิดที่ยอมรับได้ของความมั่นคงอาจจะคลี่คลายคำจำกัดความในคำจำกัดความความมั่นคงอย่างเป็นทางการโดยใช้คำจำกัดความของขีด จำกัด อย่างไรก็ตามฉันไม่แน่ใจ 100% ว่าจะทำอย่างไรและแม้ว่าฉันพยายามแล้วคำนิยามความสอดคล้องอย่างเป็นทางการดูเหมือนจะไม่คำนึงถึงการพูดคุยเกี่ยวกับชุดฝึกอบรม / ตัวอย่างที่เป็นไปได้ทั้งหมด เนื่องจากฉันเชื่อว่าพวกเขาเทียบเท่าคำนิยามอย่างเป็นทางการที่ฉันให้ไม่สมบูรณ์ (เช่นทำไมมันไม่ได้พูดถึงชุดข้อมูลที่เราสามารถทำได้หรือชุดข้อมูลอื่นทั้งหมดที่สามารถสร้างชุดตัวอย่างของเราได้)(ϵ,δ)

หนึ่งของความคิดสุดท้ายของฉันมีความหมายใด ๆ ที่เราจัดหาควรจะ WRT แม่นยำมีการกระจายความน่าจะเป็นที่เราพูดคุยเกี่ยวกับมันเป็นหรือมันคือP S n ฉันคิดว่าผู้สมัครควรจะแม่นยำถ้าสิ่งที่มันรับประกันถ้ามันรับประกันได้ว่ามันจะกระจายไปยังบางส่วนคงที่หรือการกระจายไปยังชุดการฝึกอบรม ... ใช่มั้ยPxPSn


3
(+1) ความคิดสร้างสรรค์ ขอบคุณสำหรับการแบ่งปันกับเรา ฉันเชื่อว่าฉันจะสามารถให้ความคิดบางอย่างเป็นคำตอบที่นี่
Alecos Papadopoulos

2
คำจำกัดความแรกมีประโยชน์เพียงเล็กน้อยเนื่องจากต้องการให้ตัวประมาณค่าทั้งหมดมีความแม่นยำสูง อันที่สองไม่มีเหตุผลเพราะมันพยายามควบคุมตัวแปรโลจิคัลเดียวมีปริมาณหลายตัว n
whuber

คำตอบ:


9

พิจารณาประโยคแถลงการณ์ที่สองโดย OP แก้ไขเล็กน้อย

(1)θΘ,ε>0,δ>0,Sn,n0(θ,ε,δ):nn0,Pn[|θ^(Sn)-θ* * * *|ε]<δ

เรากำลังตรวจสอบขอบเขตในลำดับของจำนวนจริง { P n [ | θ ( S n ) - θ * | ϵ ] }[0,1]

{Pn[|θ^(Sn)-θ* * * *|ε]}

จัดทำดัชนีโดยnหากลำดับนี้มีขีด จำกัด เป็นn เรียกมันว่าpเราจะได้มันnnพี

(2)θΘ,ϵ>0,δ>0,Sn,n0(θ,ϵ,δ):nn0,|Pn[|θ(Sn^)θ|ϵ]p|<δ

(1)np=0

(1)Pn[|θ(Sn^)θ|ϵ]n0

ดังนั้นดูเหมือนว่า OP จะเสนอนิพจน์ทางเลือกสำหรับคุณสมบัติเดียวกันที่แน่นอนและไม่ใช่คุณสมบัติที่แตกต่างกันของตัวประมาณ

เพิ่ม (ลืมส่วนประวัติ)

ใน "รากฐานของทฤษฎีความน่าจะเป็น" (1933), Kolmogorov กล่าวถึงในเชิงอรรถว่า (แนวคิดของการลู่เข้าในความน่าจะเป็น)

"... เกิดจาก Bernoulli การรักษาทั่วไปโดยสมบูรณ์ได้รับการแนะนำโดย EESlutsky"

(ในปี 1925) งานของ Slutsky อยู่ในภาษาเยอรมัน - มีแม้กระทั่งอาจเป็นปัญหาว่าคำภาษาเยอรมันถูกแปลเป็นภาษาอังกฤษ (หรือคำที่ใช้โดย Bernoulli) แต่อย่าพยายามอ่านคำมากเกินไป

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.