สถิติการสั่งซื้อ (เช่นขั้นต่ำ) ของการรวบรวมตัวแปรไคสแควร์ไม่สิ้นสุด?


11

นี่เป็นครั้งแรกของฉันที่นี่ดังนั้นโปรดแจ้งให้เราทราบหากฉันสามารถชี้แจงคำถามของฉันไม่ว่าทางใดทางหนึ่ง (รวมถึงการจัดรูปแบบแท็ก ฯลฯ ) (และหวังว่าฉันจะสามารถแก้ไขได้ในภายหลัง!) ฉันพยายามค้นหาการอ้างอิงและพยายามแก้ไขตัวเองโดยใช้การเหนี่ยวนำ แต่ล้มเหลวทั้งสองอย่าง

ฉันพยายามทำให้การกระจายง่ายขึ้นซึ่งดูเหมือนว่าจะลดลงเป็นสถิติการเรียงลำดับของตัวแปรสุ่มอิสระไม่มีที่สิ้นสุดพร้อมด้วยองศาอิสระที่แตกต่างกัน โดยเฉพาะการกระจายตัวของค่าที่เล็กที่สุดในคืออะไรระหว่าง\ chi ^ 2_2, \ chi ^ 2_4, \ chi ^ 2_6, \ chi ^ 2_8, \ ldots ?χ2mχ22,χ42,χ62,χ82,

ฉันสนใจกรณีพิเศษm=1 : การกระจายขั้นต่ำของ (อิสระ) χ22,χ42,χ62,คืออะไร?

สำหรับกรณีที่น้อยที่สุดฉันสามารถเขียนฟังก์ชันการแจกแจงสะสม (CDF) เป็นผลิตภัณฑ์ที่ไม่มีที่สิ้นสุด แต่ไม่สามารถทำให้มันง่ายขึ้นอีก ฉันใช้ข้อเท็จจริงว่า CDF ของχ2m2คือ

F2m(x)=γ(m,x/2)/Γ(m)=γ(m,x/2)/(m1)!=1ex/2k=0m1xk/(2kk!).
(ด้วยm=1นี่เป็นการยืนยันความคิดเห็นที่สองด้านล่างเกี่ยวกับความเท่าเทียมกับการแจกแจงแบบเอ็กซ์โพเนนเชียลโดยมีความคาดหวัง 2) CDF ของขั้นต่ำสามารถเขียนเป็น
Fmin(x)=1(1F2(x))(1F4(x))=1m=1(1F2m(x))
=1m=1(ex/2k=0m1xk2kk!).
เทอมแรกในผลิตภัณฑ์คือแค่ex/2และคำว่า "สุดท้าย" คือex/2k=0xk/(2kk!)=1 1 แต่ฉันไม่รู้ว่าจะทำอย่างไร (ถ้าเป็นไปได้) จากที่นั่น หรืออาจเป็นวิธีที่แตกต่างกันโดยสิ้นเชิงจะดีกว่า

การแจ้งเตือนที่เป็นประโยชน์อื่นที่อาจเป็นประโยชน์: χ22เหมือนกับการแจกแจงเอ็กซ์โพเนนเชียลที่มีความคาดหวัง 2 และχ42คือผลรวมของเลขชี้กำลังสองค่าดังกล่าวเป็นต้น

ถ้าใครอยากรู้อยากเห็นฉันพยายามที่จะลดความซับซ้อนของทฤษฎีบท 1 ในบทความนี้สำหรับกรณีของการถดถอยในคงที่ ( xi=1สำหรับทุกi ) (ฉันมีχ2แทนการแจกแจงΓเนื่องจากฉันคูณด้วย2κ )


ไม่นี้ตอบคำถามของคุณ?
mpiktas

@mpiktas: ขอบคุณสำหรับคำแนะนำ มันคล้ายกันยกเว้นแทนที่จะเป็นเลขชี้กำลังที่มีพารามิเตอร์อัตราที่แตกต่างกันฉันมีไคสแควร์ที่มีองศาอิสระต่างกัน (และจำนวนอนันต์ของพวกเขาไม่ใช่ จำกัด ) และในขณะที่เป็นเลขชี้กำลัง,ไม่ใช่; มันเป็นผลรวมของเลขชี้กำลัง แต่ผลบวกของเลขชี้กำลังนั้นไม่ใช่เลขชี้กำลัง (และในอุดมคติฉันหวังว่าจะเป็นสถิติการสั่งซื้อทั่วไปแม้ว่านาทีจะเป็นการเริ่มต้นที่ดี)χ22χ42,χ62,
David M Kaplan

1
ฉันสงสัยว่ามันมีรูปแบบปิดสำหรับเรื่องนี้ มันมีลักษณะนิสัยแปลก ๆ : เมื่อคือ iid Poisson ( ) ผันแปร,ดังนั้นเป็นโอกาสที่ . Xkλ/2k=1,2,1Fmin(λ)Xkk
whuber

1
@whuber: มันอาจจะไม่ค่อยอยากรู้อยากเห็นเมื่อคิดในแง่ของกระบวนการปัวซงซึ่งเป็นสูตรที่ฉันเคยเล่นด้วย ให้เป็น iidตัวแปรสุ่มที่มีกระบวนการปัวซองที่สอดคล้องกันอัตรา1/2ให้ , ,เป็นต้นจากนั้นเป็นอิสระและโดยคุณสมบัติอิสระเพิ่มขึ้นแบบคงที่ของกระบวนการปัวส์ซอง มีที่i) T1,T2,Exp(1/2)N(t):=sup{n:i=1nTit}1/2U1=T1U2=T2+T3U3=T4+T5+T6Uiχ2i2P(Uit)=P(N(t)i)
พระคาร์ดินัล

@ สำคัญแน่นอนว่าเป็นวิธีที่ดีในการดู ความอยากรู้อยากเห็นไม่ได้อยู่ในความสัมพันธ์ระหว่าง Poissons และ Gammas มันอยู่ในคำอธิบายของเหตุการณ์เอง!
whuber

คำตอบ:


8

เลขศูนย์ของผลิตภัณฑ์อนันต์จะเป็นศูนย์รวมของข้อตกลง การคำนวณระยะที่ 20 แสดงรูปแบบทั่วไป:

จุดศูนย์รวมที่ซับซ้อน

พล็อตของศูนย์ในระนาบเชิงซ้อนนี้จะแยกแยะการมีส่วนร่วมของคำศัพท์แต่ละคำในผลิตภัณฑ์โดยใช้สัญลักษณ์ที่แตกต่างกัน: ในแต่ละขั้นตอนเส้นโค้งที่ชัดเจนจะขยายออกไปมากขึ้นและเริ่มโค้งใหม่ยิ่งขึ้นไปอีก

ความซับซ้อนของภาพนี้แสดงให้เห็นถึงมีอยู่ไม่มีการแก้ปัญหาปิดแบบฟอร์มในแง่ของฟังก์ชั่นที่รู้จักกันดีของการวิเคราะห์ที่สูงขึ้น (เช่น gammas, Thetas หน้าที่ hypergeometric ฯลฯ เช่นเดียวกับฟังก์ชั่นประถมศึกษาตามที่สำรวจในข้อความที่คลาสสิกเช่นWhittaker & วัตสัน )

ดังนั้นปัญหาอาจแตกต่างไปจากที่เกิดขึ้นเล็กน้อย : คุณต้องรู้อะไรเกี่ยวกับการแจกแจงของสถิติการสั่งซื้อ การประมาณฟังก์ชั่นลักษณะของพวกเขา? ช่วงเวลาการสั่งซื้อต่ำ ประมาณควอนไทล์? อื่น ๆ อีก?


ทำไมเลขศูนย์ของผลิตภัณฑ์ถึงมีความสำคัญ ฉันรู้สึกว่าฉันขาดอะไรไปซักนิด
mpiktas

2
@mp ศูนย์และเสาแสดงบางอย่างเกี่ยวกับความซับซ้อนของฟังก์ชัน ฟังก์ชัน Rational มีจำนวน จำกัด ฟังก์ชั่นประถมมักจะมีเส้นศูนย์เช่นที่ ,ครบถ้วนสำหรับ ; ฟังก์ชั่น "ยอดเยี่ยม" ทั่วไปมีรูปแบบที่ซับซ้อนกว่าเล็กน้อยของค่าศูนย์เช่นที่จำนวนเต็มบวกที่ไม่เป็นบวก (ซึ่งกันและกันของฟังก์ชันแกมมา) หรือบนจุดของจุด (ฟังก์ชัน theta และฟังก์ชันรูปไข่) รูปแบบที่ซับซ้อนที่แสดงที่นี่ชี้ให้เห็นว่าเป็นการยากหรือเป็นไปไม่ได้ที่จะแสดง CDF ในแง่ของฟังก์ชั่นที่คุ้นเคยเหล่านี้ 2iπnnexp()
whuber

2
@whuber (1/2) ขอบคุณ! ฉันไม่รู้เกี่ยวกับคลาสที่แตกต่างกันของฟังก์ชันที่มีรูปแบบของศูนย์ในระนาบเชิงซ้อน ฟังดูมีประโยชน์มากและกราฟของคุณดูเหมือนจะตอบคำถามของฉัน
David M Kaplan

@whuber (2/2) นี่เป็นการตรวจสอบกรณีพิเศษของการแจกแจง (ซับซ้อน) ของตัวประมาณที่ให้ไว้ในเอกสารอื่น พวกเขาใช้การมีอยู่ของการแจกแจงเพื่อปรับการใช้ bootstrap ที่ปรึกษาของฉันแนะนำฉันพยายามประมาณการกระจายตัว ดูเหมือนว่าการแจกจ่ายของพวกเขาอาจถูกปิดสำหรับกรณีพิเศษนี้ (ที่ฉันรู้ว่าควรจะเป็นอะไร) ดังนั้นฉันจะตรวจสอบที่ปรึกษาของฉันหลังจากกำหนดเวลาสิ้นสุดของเขา แต่อาจเป็นไปได้ฉันจะพยายามขยายลำดับที่สูงขึ้นของลำดับที่ -order (หารด้วย ) เป็นในการตั้งค่าที่ซับซ้อนมากขึ้น จะโพสต์อีกครั้งถ้าเป็นเช่นนั้น ขอบคุณอีกครั้ง! mmm
David M Kaplan

4

การกระจายขั้นต่ำของ (อิสระ) คืออะไร ?χ22,χ42,χ62,

ขอโทษที่มาสายประมาณ 6 ปี แม้ว่า OP มีแนวโน้มที่จะย้ายไปที่ปัญหาอื่น ๆ คำถามยังคงสดและฉันคิดว่าฉันอาจแนะนำวิธีการที่แตกต่างกัน


เราได้รับโดยที่โดยที่พร้อม pdf ของ :(X1,X2,X3,)XiChisquared(vi)vi=2ifi(xi)

ป้อนคำอธิบายรูปภาพที่นี่

นี่คือพล็อตของของ pdf ที่สอดคล้องกันเมื่อขนาดของตัวอย่างเพิ่มขึ้นสำหรับ :fi(xi)i=1 to 8

ป้อนคำอธิบายรูปภาพที่นี่

เรามีความสนใจในการกระจายของจุด)min(X1,X2,X3,)

ทุกครั้งที่เราเพิ่มคำศัพท์พิเศษ PDF ของคำสุดท้ายที่เพิ่มเข้ามาจะถูกเลื่อนออกไปทางขวาเพื่อให้ผลของการเพิ่มคำศัพท์มากขึ้นไม่เพียง แต่มีความเกี่ยวข้องน้อยลง แต่ยังมีความเกี่ยวข้องน้อยกว่า , เกือบจะเล็กน้อย - ตัวอย่างขั้นต่ำสุด ซึ่งหมายความว่ามีเพียงจำนวนน้อยมากที่มีแนวโน้มที่จะสำคัญ ... และการเพิ่มคำเพิ่มเติม (หรือการปรากฏตัวของจำนวนอนันต์ของคำศัพท์) นั้นไม่เกี่ยวข้องกับปัญหาขั้นต่ำตัวอย่างมาก

ทดสอบ

เพื่อทดสอบสิ่งนี้ฉันได้คำนวณ pdf ของเป็น 1 เทอม, 2 เทอม, 3 เทอม, 4 เทอม, 5 เทอม, 6 เทอม, 7 เทอม, 8 เทอม, ถึง 9 ข้อกำหนดและ 10 ข้อกำหนด เมื่อต้องการทำสิ่งนี้ฉันได้ใช้ฟังก์ชันจากmathStaticaสั่งให้ที่นี่เพื่อคำนวณ pdf ของตัวอย่างขั้นต่ำ (สถิติการสั่งซื้อ) ในตัวอย่างของขนาดและที่พารามิเตอร์ (แทน กำลังถูกแก้ไข) คือ :min(X1,X2,X3,)OrderStatNonIdentical1stjivi

ป้อนคำอธิบายรูปภาพที่นี่ ป้อนคำอธิบายรูปภาพที่นี่

มันซับซ้อนเล็กน้อยเมื่อจำนวนคำเพิ่มขึ้น ... แต่ฉันได้แสดงผลลัพธ์สำหรับ 1 เทอม (แถวที่ 1), 2 เทอม (แถวที่สอง), 3 คำ (แถวที่ 3) และ 4 คำข้างต้น

แผนภาพต่อไปนี้เปรียบเทียบ pdf ของตัวอย่างขั้นต่ำกับ 1 เทอม (สีน้ำเงิน), 2 เทอม (ส้ม), 3 เทอมและ 10 เทอม (สีแดง) โปรดทราบว่าผลลัพธ์ที่คล้ายกันมีเพียง 3 คำเทียบกับ 10 คำ: ป้อนคำอธิบายรูปภาพที่นี่

แผนภาพต่อไปนี้เปรียบเทียบ 5 เทอม (สีน้ำเงิน) และ 10 เทอม (ส้ม) - พล็อตมีความคล้ายคลึงกันมากพวกมันลบล้างซึ่งกันและกันและอีกอันหนึ่งไม่สามารถมองเห็นความแตกต่าง:

ป้อนคำอธิบายรูปภาพที่นี่

กล่าวอีกนัยหนึ่งการเพิ่มจำนวนคำจาก 5 เป็น 10 แทบไม่มีผลกระทบต่อการมองเห็นที่เห็นได้ชัดในการแจกตัวอย่างขั้นต่ำ

การประมาณครึ่งโลจิสติก

ในที่สุดการประมาณอย่างง่ายที่ยอดเยี่ยมของ pdf ของตัวอย่าง min คือการกระจายแบบครึ่งโลจิสติกด้วย pdf:

g(x)=2ex(ex+1)2 for x>0

ไดอะแกรมต่อไปนี้เปรียบเทียบโซลูชันที่แน่นอนด้วย 10 คำศัพท์ (ซึ่งไม่สามารถแยกความแตกต่างจาก 5 คำหรือ 20 คำ) และการประมาณครึ่งโลจิสติก (ประ)

ป้อนคำอธิบายรูปภาพที่นี่

การเพิ่มขึ้นของ 20 เทอมทำให้ไม่สามารถแยกความแตกต่างได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.