คำถามติดแท็ก mathematical-statistics

ทฤษฎีทางคณิตศาสตร์ของสถิติที่เกี่ยวข้องกับคำจำกัดความที่เป็นทางการและผลลัพธ์ทั่วไป

2
เหตุใดตระกูลเลขชี้กำลังจึงไม่รวมการแจกแจงทั้งหมด
ฉันกำลังอ่านหนังสือ: บิชอปการจดจำรูปแบบและการเรียนรู้ของเครื่อง (2549) ซึ่งกำหนดตระกูลเอ็กซ์โพเนนเชียลเป็นการแจกแจงของแบบฟอร์ม (Eq. 2.194): p(x|η)=h(x)g(η)exp{ηTu(x)}p(x|η)=h(x)g(η)exp⁡{ηTu(x)}p(\mathbf x|\boldsymbol \eta) = h(\mathbf x) g(\boldsymbol \eta) \exp \{\boldsymbol \eta^\mathrm T \mathbf u(\mathbf x)\} แต่ผมไม่เห็นข้อ จำกัด ที่วางอยู่บนหรือ\ mathbf U (\ mathbf x) นี่ไม่ได้หมายความว่าการแจกแจงใด ๆสามารถใส่ในแบบฟอร์มนี้ได้โดยการเลือกh (\ mathbf x)และ\ mathbf u (\ mathbf x) (อันที่จริงแล้วจะต้องเลือกอย่างใดอย่างหนึ่งอย่างถูกต้อง!) แล้วทำไมครอบครัวเลขชี้กำลังถึงไม่ได้รวมการแจกแจงความน่าจะเป็นทั้งหมด ฉันพลาดอะไรไปu ( x )h(x)h(x)h(\mathbf x)u(x)u(x)\mathbf u(\mathbf x)u ( x …

3
อะไรคือความแตกต่างระหว่าง“ การทดสอบทางสถิติ” และ“ แบบจำลองเชิงสถิติ”?
ฉันกำลังติดตาม AW van der Vaart, สถิติแบบอะซิติกติก (1998) เขาพูดถึงการทดลองทางสถิติโดยอ้างว่าพวกเขาแตกต่างจากแบบจำลองทางสถิติ แต่เขาไม่ได้กำหนด คำถามของฉัน: (1) การทดลองทางสถิติคืออะไร (2) แบบจำลองทางสถิติและ (3) ส่วนประกอบสำคัญที่มักจะทำให้การทดลองทางสถิติแตกต่างจากแบบจำลองทางสถิติใด ๆ เสมอ?

7
“ การแจกจ่ายปกติ” จำเป็นต้องมีค่าเฉลี่ย = มัธยฐาน = โหมดหรือไม่?
ฉันกำลังถกเถียงกับอาจารย์สถิติระดับบัณฑิตศึกษาเกี่ยวกับ "การแจกแจงแบบปกติ" ฉันขอยืนยันว่าการได้รับการแจกแจงแบบปกติอย่างแท้จริงต้องมีค่าเฉลี่ย = มัธยฐาน = โหมดข้อมูลทั้งหมดจะต้องอยู่ภายใต้เส้นโค้งรูประฆังและสมมาตรรอบ ๆ ค่าเฉลี่ยอย่างสมบูรณ์ ดังนั้นในทางเทคนิคแล้วไม่มีการแจกแจงแบบปกติในการศึกษาจริงและเราควรเรียกพวกมันอย่างอื่นบางทีอาจจะ "ใกล้เคียงปกติ" เธอบอกว่าฉันจู้จี้จุกจิกมากเกินไปและถ้าความเบ้ / ความโด่งต่ำกว่า 1.0 มันเป็นการแจกแจงแบบปกติและเอาคะแนนไปสอบ ชุดข้อมูลคือจำนวนรวมของน้ำตก / ปีในการสุ่มตัวอย่างจากบ้านพักคนชรา 52 แห่งซึ่งเป็นกลุ่มตัวอย่างที่สุ่มของประชากรขนาดใหญ่ ความเข้าใจใด ๆ ปัญหา: คำถาม: 3. คำนวณหาค่าความเบ้และความโด่งของข้อมูลนี้ รวมฮิสโตแกรมด้วยเส้นโค้งปกติ อภิปรายสิ่งที่คุณค้นพบ มีการกระจายข้อมูลตามปกติหรือไม่ Statistics Number of falls N Valid 52 Missing 0 Mean 11.23 Median 11.50 Mode 4a มีหลายโหมด ค่าที่น้อยที่สุดจะปรากฏขึ้น Number of falls …

1
โอกาสสูงสุดและวิธีการของช่วงเวลาผลิตตัวประมาณเดียวกันเมื่อใด
ฉันถูกถามคำถามนี้เมื่อวันก่อนและไม่เคยคิดมาก่อน สัญชาตญาณของฉันมาจากข้อดีของตัวประมาณค่าแต่ละตัว ความเป็นไปได้สูงสุดนั้นดีกว่าเมื่อเรามีความมั่นใจในกระบวนการสร้างข้อมูลเพราะต่างจากวิธีการในช่วงเวลาที่ใช้ความรู้ของการกระจายทั้งหมด เนื่องจากตัวประมาณค่า MoM ใช้ข้อมูลที่มีอยู่ในช่วงเวลาเท่านั้นดูเหมือนว่าทั้งสองวิธีควรสร้างค่าประมาณเดียวกันเมื่อสถิติที่เพียงพอสำหรับพารามิเตอร์ที่เราพยายามจะประมาณนั้นเป็นช่วงเวลาของข้อมูล ฉันตรวจสอบผลลัพธ์นี้ด้วยการแจกแจงไม่กี่ครั้ง ปกติ (ค่าเฉลี่ยและความแปรปรวนที่ไม่รู้จัก), เอ็กซ์โปเนนเชียลและปัวซองมีสถิติที่เพียงพอเท่ากับช่วงเวลาของพวกเขาและมีตัวประมาณค่า MLEs และ MoM เหมือนกัน ถ้าเราดู Uniformสถิติที่เพียงพอสำหรับคือและตัวประมาณ MoM และ MLE แตกต่างกัน( 0 , θ )(0,θ)(0,\theta)θθ\thetaสูงสุด( X1, ⋯ , Xยังไม่มีข้อความ)สูงสุด(X1,⋯,Xยังไม่มีข้อความ)\max(X_1,\cdots,X_N) ฉันคิดว่าบางทีนี่อาจเป็นเหตุการณ์ที่แปลกประหลาดของตระกูลเอ็กซ์โพเนนเชียล แต่สำหรับ Laplace ที่มีค่าเฉลี่ยสถิติที่เพียงพอคือ1n∑ | Xผม|1nΣ|Xผม|\frac{1}{n} \sum |X_i| และตัวประมาณค่า MLE และ MoM สำหรับความแปรปรวนไม่เท่ากัน ฉันไม่สามารถแสดงผลลัพธ์ใด ๆ โดยทั่วไปได้ มีใครทราบถึงเงื่อนไขทั่วไปบ้างไหม หรือแม้แต่ตัวอย่างเคาน์เตอร์ก็ช่วยให้ฉันปรับสัญชาตญาณ

2
การทำคลัสเตอร์ - สัญชาตญาณเบื้องหลังทฤษฎีบทความเป็นไปไม่ได้ของไคลน์เบิร์ก
ฉันกำลังคิดเกี่ยวกับการเขียนโพสต์บล็อกในการวิเคราะห์ที่น่าสนใจนี้โดยKleinberg (2002)ที่สำรวจความยากลำบากในการจัดกลุ่ม Kleinberg แสดงตัวอธิบายลักษณะสามเดเดอราตาที่ใช้งานง่ายสำหรับฟังก์ชั่นการจัดกลุ่มแล้วพิสูจน์ว่าไม่มีฟังก์ชันดังกล่าวอยู่ มีอัลกอริทึมการจัดกลุ่มจำนวนมากที่ satify เกณฑ์สองในสาม อย่างไรก็ตามไม่มีฟังก์ชั่นที่สามารถตอบสนองทั้งสามพร้อมกันได้ โดยสังเขปและอย่างไม่เป็นทางการทั้งสามผู้อธิบายที่เขาสรุปคือ: มาตราส่วน - ค่าคงที่ : ถ้าเราแปลงข้อมูลเพื่อให้ทุกอย่างยืดออกไปในทุกทิศทางผลการจัดกลุ่มไม่ควรเปลี่ยนแปลง ความสอดคล้อง : ถ้าเรายืดข้อมูลเพื่อให้ระยะห่างระหว่างกลุ่มเพิ่มขึ้นและ / หรือระยะทางภายในกลุ่มลดลงดังนั้นผลการจัดกลุ่มไม่ควรเปลี่ยนแปลง ความสมบูรณ์ : ฟังก์ชันการจัดกลุ่มในทางทฤษฎีควรสามารถสร้างพาร์ติชัน / การจัดกลุ่มข้อมูลได้ตามอำเภอใจ (โดยไม่ทราบระยะห่างระหว่างสองจุด) คำถาม: (1)มีสัญชาตญาณภาพเรขาคณิตที่ดีที่สามารถแสดงความไม่สอดคล้องระหว่างเกณฑ์ทั้งสามนี้หรือไม่? (2)นี่หมายถึงรายละเอียดทางเทคนิคของกระดาษ คุณจะต้องอ่านลิงก์ด้านบนเพื่อทำความเข้าใจในส่วนนี้ของคำถาม ในกระดาษการพิสูจน์ทฤษฎีบท 3.1 เป็นเรื่องยากสำหรับฉันที่จะตามไปที่จุด ฉันติดอยู่ที่: "Let fff . จะเป็นฟังก์ชั่นการจัดกลุ่มที่ตอบสนองความสอดคล้องเราอ้างว่าสำหรับการใด ๆ พาร์ทิชันΓ∈Range(f)Γ∈Range(f)\Gamma \in \text{Range}(f)ที่มีอยู่จำนวนจริงบวก&lt; ขดังกล่าวว่าคู่( , ข)เป็นΓ - บังคับให้."a&lt;ba&lt;ba < b(a,b)(a,b)(a, b)ΓΓ\Gamma ฉันไม่เห็นว่าสิ่งนี้จะเกิดขึ้นได้อย่างไร …

1
อะไรรับประกันทางทฤษฎีของการบรรจุถุง
ฉันได้ยิน (โดยประมาณ) ว่า: การห่อเป็นเทคนิคที่ช่วยลดความแปรปรวนของอัลกอริทึมตัวทำนาย / ตัวประมาณ / การเรียนรู้ อย่างไรก็ตามฉันไม่เคยเห็นหลักฐานทางคณิตศาสตร์อย่างเป็นทางการของข้อความนี้ ไม่มีใครรู้ว่าทำไมสิ่งนี้ถึงเป็นจริงในเชิงคณิตศาสตร์? ดูเหมือนว่าจะเป็นความจริงที่เป็นที่ยอมรับ / เป็นที่รู้จักอย่างกว้างขวางซึ่งฉันคาดหวังว่าจะมีการอ้างอิงโดยตรงกับสิ่งนี้ ฉันจะแปลกใจถ้าไม่มี นอกจากนี้ไม่มีใครรู้ว่าสิ่งนี้มีผลกระทบต่อความลำเอียง? มีการรับรองทางทฤษฎีอื่น ๆ เกี่ยวกับวิธีการบรรจุถุงที่ทุกคนรู้และคิดว่ามีความสำคัญและต้องการแบ่งปันหรือไม่

2
ตัวอย่างก่อนหน้านี้ซึ่งแตกต่างจาก Jeffreys นำไปสู่การหลังที่ไม่คงที่
ฉันกำลังโพสต์ข้อความ "คำตอบ" สำหรับคำถามที่ฉันให้ไว้เมื่อสองสัปดาห์ก่อนที่นี่: ทำไม Jeffreys จึงมีประโยชน์มาก่อน มันเป็นคำถามจริงๆ (และฉันไม่มีสิทธิ์ในการโพสต์ความคิดเห็นในเวลานั้น) อย่างไรก็ตามดังนั้นฉันหวังว่าจะเป็นเช่นนั้น: ในลิงก์ด้านบนมีการกล่าวถึงคุณสมบัติที่น่าสนใจของ Jeffreys ก่อนคือเมื่อทำการวิเคราะห์รูปแบบซ้ำการกระจายหลังทำให้เกิดความน่าจะเป็นหลังซึ่งเป็นไปตามข้อ จำกัด ที่กำหนดโดยการเปลี่ยนแปลง กล่าวว่าตามที่กล่าวไว้ที่นั่นเมื่อย้ายจากความสำเร็จที่น่าจะเป็นθθ\thetaในตัวอย่าง Beta-Bernoulli อัตราต่อรองψ=θ/(1−θ)ψ=θ/(1−θ)\psi=\theta/(1-\theta)ก็ควรจะเป็นกรณีที่มีความพึงพอใจหลังP(1/3≤θ≤2/3∣X=x)=P(1/2≤ψ≤2∣X=x)P(1/3≤θ≤2/3∣X=x)=P(1/2≤ψ≤2∣X=x)P(1/3\leq\theta\leq 2/3\mid X=x)=P(1/2\leq\psi\leq 2\mid X=x) ) ฉันอยากจะสร้างตัวอย่างที่ตัวเลขของการแปรเปลี่ยนของฟรีย์ก่อนสำหรับการเปลี่ยนθθ\thetaอัตราต่อรองψψ\psiและอื่น ๆ อีกมากมายที่น่าสนใจขาดมันของไพรเออร์อื่น ๆ (พูด, Haldane เครื่องแบบหรือคนโดยพล) ตอนนี้ถ้าหลังสำหรับความน่าจะเป็นความสำเร็จคือเบต้า (Beta สำหรับการใด ๆ ก่อนฟรีย์ไม่ได้เท่านั้น) หลังของราคาดังต่อไปนี้การกระจายเบต้าของประเภทที่สอง (ดูวิกิพีเดีย) กับพารามิเตอร์เดียวกัน จากนั้นดังที่ไฮไลต์ในตัวอย่างตัวเลขด้านล่างมันไม่น่าแปลกใจเกินไป (สำหรับฉันอย่างน้อย) ที่มีค่าคงที่สำหรับตัวเลือกเบต้าใด ๆ ก่อนหน้านี้ (เล่นรอบ ๆ ด้วยalpha0_Uและbeta0_U) ไม่ใช่แค่ Jeffreys, cf ผลลัพธ์ของโปรแกรม library(GB2) …

3
ทำไมเราถึงหารด้วยค่าเบี่ยงเบนมาตรฐานและไม่ใช่ปัจจัยมาตรฐานอื่น ๆ ก่อนทำ PCA
ฉันกำลังอ่านเหตุผลต่อไปนี้ (จากบันทึกหลักสูตร cs229) ว่าทำไมเราแบ่งข้อมูลดิบด้วยค่าเบี่ยงเบนมาตรฐาน: แม้ว่าฉันจะเข้าใจสิ่งที่คำอธิบายพูด แต่ก็ไม่ชัดเจนสำหรับฉันว่าทำไมการหารด้วยค่าเบี่ยงเบนมาตรฐานจะบรรลุเป้าหมายดังกล่าว มันบอกว่าเพื่อให้ทุกคนอยู่ใน "ระดับ" มากกว่าเดิม อย่างไรก็ตามมันไม่ชัดเจนเลยว่าทำไมการหารด้วยค่าเบี่ยงเบนมาตรฐานจึงทำได้ ชอบมีอะไรผิดปกติกับการหารด้วยความแปรปรวน? ทำไมไม่ลองปริมาณอื่นล่ะ ชอบ ... ผลรวมของค่าสัมบูรณ์? หรือบรรทัดฐานอื่น ๆ ... มีเหตุผลทางคณิตศาสตร์ในการเลือก STD หรือไม่? การอ้างสิทธิ์ในสารสกัดนี้เป็นข้อความเชิงทฤษฎีที่สามารถได้มา / พิสูจน์ผ่านทางคณิตศาสตร์ (และ / หรือสถิติ) หรือเป็นอีกหนึ่งประโยคที่เราทำเพราะดูเหมือนจะทำงานใน "ฝึกหัด" หรือไม่? โดยพื้นฐานแล้วเราสามารถให้คำอธิบายทางคณิตศาสตร์อย่างเข้มงวดว่าทำไมสัญชาตญาณนั้นเป็นความจริง หรือถ้าเป็นเพียงการสังเกตเชิงประจักษ์ทำไมเราคิดว่ามันใช้งานได้ทั่วไปก่อนทำ PCA นอกจากนี้ในบริบทของ PCA นี่คือกระบวนการของการทำให้เป็นมาตรฐานหรือทำให้เป็นมาตรฐานหรือไม่ ความคิดอื่น ๆ ที่ฉันมีที่อาจ "อธิบาย" ทำไม STD: เนื่องจาก PCA สามารถหาได้จากการเพิ่มความแปรปรวนให้มากที่สุดฉันเดาว่าการหารด้วยปริมาณที่เกี่ยวข้องเช่น STD อาจเป็นหนึ่งในเหตุผลที่เราหารด้วย STD แต่ฉันก็คิดว่าบางทีถ้าเรานิยาม "ความแปรปรวน" …

4
แหล่งข้อมูลที่ดี (ออนไลน์หรือหนังสือ) บนพื้นฐานทางคณิตศาสตร์ของสถิติ
ก่อนที่ฉันจะถามคำถามของฉันขอให้ฉันเล่าข้อมูลบางอย่างเกี่ยวกับสิ่งที่ฉันรู้เกี่ยวกับสถิติเพื่อให้คุณมีความเข้าใจที่ดีขึ้นเกี่ยวกับประเภทของทรัพยากรที่ฉันกำลังมองหา ฉันเป็นนักศึกษาระดับบัณฑิตศึกษาด้านจิตวิทยาและด้วยเหตุนี้ฉันจึงใช้สถิติเกือบทุกวัน ตอนนี้ฉันคุ้นเคยกับเทคนิคที่หลากหลายอย่างกว้างขวางซึ่งส่วนใหญ่เป็นการนำไปใช้ในกรอบการสร้างแบบจำลองสมการโครงสร้างทั่วไป อย่างไรก็ตามการฝึกอบรมของฉันใช้เทคนิคเหล่านี้และการตีความผลลัพธ์ - ฉันไม่มีความรู้พื้นฐานทางคณิตศาสตร์อย่างเป็นทางการของเทคนิคเหล่านี้ อย่างไรก็ตามยิ่งขึ้นฉันต้องอ่านเอกสารจากสถิติที่เหมาะสม ฉันพบว่าเอกสารเหล่านี้มักจะมีความรู้ในการทำงานเกี่ยวกับแนวคิดทางคณิตศาสตร์ที่ฉันไม่รู้จักมากเช่นพีชคณิตเชิงเส้น ดังนั้นฉันจึงเชื่อมั่นว่าหากฉันต้องการใช้เครื่องมือที่ฉันสอนมากกว่าสุ่มสี่สุ่มห้ามันจะมีประโยชน์สำหรับฉันที่จะเรียนรู้พื้นฐานทางคณิตศาสตร์ของสถิติ ดังนั้นฉันมีสองคำถามที่เกี่ยวข้อง: เทคนิคทางคณิตศาสตร์อะไรบ้างที่จะเป็นประโยชน์สำหรับฉันที่จะรู้ว่าถ้าฉันต้องการที่จะแปรงบนพื้นฐานทางคณิตศาสตร์ของสถิติ? ฉันพบพีชคณิตเชิงเส้นค่อนข้างบ่อยและฉันแน่ใจว่าการเรียนรู้เกี่ยวกับทฤษฎีความน่าจะเป็นมีประโยชน์ แต่มีประเด็นทางคณิตศาสตร์อื่น ๆ ที่จะเป็นประโยชน์สำหรับฉันที่จะเรียนรู้หรือไม่? คุณสามารถแนะนำทรัพยากรใด (ออนไลน์หรือในรูปแบบหนังสือ) ให้ฉันในฐานะคนที่ต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับรากฐานทางคณิตศาสตร์ของสถิติ

4
ทำไมความเป็นอิสระหมายถึงความสัมพันธ์เป็นศูนย์?
ก่อนอื่นฉันไม่ได้ถามสิ่งนี้: ทำไมความสัมพันธ์แบบศูนย์ไม่มีนัยถึงความเป็นอิสระ? นี่คือที่อยู่(ค่อนข้างดี)ที่นี่: /math/444408/why-does-zero-correlation-not-imply-independence สิ่งที่ฉันถามอยู่ตรงข้าม ... บอกว่าตัวแปรสองตัวเป็นอิสระจากกัน พวกเขาไม่สามารถมีความสัมพันธ์กันเล็กน้อยโดยไม่ได้ตั้งใจหรือไม่? มันไม่ควรจะเป็น ... ความเป็นอิสระหมายถึงสหสัมพันธ์น้อยมาก?

4
สถิติแบบเบย์จัดการกับการไม่มีตัวตนอย่างไร
คำถามนี้ได้รับแรงบันดาลใจจากการโต้ตอบสองครั้งล่าสุดที่ฉันมีหนึ่งที่นี่ในประวัติย่อส่วนอีกเรื่องที่economics.se ที่นั่นผมได้โพสต์คำตอบไปที่รู้จักกันดี "ซองจดหมาย Paradox" (ใจคุณไม่เป็น"คำตอบที่ถูกต้อง" แต่เป็นคำตอบที่ไหลออกมาจากสมมติฐานที่เฉพาะเจาะจงเกี่ยวกับโครงสร้างของสถานการณ์) หลังจากนั้นสักครู่ผู้ใช้โพสต์ความคิดเห็นที่สำคัญและฉันมีส่วนร่วมในการสนทนาพยายามที่จะเข้าใจประเด็นของเขา มันก็เห็นได้ชัดว่าเขาคิดวิธีคชกรรมและเก็บไว้พูดคุยเกี่ยวกับไพรเออร์และอื่นแล้วมัน dawned กับฉันและผมพูดกับตัวเอง: "รอนาทีที่บอกอะไรเกี่ยวกับเรื่องใดก่อน?ในทางที่ผมได้สูตร ปัญหาไม่มีนักบวชอยู่ที่นี่พวกเขาแค่ไม่ป้อนรูปภาพและไม่จำเป็นต้อง " เมื่อเร็ว ๆ นี้ฉันเห็นคำตอบนี้ในประวัติย่อเกี่ยวกับความหมายของความเป็นอิสระทางสถิติ ฉันให้ความเห็นกับผู้เขียนว่าประโยคของเขา "... ถ้าเหตุการณ์มีความเป็นอิสระทางสถิติแล้ว (โดยคำจำกัดความ) เราไม่สามารถเรียนรู้เกี่ยวกับสิ่งหนึ่งจากการสังเกตอื่น ๆ " ผิดอย่างโจ๋งครึ่ม ในการแลกเปลี่ยนความคิดเห็นเขายังคงกลับไปที่ปัญหาของ (คำพูดของเขา) "การเรียนรู้" จะไม่หมายถึงการเปลี่ยนความเชื่อของเราเกี่ยวกับสิ่งที่อยู่บนพื้นฐานของการสังเกตของผู้อื่นหรือไม่ถ้าเป็นเช่นนั้นไม่เป็นอิสระ (นิยาม) แยกแยะเรื่องนี้? อีกครั้งเห็นได้ชัดว่าเขาคิดแบบเบย์และเขาคิดว่าตนเองชัดเจนว่าเราเริ่มต้นด้วยความเชื่อบางอย่าง (เช่นก่อนหน้า)แล้วปัญหาคือวิธีที่เราสามารถเปลี่ยน / อัปเดตพวกเขา แต่ความเชื่อครั้งแรกเกิดขึ้นได้อย่างไร? เนื่องจากวิทยาศาสตร์จะต้องสอดคล้องกับความเป็นจริงฉันทราบว่าสถานการณ์มีอยู่ว่ามนุษย์มีส่วนเกี่ยวข้องไม่มีนักบวช (ฉันมีสิ่งหนึ่งที่เดินเข้าสู่สถานการณ์โดยไม่เคยมีมาก่อน - และโปรดอย่าเถียงว่าฉันมีนักบวช แต่ฉัน เพียงแค่ไม่ได้ตระหนักถึงมันขอให้ตัวเองจิตปลอมที่นี่) เนื่องจากฉันเคยได้ยินคำว่า "นักบวชที่ไม่รู้เรื่อง" ฉันจึงแบ่งคำถามของฉันออกเป็นสองส่วนและฉันค่อนข้างมั่นใจว่าผู้ใช้ที่นี่ที่เข้าใจในทฤษฎี Bayesian รู้ว่าฉันกำลังจะถามอะไร: คำถามที่ 1: การไม่มีตัวตนที่เทียบเท่าก่อนหน้านี้ (ในแง่ทฤษฎีที่เข้มงวด) …

1
ช่องว่างสูงสุดระหว่างตัวอย่างที่วาดโดยไม่ต้องเปลี่ยนจากการแจกแจงแบบไม่ต่อเนื่อง
ปัญหานี้เกี่ยวข้องกับการวิจัยในห้องปฏิบัติการของฉันเกี่ยวกับการครอบคลุมของหุ่นยนต์: สุ่มตัวเลขจาก setโดยไม่มีการแทนที่และเรียงลำดับตัวเลขจากมากไปหาน้อย เมตรnnn{1,2,…,m}{1,2,…,m}\{1,2,\ldots,m\}1≤n≤m1≤n≤m1\le n\le m จากรายการที่เรียงลำดับหมายเลข , สร้างความแตกต่างระหว่างตัวเลขที่ต่อเนื่องกันและขอบเขต:\} นี่จะให้ช่องว่างของn + 1{a(1),a(2),…,a(n)}{a(1),a(2),…,a(n)}\{a_{(1)},a_{(2)},…,a_{(n)}\}g={a(1),a(2)−a(1),…,a(n)−a(n−1),m+1−a(n)}g={a(1),a(2)−a(1),…,a(n)−a(n−1),m+1−a(n)}g = \{a_{(1)},a_{(2)}−a_{(1)},\ldots,a_{(n)}−a_{(n-1)},m+1-a_{(n)}\}n+1n+1n+1 การกระจายตัวของช่องว่างสูงสุดคืออะไร? P(max(g)=k)=P(k;m,n)=?P(max(g)=k)=P(k;m,n)=?P(\max(g) = k) = P(k;m,n) = ? คุณสามารถใส่กรอบนี้โดยใช้สถิติการสั่งซื้อ : P(g(n+1)=k)=P(k;m,n)=?P(g(n+1)=k)=P(k;m,n)=?P(g_{(n+1)} = k) = P(k;m,n) = ? ดูลิงค์สำหรับการกระจายของช่องว่างแต่คำถามนี้ถามกระจายช่องว่างสูงสุด ฉันจะพอใจกับค่าเฉลี่ยE[g(n+1)]E[g(n+1)]\mathbb{E}[g_{(n+1)}]1)}] หากn=mn=mn=mช่องว่างทั้งหมดคือขนาด 1 หากn+1=mn+1=mn+1 = mจะมีช่องว่างขนาดหนึ่ง222และn+1n+1n+1ตำแหน่งที่เป็นไปได้ ขนาดช่องว่างสูงสุดคือm−n+1m−n+1m-n+1และช่องว่างนี้สามารถวางไว้ก่อนหรือหลัง หมายเลขnใด ๆnnnสำหรับตำแหน่งที่เป็นไปได้ทั้งหมดn+1n+1n+1ขนาดช่องว่างสูงสุดที่เล็กที่สุดคือ\⌈m−nn+1⌉⌈m−nn+1⌉\lceil\frac{m-n}{n+1}\rceilกำหนดความน่าจะเป็นของการรวมกันใดก็ตามT=(mn)−1T=(mn)−1T= {m \choose n}^{-1}1} ฉันได้แก้ไขฟังก์ชันความน่าจะเป็นบางส่วนเป็น P(g(n+1)=k)=P(k;m,n)=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪011T(n+1)T(n+1)?T(n+1)0k&lt;⌈m−nn+1⌉k=m−nn+1k=1 (occurs when m=n)k=2 (occurs …

2
ระบบพลวัตดูทฤษฎีบทขีด จำกัด กลางหรือไม่?
( โพสต์ครั้งแรกใน MSE) ฉันได้เห็นการอภิปรายแบบฮิวริสติกจำนวนมากของทฤษฎีบทขีด จำกัด กลางแบบคลาสสิกพูดถึงการแจกแจงแบบปกติ (หรือการแจกแจงแบบคงที่ใด ๆ ) เป็น "ตัวดึงดูด" ในพื้นที่ความหนาแน่นของความน่าจะเป็น ตัวอย่างเช่นพิจารณาประโยคเหล่านี้ที่ส่วนบนสุดของการรักษาของ Wikipedia : ในการใช้งานทั่วไปมากขึ้นทฤษฎีบทขีด จำกัด กลางคือชุดของทฤษฎีบทการลู่เข้าแบบอ่อนในทฤษฎีความน่าจะเป็น พวกเขาทั้งหมดแสดงความจริงที่ว่าผลรวมของตัวแปรสุ่มแบบอิสระและแบบกระจาย (iid) จำนวนมากหรือมิฉะนั้นตัวแปรสุ่มที่มีการพึ่งพาประเภทเฉพาะจะมีแนวโน้มที่จะกระจายไปตามชุดการกระจายตัวเล็ก ๆ ชุดหนึ่ง เมื่อความแปรปรวนของตัวแปร iid มีจำนวน จำกัด การกระจายตัวดึงดูดจะเป็นการแจกแจงแบบปกติ ภาษาของระบบพลวัตนี้มีการชี้นำอย่างมาก เฟลเลอร์ยังพูดถึง "การดึงดูด" ในการรักษา CLT ในเล่มที่สองของเขา (ฉันสงสัยว่านั่นคือที่มาของภาษา) และ Yuval Flimus ในบันทึกนี้ยังพูดถึง "อ่างแห่งการดึงดูด" (ฉันไม่คิดว่าเขาหมายถึง "รูปแบบที่แน่นอนของแหล่งท่องเที่ยวนั้นสามารถอนุมานได้ล่วงหน้า" แต่ค่อนข้าง "รูปแบบที่แน่นอนของตัวดึงดูดนั้นสามารถอนุมานได้ล่วงหน้า"; ยังมีภาษาอยู่) คำถามของฉันคือ: สามารถ การเปรียบเทียบแบบไดนามิกจะทำให้แม่นยำ?ฉันไม่รู้หนังสือที่พวกเขาเป็นอยู่ - แม้ว่าหนังสือหลายเล่มจะชี้ให้เห็นว่าการแจกแจงแบบปกตินั้นพิเศษสำหรับความมั่นคงภายใต้การบิด …

2
การแจกแจงแบบใดมีตัวประมาณแบบไม่เอนเอียงสำหรับค่าเบี่ยงเบนมาตรฐาน
สำหรับการแจกแจงแบบปกติจะมีการประมาณค่าส่วนเบี่ยงเบนมาตรฐานโดย: σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2−−−−−−−−−−−−√σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2\hat{\sigma}_\text{unbiased} = \frac{\Gamma(\frac{n-1}{2})}{\Gamma(\frac{n}{2})} \sqrt{\frac{1}{2}\sum_{k=1}^n(x_i-\bar{x})^2} เหตุผลที่ผลนี้ไม่เป็นที่รู้จักเป็นอย่างดีน่าจะเป็นที่มันเป็นส่วนใหญ่โบราณมากกว่าเรื่องของการนำเข้าที่ดีใด ๆ หลักฐานที่จะครอบคลุมในหัวข้อนี้ ; มันใช้ประโยชน์จากคุณสมบัติที่สำคัญของการแจกแจงแบบปกติ: 1σ2∑k=1n(xi−x¯)2∼χ2n−11σ2∑k=1n(xi−x¯)2∼χn−12 \frac{1}{\sigma^2} \sum_{k=1}^n(x_i-\bar{x})^2 \sim \chi^{2}_{n-1} จากนั้นด้วยการทำงานเล็กน้อยก็เป็นไปได้ที่จะคาดหวังและโดยการระบุคำตอบนี้เป็นหลายของσเราสามารถสรุปผลการ σเป็นกลางE(∑nk=1(xi−x¯)2−−−−−−−−−−−−√)E(∑k=1n(xi−x¯)2)\mathbb{E}\left( \sqrt{\sum_{k=1}^n(x_i-\bar{x})^2} \right)σσ\sigmaσ^unbiasedσ^unbiased\hat{\sigma}_\text{unbiased} นี่ทำให้ฉันอยากรู้ว่าการแจกแจงแบบอื่นมีตัวประมาณค่าเบี่ยงเบนมาตรฐานแบบปิดแบบเป็นกลาง ต่างจากการประมาณค่าความแปรปรวนแบบไม่เอนเอียงนี่คือการแจกแจงที่เฉพาะเจาะจงอย่างชัดเจน ยิ่งไปกว่านั้นมันจะไม่ตรงไปตรงมาที่จะปรับเปลี่ยนหลักฐานเพื่อค้นหาตัวประมาณสำหรับการแจกแจงแบบอื่น การแจกแจงแบบเบ้ปกติมีคุณสมบัติการแจกแจงที่ดีสำหรับรูปแบบสมการกำลังสองซึ่งคุณสมบัติการแจกแจงแบบปกติที่เราใช้นั้นมีประสิทธิภาพเป็นกรณีพิเศษของ (เนื่องจากปกติเป็นชนิดพิเศษแบบเบ้ปกติ) ดังนั้นบางทีมันอาจไม่ยากนัก ขยายวิธีการนี้ให้กับพวกเขา แต่สำหรับความแตกต่างอื่น ๆ มันจะปรากฏวิธีการที่แตกต่างกันโดยสิ้นเชิงเป็นสิ่งจำเป็น มีการแจกแจงอื่น ๆ ที่ทราบการประมาณเช่นนี้หรือไม่?

4
ค่าที่คาดหวังของค่ามัธยฐานตัวอย่างให้ค่าเฉลี่ยตัวอย่าง
Let YYYแสดงค่ามัธยฐานและให้ˉ XX¯\bar{X}หมายถึงค่าเฉลี่ยของตัวอย่างที่สุ่มจากขนาดn = 2 k + 1n=2k+1n=2k+1จากการจัดจำหน่ายที่เป็นN ( μ , σ 2N(μ,σ2)N(\mu,\sigma^2) ) ฉันจะคำนวณE ( Y | ˉ X = ˉ x ) ได้E(Y|X¯=x¯)E(Y|\bar{X}=\bar{x})อย่างไร สังหรณ์ใจเพราะสมมติฐานปกติก็จะทำให้ความรู้สึกที่จะอ้างว่าE ( Y | ˉ X = ˉ x ) = ˉ xE(Y|X¯=x¯)=x¯E(Y|\bar{X}=\bar{x})=\bar{x}และแน่นอนว่าเป็นคำตอบที่ถูกต้อง สามารถที่จะแสดงอย่างจริงจังว่า? ความคิดเริ่มต้นของฉันคือการเข้าถึงปัญหานี้โดยใช้การแจกแจงแบบปกติตามเงื่อนไขซึ่งโดยทั่วไปแล้วจะเป็นผลลัพธ์ที่ทราบ ปัญหาคือว่าเนื่องจากฉันไม่ทราบค่าที่คาดหวังและดังนั้นความแปรปรวนของค่ามัธยฐานฉันจะต้องคำนวณค่าเหล่านั้นโดยใช้สถิติลำดับk + 1 k+1k+1แต่นั่นซับซ้อนมากและฉันจะไม่ไปที่นั่นเว้นแต่ฉันจะต้องทำอย่างแน่นอน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.