คำถามติดแท็ก mathematical-statistics

ทฤษฎีทางคณิตศาสตร์ของสถิติที่เกี่ยวข้องกับคำจำกัดความที่เป็นทางการและผลลัพธ์ทั่วไป

5
เมื่อทฤษฎีบทขีด จำกัด กลางและกฎจำนวนมากไม่เห็นด้วย
นี่เป็นการจำลองแบบของคำถามที่ฉันพบที่ math.seซึ่งไม่ได้รับคำตอบที่ฉันหวังไว้ ปล่อยเป็นลำดับของตัวแปรสุ่มแบบกระจายที่เหมือนกันโดยมีและ . E [ X i ] = 1{Xi}i∈N{Xi}i∈N\{ X_i \}_{i \in \mathbb{N}}E[Xi]=1E[Xi]=1\mathbb{E}[X_i] = 1V[Xi]=1V[Xi]=1\mathbb{V}[X_i] = 1 พิจารณาการประเมินผลของ limn→∞P(1n−−√∑i=1nXi≤n−−√)limn→∞P(1n∑i=1nXi≤n) \lim_{n \to \infty} \mathbb{P}\left(\frac{1}{\sqrt{n}} \sum_{i=1}^n X_i \leq \sqrt{n}\right) การแสดงออกนี้จะต้องมีการจัดการตั้งแต่นั้นมาทั้งสองด้านของเหตุการณ์ความไม่เท่าเทียมมีแนวโน้มที่จะไม่มีที่สิ้นสุด A) การทดลองใช้งานระบบย่อย ก่อนพิจารณาคำสั่งที่ จำกัด ให้ลบn−−√n\sqrt{n}จากทั้งสองด้าน: limn→∞P(1n−−√∑i=1nXi−n−−√≤n−−√−n−−√)=limn→∞P(1n−−√∑i=1n(Xi−1)≤0)=Φ(0)=12limn→∞P(1n∑i=1nXi−n≤n−n)=limn→∞P(1n∑i=1n(Xi−1)≤0)=Φ(0)=12\lim_{n \to \infty} \mathbb{P}\left(\frac{1}{\sqrt{n}} \sum_{i=1}^n X_i -\sqrt{n} \leq \sqrt{n}-\sqrt{n} \right) = \lim_{n \to \infty} \mathbb{P}\left(\frac{1}{\sqrt{n}} …

4
อะไรกันแน่? พวกเขาได้รับมาอย่างไร
โดยทั่วไปเราได้รับการแนะนำให้รู้จักกับวิธีการประมาณช่วงเวลาโดย "การเทียบช่วงเวลาของประชากรกับตัวอย่างตัวอย่าง" จนกว่าเราจะประมาณพารามิเตอร์ทั้งหมดของประชากร ดังนั้นในกรณีที่มีการแจกแจงแบบปกติเราจะต้องใช้ช่วงเวลาที่หนึ่งและสองเพราะพวกเขาอธิบายการกระจายตัวนี้อย่างเต็มที่ E( X) = μ⟹Σni = 1Xผม/ n= X¯E(X)=μ⟹Σผม=1nXผม/n=X¯E(X) = \mu \implies \sum_{i=1}^n X_i/n = \bar{X} E( X2) = μ2+ σ2⟹Σni = 1X2ผม/ nE(X2)=μ2+σ2⟹Σผม=1nXผม2/nE(X^2) = \mu^2 + \sigma^2 \implies \sum_{i=1}^n X_i^2/n และเราสามารถคำนวณทางทฤษฎีได้มากถึงช่วงเวลาเพิ่มเติมตาม:nnn E(Xr)⟹∑ni=1Xri/nE(Xr)⟹∑i=1nXir/nE(X^r) \implies \sum_{i=1}^nX_i^r /n ฉันจะสร้างสัญชาตญาณได้อย่างไรว่าช่วงเวลาใดเป็นจริง ฉันรู้ว่าพวกเขามีอยู่เป็นแนวคิดในฟิสิกส์และคณิตศาสตร์ แต่ฉันคิดว่ามันไม่สามารถใช้ได้โดยตรงโดยเฉพาะอย่างยิ่งเพราะฉันไม่รู้วิธีที่จะทำให้นามธรรมจากแนวคิดมวลชนไปสู่จุดข้อมูล ดูเหมือนว่าจะใช้คำเฉพาะในทางสถิติซึ่งแตกต่างจากการใช้งานในสาขาอื่น อะไรลักษณะของข้อมูลของฉันกำหนดวิธีการที่หลายคน ( ) ในช่วงเวลาที่มีโดยรวม?rrr

2
การสร้าง rv แบบแยกซึ่งมีส่วนสนับสนุน rationals ทั้งหมดใน
นี่คือภาคต่อของคอนสตรัคติวิสต์ของคำถามนี้ หากเราไม่สามารถมีตัวแปรสุ่มแบบไม่ต่อเนื่องที่สนับสนุนการปันส่วนทั้งหมดในช่วงดังนั้นสิ่งที่ดีที่สุดถัดไปคือ: [0,1][0,1][0,1] สร้างตัวแปรสุ่มที่มีการสนับสนุนนี้และมันตามการแจกแจงบางอย่าง และช่างในตัวฉันต้องการให้ตัวแปรแบบสุ่มนี้สร้างขึ้นจากการแจกแจงที่มีอยู่แทนที่จะสร้างขึ้นโดยการกำหนดสิ่งที่เราต้องการได้อย่างเป็นนามธรรมQQQQ∈Q∩[0,1]Q∈Q∩[0,1]Q\in \mathbb{Q}\cap[0,1] ดังนั้นฉันจึงคิดสิ่งต่อไปนี้: ให้เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องหลังจากการกระจายทางเรขาคณิต - ตัวแปร II ที่มีพารามิเตอร์คือXXX0&lt;p&lt;10&lt;p&lt;10<p<1 X∈{0,1,2,...},P(X=k)=(1−p)kp,FX(X)=1−(1−p)k+1X∈{0,1,2,...},P(X=k)=(1−p)kp,FX(X)=1−(1−p)k+1 X \in \{0,1,2,...\},\;\;\;\; P(X=k) = (1-p)^kp,\;\;\; F_X(X) = 1-(1-p)^{k+1} ปล่อยให้เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องหลังจากการแจกแจงเชิงเรขาคณิต - ตัวแปร I ที่มีพารามิเตอร์เหมือนกันคือYYYppp Y∈{1,2,...},P(Y=k)=(1−p)k−1p,FY(Y)=1−(1−p)kY∈{1,2,...},P(Y=k)=(1−p)k−1p,FY(Y)=1−(1−p)k Y \in \{1,2,...\},\;\;\;\; P(Y=k) = (1-p)^{k-1}p,\;\;\; F_Y(Y) = 1-(1-p)^k XXXและเป็นอิสระ กำหนดตัวแปรสุ่มในขณะนี้YYY Q=XYQ=XYQ = \frac {X}{Y} และพิจารณาการแจกแจงแบบมีเงื่อนไข P(Q≤q∣{X≤Y})P(Q≤q∣{X≤Y})P(Q\leq q \mid \{X\leq Y\}) ในคำหลวม …

3
เรขาคณิตเชิงอนุพันธ์นั้นเกี่ยวข้องกับสถิติหรือไม่?
ฉันกำลังทำต้นแบบในสถิติและฉันแนะนำให้เรียนเรขาคณิตที่แตกต่างกัน ฉันยินดีที่จะได้ยินเกี่ยวกับการใช้งานทางสถิติสำหรับเรขาคณิตเชิงอนุพันธ์เนื่องจากสิ่งนี้จะทำให้ฉันมีแรงบันดาลใจ ไม่มีใครรู้ว่าแอปพลิเคชันสำหรับเรขาคณิตเชิงอนุพันธ์ในสถิติหรือไม่

4
ปัญหาเกี่ยวกับการพิสูจน์ความคาดหวังตามเงื่อนไขว่าเป็นตัวพยากรณ์ที่ดีที่สุด
ฉันมีปัญหากับการพิสูจน์ E(Y|X)∈argming(X)E[(Y−g(X))2]E(Y|X)∈arg⁡ming(X)E[(Y−g(X))2]E(Y|X) \in \arg \min_{g(X)} E\Big[\big(Y - g(X)\big)^2\Big] ซึ่งน่าจะเปิดเผยความเข้าใจผิดที่คาดการณ์ไว้อย่างลึกซึ้งและความคาดหวังตามเงื่อนไข หลักฐานที่ฉันรู้จะเป็นดังนี้ (สามารถพบหลักฐานอีกรุ่นหนึ่งได้ที่นี่ ) ===หาเรื่องนาทีก.( X)E[ ( Y)- กรัม( x ) )2]หาเรื่องนาทีก.( X)E[ ( Y)- E( Y| X) + E( Y| X) - g( X) )2]หาเรื่องนาทีก.( x )E[ ( Y)- E( Y| X) )2+ 2 ( Y)- E( Y| X) ) ( …

3
พิสูจน์ว่าขณะสร้างฟังก์ชันทำหน้าที่พิจารณาการแจกแจงความน่าจะเป็นแบบไม่ซ้ำกัน
ข้อความของ Wackerly et al ได้กล่าวถึงทฤษฎีบทนี้ว่า "ให้และแสดงถึงช่วงเวลาที่สร้างฟังก์ชันของตัวแปรสุ่ม X และ Y ตามลำดับหากมีทั้งฟังก์ชันสร้างและสำหรับค่าทั้งหมดของ t ดังนั้น X และ Y จะมีการแจกแจงความน่าจะเป็นแบบเดียวกัน " โดยไม่มีการพิสูจน์ว่าเกินขอบเขตของข้อความ Scheaffer Young ยังมีทฤษฎีบทเดียวกันโดยไม่มีข้อพิสูจน์ ฉันไม่มีสำเนาของ Casella แต่การค้นหาหนังสือของ Google ดูเหมือนจะไม่พบทฤษฎีบทอยู่m y ( t ) m x ( t ) = m y ( t )ม.x( t )mx(t)m_x(t)ม.Y( t )my(t)m_y(t)ม.x( t ) = mY( t …

4
ปัญหาต้นไม้เงินวิเศษ
ฉันคิดว่าปัญหานี้ในห้องอาบน้ำมันเป็นแรงบันดาลใจจากกลยุทธ์การลงทุน สมมติว่ามีต้นไม้เงินวิเศษ ทุกวันคุณสามารถเสนอเงินจำนวนหนึ่งให้กับต้นไม้เงินและมันจะเพิ่มขึ้นเป็นสามเท่าหรือทำลายมันด้วยความน่าจะเป็น 50/50 คุณสังเกตเห็นทันทีว่าโดยเฉลี่ยคุณจะได้รับเงินจากการทำเช่นนี้และกระตือรือร้นที่จะใช้ประโยชน์จากต้นไม้เงิน อย่างไรก็ตามหากคุณเสนอเงินทั้งหมดในครั้งเดียวคุณจะได้ 50% ของการสูญเสียเงินทั้งหมด ยอมรับไม่ได้! คุณเป็นคนที่ไม่ชอบความเสี่ยงดังนั้นคุณตัดสินใจที่จะคิดกลยุทธ์ คุณต้องการลดอัตราต่อรองของการสูญเสียทุกสิ่งทุกอย่าง แต่คุณต้องการทำเงินให้ได้มากที่สุด! คุณคิดสิ่งต่อไปนี้ทุกวันคุณเสนอ 20% ของเงินทุนปัจจุบันให้กับต้นไม้เงิน สมมติว่าราคาต่ำสุดที่คุณสามารถเสนอได้คือ 1 เซ็นต์, มันจะใช้เวลาขาดทุน 31 ครั้งในการสูญเสียเงินทั้งหมดของคุณถ้าคุณเริ่มต้นด้วย 10 ดอลลาร์ มีอะไรอีก, ยิ่งคุณมีรายได้มากเท่าไหร่การสูญเสียทุกอย่างก็จะยิ่งมากขึ้นเท่านั้น คุณเริ่มต้นรับเงินสดจำนวนมากอย่างรวดเร็ว แต่ความคิดปรากฏขึ้นในหัวของคุณ: คุณสามารถเสนอ 30% ในแต่ละวันและหารายได้เพิ่ม! แต่เดี๋ยวก่อนทำไมไม่เสนอ 35% 50%? อยู่มาวันหนึ่งด้วยสัญลักษณ์ดอลลาร์ขนาดใหญ่ในดวงตาของคุณคุณวิ่งไปที่ต้นไม้เงินกับเงินล้านของคุณและเสนอเงินสด 100% ซึ่งต้นไม้เงินจะเผาไหม้ทันที วันรุ่งขึ้นคุณจะได้งานที่ McDonalds ซึ่งต้นไม้เงินเผาไหม้ทันที วันรุ่งขึ้นคุณจะได้งานที่ McDonalds ซึ่งต้นไม้เงินเผาไหม้ทันที วันรุ่งขึ้นคุณจะได้งานที่ McDonalds มีเปอร์เซ็นต์ที่เหมาะสมของเงินสดที่คุณสามารถเสนอได้โดยไม่สูญเสียทั้งหมดหรือไม่? (ย่อย) คำถาม: หากมีอัตราร้อยละที่เหมาะสมที่คุณควรเสนอให้คงที่นี้ (เช่น 20% …

3
การกระจายแบบไม่ระบุตัวอย่างความแปรปรวนของตัวอย่างที่ไม่ปกติ
นี่เป็นการแก้ไขปัญหาทั่วไปที่เกิดจาก คำถามนี้ หลังจากได้รับการแจกแจงเชิงซีมโทติคของความแปรปรวนตัวอย่างเราสามารถใช้วิธีเดลต้าเพื่อให้ได้การแจกแจงที่สอดคล้องกันสำหรับค่าเบี่ยงเบนมาตรฐาน ขอตัวอย่างขนาดของตัวแปรสุ่มแบบไม่ปกติของ iid , มีค่าเฉลี่ยและความแปรปรวน 2 ตั้งค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างเป็น nnn{Xi},i=1,...,n{Xi},i=1,...,n\{X_i\},\;\; i=1,...,nμμ\muσ2σ2\sigma^2x¯=1n∑i=1nXi,s2=1n−1∑i=1n(Xi−x¯)2x¯=1n∑i=1nXi,s2=1n−1∑i=1n(Xi−x¯)2\bar x = \frac 1n \sum_{i=1}^nX_i,\;\;\; s^2 = \frac 1{n-1} \sum_{i=1}^n(X_i-\bar x)^2 เรารู้ว่า E(s2)=σ2,Var(s2)=1n(μ4−n−3n−1σ4)E(s2)=σ2,Var⁡(s2)=1n(μ4−n−3n−1σ4)E(s^2) = \sigma^2, \;\;\; \operatorname {Var}(s^2) = \frac{1}{n} \left(\mu_4 - \frac{n-3}{n-1}\sigma^4\right) โดยที่และเรา จำกัด ความสนใจของเราในการแจกแจงว่าช่วงเวลาใดที่จำเป็นต้องมีอยู่และมีขอบเขต จำกัด มีอยู่จริงและมีขอบเขต จำกัดμ4=E(Xi−μ)4μ4=E(Xi−μ)4\mu_4 = E(X_i -\mu)^4 มันถืออย่างนั้นหรือเปล่า n−−√(s2−σ2)→dN(0,μ4−σ4)?n(s2−σ2)→dN(0,μ4−σ4)?\sqrt n(s^2 - \sigma^2) \rightarrow_d N\left(0,\mu_4 …

1
คำจำกัดความทางคณิตศาสตร์ / อัลกอริทึมสำหรับ overfitting
มีคำจำกัดความทางคณิตศาสตร์หรืออัลกอริธึมเกี่ยวกับการบรรจุมากเกินไปหรือไม่? คำจำกัดความที่มีให้บ่อยครั้งคือพล็อต 2-D แบบคลาสสิกของจุดที่มีเส้นที่ผ่านทุกจุดและเส้นโค้งการสูญเสียการตรวจสอบจะขึ้นไป แต่มีนิยามที่เข้มงวดทางคณิตศาสตร์หรือไม่?


5
ทำไมนักสถิติจึงกำหนดเมทริกซ์แบบสุ่ม?
ฉันเรียนคณิตศาสตร์เมื่อสิบปีที่แล้วดังนั้นฉันจึงมีภูมิหลังทางคณิตศาสตร์และสถิติ แต่คำถามนี้คือฆ่าฉัน คำถามนี้ยังคงเป็นปรัชญาเล็กน้อยสำหรับฉัน ทำไมนักสถิติจึงพัฒนาเทคนิคทุกประเภทเพื่อทำงานกับเมทริกซ์แบบสุ่ม? ฉันหมายถึงเวกเตอร์สุ่มไม่แก้ปัญหาเหรอ? ถ้าไม่ใช่คอลัมน์เฉลี่ยที่แตกต่างกันของเมทริกซ์แบบสุ่มคืออะไร Anderson (2003, Wiley) พิจารณาเวกเตอร์สุ่มเป็นกรณีพิเศษของเมทริกซ์แบบสุ่มที่มีเพียงคอลัมน์เดียว ฉันไม่เห็นจุดที่มีเมทริกซ์แบบสุ่ม (และฉันแน่ใจว่าเป็นเพราะฉันไม่รู้) แต่ทนกับฉัน ลองนึกภาพฉันมีโมเดลที่มีตัวแปรสุ่ม 20 ตัว ถ้าฉันต้องการคำนวณฟังก์ชั่นความน่าจะเป็นร่วมทำไมฉันถึงนึกภาพมันเป็นเมทริกซ์แทนที่จะเป็นเวกเตอร์ ฉันพลาดอะไรไป PS: ฉันขอโทษสำหรับคำถามที่ติดแท็กไม่ดี แต่ยังไม่มีแท็กสำหรับการสุ่มเมทริกซ์และฉันยังไม่สามารถสร้างได้! แก้ไข: เปลี่ยนเมทริกซ์เป็นเมทริกซ์ในชื่อเรื่อง

4
ในสถิติฉันควรถือว่าการ
ฉันกำลังศึกษาสถิติและมักพบสูตรที่มีlogและฉันมักสับสนถ้าฉันควรตีความว่าเป็นความหมายมาตรฐานของlogเช่นฐาน 10 หรือในสถิติสัญลักษณ์log มักจะถือว่าเป็นบันทึกธรรมชาติlnสันนิษฐานโดยทั่วไปจะบันทึกของธรรมชาติ โดยเฉพาะอย่างยิ่งฉันกำลังศึกษาการประมาณค่าความถี่ที่ดีของทัวริงเป็นตัวอย่าง แต่คำถามของฉันเป็นคำถามทั่วไปมากกว่า

4
ความคาดหวังของผลิตภัณฑ์ของตัวแปรสุ่มขึ้นอยู่กับเมื่อ
ให้และ ,... ความคาดหวังของเป็นn \ rightarrow \ inftyคืออะไร?X1∼U[0,1]X1∼U[0,1]X_1 \sim U[0,1]Xi∼U[Xi−1,1]Xi∼U[Xi−1,1]X_i \sim U[X_{i - 1}, 1]i=2,3,...i=2,3,...i = 2, 3,...X1X2⋯XnX1X2⋯XnX_1 X_2 \cdots X_nn→∞n→∞n \rightarrow \infty

3
ความสอดคล้องเชิงเส้นกำกับที่มีความแปรปรวนเชิงเส้นกำกับที่ไม่ใช่ศูนย์ - มันแสดงถึงอะไร?
ปัญหาเกิดขึ้นก่อนหน้านี้ แต่ฉันต้องการถามคำถามเฉพาะที่จะพยายามล้วงเอาคำตอบที่จะทำให้ชัดเจน (และจำแนก): ใน "Asymptotics ของคนจน" คนหนึ่งรักษาความแตกต่างที่ชัดเจนระหว่าง (a)ลำดับของตัวแปรสุ่มที่รวมความน่าจะเป็นเป็นค่าคงที่ ตรงกันข้ามกับ (b)ลำดับของตัวแปรสุ่มที่รวมความน่าจะเป็นเข้ากับตัวแปรสุ่ม แต่ใน "Asymptotics ของ Wise Man" เราสามารถมีกรณีของ (c)ลำดับของตัวแปรสุ่มที่รวมความน่าจะเป็นเป็นค่าคงที่ในขณะที่รักษาความแปรปรวนที่ไม่ใช่ศูนย์ที่ขีด จำกัด คำถามของฉันคือ (ขโมยจากคำตอบเชิงสำรวจของฉันเองด้านล่าง): เราจะเข้าใจตัวประมาณที่สอดคล้องกันเชิงเส้นกำกับ แต่ก็มีความแปรปรวนที่ไม่ใช่ศูนย์และ จำกัด ได้อย่างไร ความแปรปรวนนี้สะท้อนถึงอะไร? พฤติกรรมของมันแตกต่างจากตัวประมาณ "ปกติ" ที่สอดคล้องกันอย่างไร หัวข้อที่เกี่ยวข้องกับปรากฏการณ์ที่อธิบายไว้ใน (c) (ดูในความคิดเห็นด้วย): ความแตกต่างระหว่างตัวประมาณที่สอดคล้องกันและตัวประมาณที่ไม่เอนเอียงคืออะไร? /stats/120553/convergence-of-an-estimator-with-infinite-variance ทำไมตัวประมาณที่ไม่สอดคล้องกันแบบเชิงเส้นกำกับจึงไม่มีความแปรปรวนที่ไม่มีที่สิ้นสุด เกือบแน่ใจว่าการลู่เข้าและการแปรปรวนที่ จำกัด ไปที่ศูนย์

4
สัญชาตญาณที่อยู่เบื้องหลังความเป็นอิสระของ
ฉันหวังว่าจะมีคนเสนอข้อโต้แย้งว่าทำไมตัวแปรสุ่ม และ , มีการแจกแจงแบบปกติมาตรฐานมีความเป็นอิสระทางสถิติ การพิสูจน์ความจริงนั้นเกิดขึ้นได้อย่างง่ายดายจากเทคนิค MGF แต่ฉันพบว่ามันตอบโต้ได้ง่ายมากY1=X2−X1Y1=X2−X1Y_1=X_2-X_1Y2=X1+X2Y2=X1+X2Y_2=X_1+X_2XiXiX_i ฉันจะขอบคุณสัญชาตญาณที่นี่ถ้ามี ขอบคุณล่วงหน้า. แก้ไข : ห้อยไม่ได้ระบุสถิติการสั่งซื้อ แต่การสังเกต IID จากการกระจายปกติมาตรฐาน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.