คำถามติดแท็ก mathematical-statistics

ทฤษฎีทางคณิตศาสตร์ของสถิติที่เกี่ยวข้องกับคำจำกัดความที่เป็นทางการและผลลัพธ์ทั่วไป

2
ทำไมสถิติแบบ T ต้องการข้อมูลเพื่อติดตามการแจกแจงแบบปกติ
ฉันกำลังดูสมุดบันทึกนี้และฉันรู้สึกสับสนกับคำสั่งนี้: เมื่อเราพูดถึงเรื่องปกติวิสัยสิ่งที่เราหมายถึงคือข้อมูลควรดูเหมือนการแจกแจงแบบปกติ สิ่งนี้มีความสำคัญเนื่องจากการทดสอบสถิติหลายอย่างขึ้นอยู่กับเรื่องนี้ (เช่นสถิติ t) ฉันไม่เข้าใจว่าทำไมสถิติแบบ T ต้องการข้อมูลเพื่อติดตามการแจกแจงแบบปกติ แท้จริงแล้ว Wikipedia พูดในสิ่งเดียวกัน: การแจกแจงแบบ t (หรือการแจกแจงแบบที) เป็นสมาชิกของตระกูลการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่เกิดขึ้นเมื่อประมาณค่าเฉลี่ยของประชากรที่กระจายตัวแบบปกติ อย่างไรก็ตามฉันไม่เข้าใจว่าทำไมจึงจำเป็นต้องใช้สมมติฐานนี้ ไม่มีสิ่งใดในสูตรที่บ่งบอกว่าข้อมูลต้องเป็นไปตามการแจกแจงแบบปกติ: ฉันดูคำจำกัดความของมันเล็กน้อยแต่ฉันไม่เข้าใจว่าทำไมถึงมีความจำเป็น

1
การอนุมานแบบแปรผันเป็นภาษาอังกฤษธรรมดา
หลังจากดูวิดีโอบน youtube แล้วฉันรู้สึกว่าฉันไม่สามารถกำหนดความแตกต่างของการอนุมานได้ ฉันสามารถทำตามขั้นตอนในขณะที่ฉันกำลังดูวิดีโอบรรยายเกี่ยวกับเรื่องนี้ แต่ยากที่จะกำหนดว่าจริงๆแล้วคืออะไร หวังว่าจะได้ยินเกี่ยวกับมัน

2
การพิสูจน์ทฤษฎีบทขีด จำกัด กลางไม่ได้ใช้ฟังก์ชันลักษณะพิเศษ
มีข้อพิสูจน์ใด ๆ เกี่ยวกับ CLT ที่ไม่ได้ใช้ฟังก์ชั่นคุณสมบัติเป็นวิธีที่ง่ายกว่าหรือไม่ อาจจะเป็นวิธี Tikhomirov หรือสไตน์? มีบางอย่างในตัวที่คุณสามารถอธิบายให้นักศึกษามหาวิทยาลัย (ปีแรกของคณิตศาสตร์หรือฟิสิกส์) และใช้เวลาน้อยกว่าหนึ่งหน้า

2
นิยาม p-value สองวิธีทำอย่างไรจึงจะพิสูจน์ความเท่าเทียมกันได้
ฉันอ่านหนังสือของ Larry Wasserman สถิติทั้งหมดและในปัจจุบันเกี่ยวกับค่า p (หน้า 187) ให้ฉันแนะนำคำจำกัดความก่อน (ฉันพูด) คำจำกัดความ 1ฟังก์ชั่นพลังงานของการทดสอบที่มีพื้นที่การปฏิเสธถูกกำหนดโดย ขนาดของการทดสอบถูกกำหนดให้เป็น การทดสอบจะกล่าวว่ามีระดับ\ alphaถ้าขนาดของมันคือน้อยกว่าหรือเท่ากับ\ alphaRRRβ(θ)=Pθ(X∈R)β(θ)=Pθ(X∈R)\beta(\theta)=P_{\theta}(X\in R)α=supθ∈Θ0β(θ)α=supθ∈Θ0β(θ)\alpha = \sup_{\theta\in\Theta_0}\beta(\theta)αα\alphaαα\alpha โดยพื้นฐานแล้วบอกว่าαα\alphaขนาดคือความน่าจะเป็น "ใหญ่ที่สุด" ของข้อผิดพลาดประเภท I ค่าpppจะถูกกำหนดผ่านทาง (I quote) ความหมายที่ 2สมมติว่าทุกα∈(0,1)α∈(0,1)\alpha\in(0,1)เรามีขนาดαα\alphaทดสอบกับภูมิภาคปฏิเสธR_RαRαR_\alphaจากนั้น p-value=inf{α:T(Xn)∈Rα}p-value=inf{α:T(Xn)∈Rα}p\text{-value}=\inf\{\alpha:T(X^n)\in R_\alpha\} ที่Xn=(X1,…,Xn)Xn=(X1,…,Xn)X^n=(X_1,\dots,X_n)X_n) สำหรับฉันนี่หมายถึง: รับเฉพาะαα\alphaมีพื้นที่ทดสอบและปฏิเสธRαRαR_\alphaดังนั้นα=supθ∈Θ0(α)Pθ(T(Xn)∈Rα)α=supθ∈Θ0(α)Pθ(T(Xn)∈Rα)\alpha=\sup_{\theta\in\Theta_{0}(\alpha)}P_\theta(T(X^n)\in R_\alpha)alpha) สำหรับppp -value ผมก็ใช้เวลาแล้วที่เล็กที่สุดของทั้งหมดเหล่านี้\αα\alpha คำถามที่ 1ในกรณีนี้จะเป็นกรณีที่แล้วผมได้อย่างชัดเจนสามารถเลือกα=ϵα=ϵ\alpha = \epsilonสำหรับธุรกิจขนาดเล็กโดยพล\ϵϵ\epsilonการตีความคำจำกัดความที่ 2 ของฉันคืออะไรหมายถึงอะไร ตอนนี้ Wasserman ต่อเนื่องและแจ้งให้ทฤษฎีบทมีคำนิยาม "เทียบเท่า" ของpppซึ่งฉันคุ้นเคย (ฉันพูด): ทฤษฎีบทสมมติว่าการทดสอบขนาดเป็นรูปแบบ จากนั้น …

2
พล็อต QQ ใน Python
ฉันสร้างพล็อต qq โดยใช้รหัสต่อไปนี้ ฉันรู้ว่าพล็อต qq ใช้เพื่อตรวจสอบว่ามีการเผยแพร่ข้อมูลตามปกติหรือไม่ คำถามของฉันคือสิ่งที่ป้ายแกน x และ y ระบุในพล็อต qq และค่า r กำลังสองที่ระบุคืออะไร? N = 1200 p = 0.53 q = 1000 obs = np.random.binomial(N, p, size = q)/N import scipy.stats as stats z = (obs-np.mean(obs))/np.std(obs) stats.probplot(z, dist="norm", plot=plt) plt.title("Normal Q-Q plot") plt.show() ฉันรู้แล้วว่ามีการอภิปรายเกี่ยวกับเรื่องqqแต่ฉันไม่เข้าใจแนวคิดของการสนทนา

1
การตีความทางเรขาคณิตของการประมาณความน่าจะเป็นสูงสุด
ฉันกำลังอ่านหนังสือปัญหาการระบุตัวตนในเศรษฐมิติโดยแฟรงคลินเอ็มฟิชเชอร์และสับสนโดยส่วนที่เขาแสดงให้เห็นถึงตัวตนโดยแสดงให้เห็นถึงฟังก์ชั่นความน่าจะเป็น ปัญหาสามารถทำให้ง่ายขึ้นเป็น: สำหรับการถดถอยที่U ~ ฉัน ผม d N ( 0 , σ 2 I ) , aและbเป็นพารามิเตอร์ สมมติว่าYมีสัมประสิทธิ์คซึ่งเท่ากับเอกภาพ จากนั้นฟังก์ชันความน่าจะเป็นในพื้นที่ของc , a , b จะมีสันตามแนวรังสีที่สอดคล้องกับเวกเตอร์ของพารามิเตอร์ที่แท้จริงและสเกลาร์คูณของมันY= a + Xb + uY=a+Xข+ยูY=a+Xb+uU ~ ฉัน ผม d. ยังไม่มีข้อความ( 0 , σ2ผม)ยู~ผม.ผม.d.ยังไม่มีข้อความ(0,σ2ผม)u \sim i.i.d. N(0,\sigma^2I)aaaขขbYYYคคcc , a , bค,a,ขc, a,b. เมื่อพิจารณาเฉพาะสถานที่ที่กำหนดโดยฟังก์ชันความน่าจะเป็นจะมีค่าสูงสุดเฉพาะ ณ จุดที่รังสีตัดผ่านระนาบนั้นc = 1ค=1c=1 …

1
เนื่องจากการแจกแจงเบต้ามีความคล้ายคลึงกันในรูปแบบทวินามทำไมเราจึงต้องการการกระจายเบต้า
ปรากฏว่าการแจกแจงทวินามนั้นคล้ายคลึงกันมากในรูปแบบของการแจกแจงแบบเบต้าและฉันสามารถกำหนดค่าคงที่อีกครั้งใน pdf ทั้งสองเพื่อให้พวกเขามีลักษณะเดียวกัน แล้วทำไมเราถึงต้องมีการแจกแจงเบต้า มันมีวัตถุประสงค์เฉพาะหรือไม่? ขอบคุณ!

1
จำนวนครั้งที่คาดว่าค่าเฉลี่ยเชิงประจักษ์จะเกินค่า
เมื่อพิจารณาลำดับของตัวแปรสุ่มของ iid ให้พูดว่าสำหรับฉันกำลังพยายามที่จะคาดเดาจำนวนครั้งที่ค่าเฉลี่ยเชิงประจักษ์จะเกินค่า, , ในขณะที่เรายังคงดึงตัวอย่างนั่นคือ: ฉัน= 1 , 2 , . . , n 1Xผม∈ [ 0 , 1 ]Xi∈[0,1]X_i \in [0,1]ฉัน= 1 , 2 , . . , ni=1,2,...,ni = 1,2,...,nc≥0T d e f = n ∑ j=1P({ 11nΣni = 1Xผม1n∑i=1nXi\frac{1}{n}\sum_{i=1}^n X_ic ≥ 0c≥0c \geq 0T=def∑j=1nP({1j∑i=1jXi≥c})T=def∑j=1nP({1j∑i=1jXi≥c}) \mathcal{T} \overset{def}{=} \sum_{j=1}^n …

5
พื้นหลังทางคณิตศาสตร์สำหรับเครือข่ายประสาท
ไม่แน่ใจว่าสิ่งนี้เหมาะสมสำหรับไซต์นี้หรือไม่ แต่ฉันเริ่มต้น MSE ของฉันในสาขาวิทยาศาสตร์คอมพิวเตอร์ (BS ในคณิตศาสตร์ประยุกต์) และต้องการที่จะมีพื้นฐานที่แข็งแกร่งในการเรียนรู้ของเครื่อง หนึ่งในความสนใจย่อยของฉันคือเครือข่ายประสาท พื้นหลังทางคณิตศาสตร์ที่ดีสำหรับ ANNs คืออะไร เช่นเดียวกับในด้านอื่น ๆ ของการเรียนรู้ของเครื่องฉันคิดว่าพีชคณิตเชิงเส้นมีความสำคัญ แต่ส่วนอื่น ๆ ของคณิตศาสตร์มีความสำคัญอย่างไร ผมวางแผนที่จะอ่านโครงข่ายประสาท: บทนำอย่างเป็นระบบหรือโครงข่ายประสาทเทียมสำหรับการจดจำรูปแบบ ใครบ้างมีคำแนะนำการป้อนข้อมูลหรือคำแนะนำอื่น ๆ

1
การกระจายตัวตัวอย่างของสัมประสิทธิ์การถดถอย
ก่อนหน้านี้ฉันได้เรียนรู้เกี่ยวกับการสุ่มตัวอย่างการแจกแจงที่ให้ผลลัพธ์ซึ่งมีไว้สำหรับตัวประมาณในแง่ของพารามิเตอร์ที่ไม่รู้จัก ตัวอย่างเช่นสำหรับการแจกแจงตัวอย่างของและในโมเดลการถดถอยเชิงเส้น β 1Yฉัน=βo+β1Xฉัน+εฉันβ^0β^0\hat\beta_0β^1β^1\hat\beta_1Yผม= βโอ+ β1Xผม+ εผมYผม=βโอ+β1Xผม+εผมY_i = \beta_o + \beta_1 X_i + \varepsilon_i β^0∼ N( β0, σ 2( 1)n+ x¯2Sx x) )β^0~ยังไม่มีข้อความ(β0, σ2(1n+x¯2Sxx)) \hat{\beta}_0 \sim \mathcal N \left(\beta_0,~\sigma^2\left(\frac{1}{n}+\frac{\bar{x}^2}{S_{xx}}\right)\right) และ β^1∼ N( β1, σ 2Sx x)β^1~ยังไม่มีข้อความ(β1, σ2Sxx) \hat{\beta}_1 \sim \mathcal N \left(\beta_1,~\frac{\sigma^2}{S_{xx}}\right) โดยที่Sx x= ∑ni = 1( x2ผม)−nx¯2Sxx=∑i=1n(xi2)-nx¯2S_{xx} = \sum_{i=1}^n …

1
เข้าใจความแปรปรวนร่วมที่ใช้งานง่าย, ความแปรปรวนร่วมแบบข้าม, ความสัมพันธ์แบบอัตโนมัติ / ข้ามสหสัมพันธ์และความหนาแน่นสเปกตรัมพลังงาน
ขณะนี้ฉันกำลังเรียนเพื่อรอบชิงชนะเลิศของฉันในสถิติพื้นฐานสำหรับปริญญาตรี ECE ของฉัน ในขณะที่ฉันคิดว่าฉันมีคณิตศาสตร์เป็นส่วนใหญ่ฉันไม่เข้าใจที่เข้าใจง่ายว่าตัวเลขจริงหมายถึงอะไร (บทนำ: ฉันใช้ภาษาที่ค่อนข้างเลอะเทอะ ฉันรู้ว่า E [X] คือ "ค่าเฉลี่ยถ่วงน้ำหนัก" ของผลลัพธ์ทั้งหมดของ X ที่ถ่วงน้ำหนักโดยความน่าจะเป็น Var [X] ให้ค่าความแปรปรวนที่คาดหวังจาก E [X] กำลังสองแล้วบอกเราบางอย่างเกี่ยวกับ "ความเบลอ" ของการแจกแจง คุณสมบัติอื่น ๆ ที่ฉันรู้สูตร แต่ไม่มีสัญชาติญาณใด ๆ ใครมีคำอธิบาย / แหล่งข้อมูลที่ดีเพื่อช่วยในเรื่องนั้น?

2
ระยะ Mahalanobis คืออะไรและใช้ในการจดจำรูปแบบอย่างไร
บางคนสามารถอธิบายแนวคิดเรื่องระยะทางของมาฮาลาโนบิสได้หรือไม่? ตัวอย่างเช่นอะไรคือระยะทาง Mahalanobis ระหว่างสองจุด x และ y และโดยเฉพาะอย่างยิ่งมันตีความอย่างไรสำหรับการจดจำรูปแบบ?

7
หากความสัมพันธ์ไม่ได้หมายความถึงความเป็นเหตุเป็นผลค่าของการทราบความสัมพันธ์ระหว่างตัวแปรสองตัวคืออะไร
สมมติว่าในฐานะเจ้าของธุรกิจ (หรือการตลาดหรือใครก็ตามที่เข้าใจพล็อตการกระจาย) จะแสดงพล็อตการกระจายของสองตัวแปร: จำนวนโฆษณาเทียบกับจำนวนการขายผลิตภัณฑ์ต่อเดือนในช่วง 5 ปีที่ผ่านมา (หรืออื่น ๆ มีตัวอย่างมากขึ้นฉันเพิ่งทำสิ่งนี้ขึ้นมา) ตอนนี้เขา / เธอเห็นพล็อตการกระจายและได้รับการบอกว่าสัมประสิทธิ์สหสัมพันธ์ (corr) คือ: 1 หรือ 0.5 หรือ 0.11 หรือ 0 หรือ -0.75 หรือ -1 โดยทั่วไปค่าที่ถูกต้องสำหรับ corr คำถาม: สิ่งนี้มีความหมายอย่างไรต่อผู้มีอำนาจตัดสินใจหรือผู้บริโภคในแผนการกระจาย การตัดสินใจแบบใดที่เราสามารถทำได้โดยอาศัยสิ่งนี้ Ie: การเห็นความสัมพันธ์ระหว่างตัวแปรสองตัวกับอะไรคือสิ่งที่เราสามารถทำอะไรกับข้อมูลนั้นได้อย่างโดดเดี่ยว? เป็นเพียงการดูว่าควรพิจารณาสิ่งใดและไม่ควรรวมอยู่ในการวิเคราะห์การถดถอยหรือมีการใช้งานจริงมากขึ้นหรือไม่? แค่อยากรู้อยากเห็นฉันได้ทำงานกับเทคนิคนี้เสมอ แต่ฉันได้รับการบอกว่าความสัมพันธ์ด้วยตัวมันเองนั้นไม่ได้ใช้ประโยชน์อะไรมาก - ดังนั้นการใช้ "IS" คืออะไร?


1
ฉันสามารถคำนวณ
เราจะประเมินความคาดหวังของ CDF ปกติที่ยกกำลังสองในรูปแบบปิดได้อย่างไร? E [ Φ ( a Z)+ b )2] = ∫∞- ∞Φ ( a z+ b )2ϕ ( z)dZE[Φ(aZ+b)2]=∫−∞∞Φ(az+b)2ϕ(z)dz\mathbb{E}\left[\Phi\left(aZ+b\right)^{2}\right] = \int_{-\infty}^{\infty}\Phi\left(az+b\right)^{2}\phi(z)\,dz ที่นี่ ,คือจำนวนจริงและและเป็นฟังก์ชันความหนาแน่นและการกระจายของตัวแปรสุ่มมาตรฐานแบบปกติ ตามลำดับb Z ∼ N ( 0 , 1 ) ϕ ( ⋅ ) Φ ( ⋅ )aaaขbbZ∼ N( 0 , 1 )Z∼N(0,1)Z\sim\mathcal{N}(0,1)ϕ ( ⋅ )ϕ(⋅)\phi(\cdot)Φ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.