คำถามติดแท็ก mathematical-statistics

ทฤษฎีทางคณิตศาสตร์ของสถิติที่เกี่ยวข้องกับคำจำกัดความที่เป็นทางการและผลลัพธ์ทั่วไป

5
ทำไมความแปรปรวนของการเดินสุ่มเพิ่มขึ้น?
การเดินแบบสุ่มที่กำหนดเป็นโดยที่เป็นเสียงสีขาว แสดงว่าตำแหน่งปัจจุบันคือผลรวมของตำแหน่งก่อนหน้า + คำที่ไม่ถูกคาดการณ์Yเสื้อ= Yt - 1+ eเสื้อYเสื้อ=Yเสื้อ-1+อีเสื้อY_{t} = Y_{t-1} + e_tอีเสื้ออีเสื้อe_t คุณสามารถพิสูจน์ได้ว่าฟังก์ชันค่าเฉลี่ยเนื่องจากμเสื้อ= 0μเสื้อ=0\mu_t = 0 E( Yเสื้อ) = E( e1+ e2+...+et)=E(e1)+E(e2)+...+E(et)=0+0+...+0E(Yเสื้อ)=E(อี1+อี2+...+อีเสื้อ)=E(อี1)+E(อี2)+...+E(อีเสื้อ)=0+0+...+0E(Y_{t}) = E(e_1+ e_2+ ... +e_t) = E(e_1) + E(e_2) +... +E(e_t) = 0 + 0 + ... + 0 แต่ทำไมความแปรปรวนเพิ่มขึ้นเป็นเส้นตรงตามเวลา? สิ่งนี้มีบางอย่างที่เกี่ยวกับการไม่สุ่ม "บริสุทธิ์" เนื่องจากตำแหน่งใหม่มีความสัมพันธ์กับตำแหน่งก่อนหน้าหรือไม่ แก้ไข: ตอนนี้ฉันมีความเข้าใจที่ดีขึ้นมากโดยการเห็นภาพตัวอย่างของการเดินสุ่มขนาดใหญ่และที่นี่เราสามารถสังเกตได้อย่างง่ายดายว่าความแปรปรวนโดยรวมเพิ่มขึ้นเมื่อเวลาผ่านไป และค่าเฉลี่ยก็ประมาณตามคาด บางทีนี่อาจเป็นเรื่องเล็กน้อยเนื่องจากในช่วงแรก ๆ …

8
กำลังมองหาหนังสือสถิติและความน่าจะเป็นที่ดีและสมบูรณ์
ฉันไม่เคยมีโอกาสไปเยี่ยมชมหลักสูตรสถิติจากคณะคณิตศาสตร์ ฉันกำลังมองหาทฤษฎีความน่าจะเป็นและหนังสือสถิติที่สมบูรณ์และพึ่งพาตนเองได้ โดยสมบูรณ์ฉันหมายความว่ามันมีการพิสูจน์ทั้งหมดและไม่เพียง แต่ระบุผลลัพธ์ พอเพียงฉันหมายความว่าฉันไม่จำเป็นต้องอ่านหนังสือเล่มอื่นเพื่อให้สามารถเข้าใจหนังสือเล่มนี้ได้ แน่นอนว่ามันต้องมีระดับวิทยาลัย (นักเรียนคณิตศาสตร์) แคลคูลัสและพีชคณิตเชิงเส้น ฉันดูหนังสือหลายเล่มและฉันไม่ชอบเลย DeGroot & Schervish (2011) ความน่าจะเป็นและสถิติ (รุ่นที่ 4) Pearson สิ่งนี้ยังไม่สมบูรณ์เพียงพอ มันระบุสิ่งต่าง ๆ มากมายโดยไม่ได้รับมา นอกจากนั้นฉันชอบมัน Wasserman (2004) สถิติทั้งหมด: หลักสูตรรัดกุมในการอนุมานทางสถิติสปริงเกอร์ ไม่ชอบเลย เกือบจะไม่มีคำอธิบาย "การชั่งน้ำหนักราคาต่อรอง" จาก David Williams เป็นทางการมากกว่า DeGroot และดูเหมือนว่าจะสมบูรณ์และพึ่งพาตนเองได้ อย่างไรก็ตามฉันพบว่าสไตล์แปลก ๆ เขายังประดิษฐ์คำศัพท์ใหม่ที่ดูเหมือนว่าเขาจะใช้เท่านั้น ทุกสิ่งที่อธิบายใน DeGroot ก็อธิบายได้ดีกว่าเช่นกัน ถ้าคุณรู้หนังสือที่ดีในภาษาเยอรมันมันก็ใช้ได้เหมือนฉันเป็นคนเยอรมัน

1
ไม่ว่าเดโบราห์มาโยจะลบล้างข้อพิสูจน์ของหลักการความน่าจะเป็น
นี่ค่อนข้างเกี่ยวข้องกับคำถามก่อนหน้าของฉันที่นี่: ตัวอย่างที่หลักการความน่าจะเป็น * สำคัญ * สำคัญหรือไม่ เห็นได้ชัดว่าเดโบราห์มาโยตีพิมพ์บทความทางวิทยาศาสตร์ทางสถิติเพื่อพิสูจน์หลักการของความน่าจะเป็นของ Birnbaum ใครสามารถอธิบายการโต้แย้งหลักโดย Birnbaum และการโต้เถียงโดย Mayo ได้หรือไม่? เธอพูดถูกหรือเปล่า?

6
'ไม่มีเส้นตรงสูง' หมายถึงอะไร
ฉันมักจะอ่านเกี่ยวกับฟังก์ชั่นที่ว่า ในความเข้าใจของฉันมี "เส้นตรง" และ "ไม่ใช่เชิงเส้น" ดังนั้นสิ่งนี้ 'สูง' เกี่ยวกับอะไร มีความแตกต่างอย่างเป็นทางการจากไม่ใช่เชิงเส้นหรือไม่? มันถูกกำหนดอย่างไร?

3
การกระจายของผลิตภัณฑ์สเกลาร์ของเวกเตอร์หน่วยสุ่มสองตัวในมิติ
ถ้าxx\mathbf{x}และyy\mathbf{y}สองเป็นอิสระเวกเตอร์หน่วยสุ่มRDRD\mathbb{R}^D (การกระจายอย่างสม่ำเสมอในหน่วยทรงกลม) อะไรคือการกระจายตัวของผลคูณของพวกเขา (ผลิตภัณฑ์ dot) x⋅yx⋅y\mathbf x \cdot \mathbf y ? ฉันเดาว่าDDDจะเพิ่มการกระจายอย่างรวดเร็ว (?) กลายเป็นปกติโดยมีค่าเฉลี่ยเป็นศูนย์และความแปรปรวนลดลงในส่วนของสูงขึ้นlimD→∞σ2(D)→0,limD→∞σ2(D)→0,\lim_{D\to\infty}\sigma^2(D) \to 0,แต่มีสูตรที่ชัดเจนสำหรับσ2(D)σ2(D)\sigma^2(D)หรือไม่ ปรับปรุง ฉันวิ่งไปตามสถานการณ์จำลอง ประการแรกการสร้าง 10000 คู่ของเวกเตอร์หน่วยสุ่มสำหรับD=1000D=1000D=1000มันเป็นเรื่องง่ายที่จะเห็นว่าการกระจายตัวของผลคูณจุดของพวกเขาเป็นอย่างดีเสียน (ในความเป็นจริงมันค่อนข้างเสียนแล้วสำหรับD=100D=100D=100 ) ดูแผนทางด้านซ้าย ที่สองสำหรับแต่ละDDDตั้งแต่ 1 ถึง 10,000 (ด้วยขั้นตอนเพิ่มขึ้น) ฉันสร้าง 1,000 คู่และคำนวณความแปรปรวน พล็อตเข้าสู่ระบบเข้าสู่ระบบจะปรากฏบนด้านขวาและเป็นที่ชัดเจนว่าสูตรเป็นห้วงเป็นอย่างดีโดย1/D1/D1/D D โปรดทราบว่าสำหรับD=1D=1D=1และD=2D=2D=2สูตรนี้ยังให้ผลลัพธ์ที่แน่นอน (แต่ฉันไม่แน่ใจว่าจะเกิดอะไรขึ้นในภายหลัง)

5
ทฤษฎีความน่าจะเป็นเป็นการศึกษาฟังก์ชั่นที่ไม่เป็นลบซึ่งรวม / รวมเป็นหนึ่งหรือไม่?
นี่อาจเป็นคำถามที่โง่ แต่ทฤษฎีความน่าจะเป็นคือการศึกษาฟังก์ชั่นที่รวม / รวมเข้ากับหนึ่งหรือไม่? แก้ไข ฉันลืมว่าไม่ได้ปฏิเสธ ทฤษฎีความน่าจะเป็นดังนั้นการศึกษาฟังก์ชั่นที่ไม่ใช่ลบที่รวมเข้ากับผลรวมเป็นหนึ่ง

2
การกระจายตัวของ
การกระจายของสัมประสิทธิ์การตัดสินใจคืออะไรหรือ R กำลังสอง, , ในการถดถอยเชิงเส้นหลายตัวแปรเชิงเส้นภายใต้สมมติฐาน ?R2R2R^2H0:β=0H0:β=0H_0:\beta=0 มันขึ้นอยู่กับจำนวนของตัวทำนายและจำนวนตัวอย่างอย่างไร มีนิพจน์แบบปิดสำหรับโหมดของการแจกแจงนี้หรือไม่?kkkn>kn>kn>k โดยเฉพาะฉันมีความรู้สึกว่าการถดถอยอย่างง่าย (ด้วยตัวทำนายหนึ่งตัว ) การแจกแจงนี้มีโหมดเป็นศูนย์ แต่สำหรับการถดถอยหลายครั้งโหมดจะอยู่ในค่าบวกที่ไม่เป็นศูนย์ หากนี่เป็นเรื่องจริงมีคำอธิบายง่ายๆเกี่ยวกับ "การเปลี่ยนเฟส" นี้หรือไม่?xxx ปรับปรุง ในฐานะที่เป็น @Alecos แสดงให้เห็นด้านล่างกระจายแน่นอนยอดเขาที่ศูนย์เมื่อและและไม่ได้อยู่ที่ศูนย์เมื่อ 3 ฉันรู้สึกว่าควรมีมุมมองทางเรขาคณิตในการเปลี่ยนเฟสนี้ พิจารณามุมมองเชิงเรขาคณิตของ OLS:เป็นเวกเตอร์ใน ,กำหนดพื้นที่ย่อย -dimensional จำนวน OLS จะฉาย\ mathbf Yบนสเปซนี้และR ^ 2คือโคไซน์กำลังสองของมุมระหว่าง\ Y mathbfและประมาณการ\ hat {\ mathbf y}k=2k=2k=2k=3k=3k=3k>3k>3k>3yy\mathbf yRnRn\mathbb R^nXX\mathbf Xkkkyy\mathbf yR2R2R^2yy\mathbf yy^y^\hat{\mathbf y} ทีนี้จากคำตอบของ @ Alecos ตามมาว่าถ้าเวกเตอร์ทั้งหมดสุ่มแล้วการกระจายความน่าจะเป็นของมุมนี้จะสูงสุดที่สำหรับและแต่จะมีโหมดที่ค่าอื่น ๆสำหรับ …

5
ความแตกต่างทางคณิตศาสตร์ระหว่างแบบสุ่มและแบบคงที่คืออะไร
ฉันพบมากบนอินเทอร์เน็ตเกี่ยวกับการตีความแบบสุ่มและแบบคงที่ อย่างไรก็ตามฉันไม่สามารถดึงแหล่งที่มาได้ดังต่อไปนี้: ความแตกต่างทางคณิตศาสตร์ระหว่างแบบสุ่มและแบบคงที่คืออะไร โดยที่ฉันหมายถึงสูตรทางคณิตศาสตร์ของแบบจำลองและวิธีการประมาณค่าพารามิเตอร์

1
มีผลลัพธ์ที่ให้ bootstrap ถูกต้องหรือไม่หากสถิตินั้นราบรื่นหรือไม่?
ตลอดเราคิดของเราสถิติเป็นฟังก์ชั่นบางข้อมูลซึ่งถูกดึงมาจากฟังก์ชันการกระจาย ; ฟังก์ชั่นการกระจายเชิงประจักษ์ของกลุ่มตัวอย่างของเราคือ{F} ดังนั้นคือสถิติที่ถูกมองว่าเป็นตัวแปรสุ่มและเป็นเวอร์ชั่นบูตของสถิติ เราใช้เป็นระยะทาง KSX 1 , ... X n F F θ ( F )θ(⋅)θ(⋅)\theta(\cdot)X1,…XnX1,…XnX_1, \ldots X_nFFFF^F^\hat{F}θ(F)θ(F)\theta(F)d ∞θ(F^)θ(F^)\theta(\hat{F})d∞d∞d_\infty มีผลลัพธ์ "if and only ถ้า" สำหรับความถูกต้องของ bootstrap หากสถิติเป็นสถิติเชิงเส้นอย่างง่าย ตัวอย่างเช่นทฤษฎีบทที่ 1 จาก Mammen "bootstrap ทำงานเมื่อไหร่?" ถ้าสำหรับบางฟังก์ชั่นโดยพลการจากนั้น bootstrap ทำงานในแง่ที่ถ้าและ เฉพาะในกรณีที่มีและเช่นนั้น เราสามารถนิยามเป็นฟังก์ชั่นบางอย่างของตัวอย่างของเราและเอชnd∞[L(θ( F ) -เสื้อ n),L(θ(F)-เสื้อn)]→หน้า0σnTnd∞[L(θ(F)-tn)θ(F)=1n∑ni−1hn(Xi)θ(F)=1n∑i−1nhn(Xi)\theta(F) = \frac{1}{n} \sum_{i-1}^n h_n(X_i)hnhnh_nd∞[L(θ(F^)−t^n),L(θ(F)−tn)]→p0d∞[L(θ(F^)−t^n),L(θ(F)−tn)]→p0d_\infty\big[\mathscr{L}(\theta(\hat{F})-\hat{t}_n), \mathscr{L}(\theta(F)-t_n)\big] \underset{p}{\rightarrow} 0σnσn\sigma_ntntnt_nd∞[L(θ(F)−tn),N(0,σ2n)]→p0d∞[L(θ(F)−tn),N(0,σn2)]→p0d_\infty\big[\mathscr{L}(\theta(F)-t_n), …

1
น่าจะเป็นสิ่งที่จุดสุ่มขนาดเส้นตรงแยกกันไม่ออก?
ได้รับจุดข้อมูลแต่ละคนมีคุณสมบัติมีการระบุว่าเป็น , อื่น ๆมีการระบุว่าเป็น1แต่ละคุณสมบัติใช้ค่าตั้งแต่แบบสุ่ม (การกระจายแบบสม่ำเสมอ) ความน่าจะเป็นที่มีไฮเปอร์เพลนที่สามารถแบ่งสองคลาสได้อย่างไรd n / 2 0 n / 2 1 [ 0 , 1 ]nnndddn / 2n/2n/2000n / 2n/2n/2111[ 0 , 1 ][0,1][0,1] ลองพิจารณากรณีที่ง่ายที่สุดในครั้งแรกคือ1d= 1d=1d = 1

4
สถิติทางคณิตศาสตร์และสถิติแตกต่างกันอย่างไร
สถิติและสถิติทางคณิตศาสตร์ต่างกันอย่างไร ฉันได้อ่านสิ่งนี้ : สถิติคือการศึกษาของการเก็บรวบรวมองค์กรการวิเคราะห์และการตีความข้อมูล มันเกี่ยวข้องกับทุกด้านของเรื่องนี้รวมถึงการวางแผนการเก็บข้อมูลในแง่ของการออกแบบการสำรวจและการทดลอง และนี่คือ : สถิติทางคณิตศาสตร์เป็นการศึกษาสถิติจากมุมมองทางคณิตศาสตร์โดยใช้ทฤษฎีความน่าจะเป็นรวมถึงสาขาคณิตศาสตร์อื่น ๆ เช่นพีชคณิตเชิงเส้นและการวิเคราะห์ ดังนั้นความแตกต่างระหว่างพวกเขาคืออะไร? ฉันสามารถเข้าใจได้ว่ากระบวนการของการรวบรวมอาจไม่ใช่คณิตศาสตร์ แต่ฉันเดาว่าการจัดระเบียบการวิเคราะห์และการตีความเป็นสิ่งที่ฉันทำหายไปหรือไม่

4
ตำราเรียนเกี่ยวกับทฤษฎี * ของอัลกอริทึมโครงข่ายประสาท / ML?
หนังสือทุกเล่มที่ฉันได้เห็นแล้วอธิบายเกี่ยวกับอัลกอริธึม ML และวิธีการนำไปใช้ มีตำราเรียนที่สร้างทฤษฎีและบทพิสูจน์สำหรับพฤติกรรมของอัลกอริทึมเหล่านั้นหรือไม่? เช่นระบุว่าภายใต้เงื่อนไข , การไล่ระดับสีจะนำไปสู่A , B , C ?x , y, zx,Y,Zx,y,zA , B , CA,B,CA,B,C

3
สถิติที่เพียงพอสำหรับคนธรรมดา
ใครช่วยอธิบายสถิติที่เพียงพอในศัพท์พื้นฐานได้ไหม? ฉันมาจากภูมิหลังทางวิศวกรรมและฉันได้ผ่านสิ่งต่างๆมากมาย แต่ไม่สามารถหาคำอธิบายที่เข้าใจง่าย

4
ตัวประมาณโอกาสสูงสุดที่ไม่เอนเอียงเป็นตัวประมาณค่าแบบเป็นกลางที่ดีที่สุดเสมอหรือไม่
ฉันรู้ปัญหาที่เกิดขึ้นเป็นประจำหากเรามีตัวประมาณค่าแบบไม่เอนเอียงที่ดีที่สุดมันต้องเป็นตัวประมาณความเป็นไปได้สูงสุด (MLE) แต่โดยทั่วไปถ้าเรามี MLE ที่ไม่เอนเอียงมันจะเป็นตัวประมาณที่ดีที่สุด (หรือบางทีฉันควรเรียกมันว่า UMVUE ตราบใดที่มันมีความแปรปรวนน้อยที่สุด)

4
ค่าที่คาดหวังของลอการิทึมธรรมชาติ
ฉันรู้ว่ากับ ค่าคงที่ดังนั้นเมื่อได้รับมันง่ายที่จะแก้ ฉันก็รู้ว่าคุณไม่สามารถใช้สิ่งนั้นได้เมื่อฟังก์ชั่นไม่เชิงเส้นเช่นในกรณีนี้และเพื่อแก้ปัญหานั้นฉันต้องทำการประมาณ กับเทย์เลอร์ ดังนั้นคำถามของฉันคือฉันจะแก้ปัญหา ? ฉันจะประมาณเทย์เลอร์ด้วยหรือไม่a , b E ( X ) E ( 1 / X ) ≠ 1 / E ( X ) E ( ln ( 1 + X ) )E( a X+ b ) = a E( X) + bE(aX+b)=aE(X)+bE(aX+b) = aE(X)+ba , ba,ba,b E( …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.