คำถามติดแท็ก mathematical-statistics

ทฤษฎีทางคณิตศาสตร์ของสถิติที่เกี่ยวข้องกับคำจำกัดความที่เป็นทางการและผลลัพธ์ทั่วไป

3
ทำไมความน่าจะเป็นสูงสุดและไม่น่าจะเป็นไปได้?
เหตุใดจึงเป็นเรื่องธรรมดาที่จะได้รับการประมาณการความน่าจะเป็นสูงสุดของพารามิเตอร์ แต่คุณแทบไม่เคยได้ยินเกี่ยวกับการประมาณค่าพารามิเตอร์ความน่าจะเป็นที่คาดหวัง (กล่าวคืออิงจากค่าที่คาดหวังมากกว่าโหมดของฟังก์ชันโอกาส) นี่เป็นเหตุผลหลักในเชิงประวัติศาสตร์หรือมีเหตุผลทางเทคนิคหรือเชิงทฤษฎีมากกว่านี้หรือไม่? จะมีข้อได้เปรียบที่สำคัญและ / หรือข้อเสียในการใช้การประมาณความน่าจะเป็นที่คาดหวังมากกว่าการประมาณการความเป็นไปได้สูงสุดหรือไม่? มีบางพื้นที่ที่คาดการณ์ความน่าจะเป็นใช้เป็นประจำหรือไม่?

3
เคยมีคอนจูเกตก่อนหน้า: ทรัพย์สินลึกหรืออุบัติเหตุทางคณิตศาสตร์
การแจกแจงบางอย่างมีคอนจูเกตคอนจูเกตและบางอันไม่มี ความแตกต่างนี้เป็นเพียงอุบัติเหตุหรือไม่? นั่นคือคุณทำคณิตศาสตร์และมันได้ผลในทางใดทางหนึ่ง แต่มันไม่ได้บอกอะไรที่สำคัญเกี่ยวกับการแจกแจงยกเว้นความจริงด้วยตัวเอง? หรือการมีหรือไม่มีคอนจูเกตก่อนสะท้อนถึงคุณสมบัติที่ลึกกว่าของการแจกแจงหรือไม่? การแจกแจงกับนักบวชสังฆะแบ่งปันคุณสมบัติที่น่าสนใจอื่น ๆ หรือคุณสมบัติที่การกระจายอื่น ๆ ขาดที่ทำให้เกิดการกระจายเหล่านั้นและไม่ใช่ผู้อื่นที่จะมีการผันก่อนหน้านี้?

5
แหล่งที่มาสำหรับการเรียนรู้ (ไม่ใช่แค่ทำงาน) สถิติ / คณิตศาสตร์ผ่าน R
ฉันสนใจตัวอย่างของแหล่งข้อมูล (รหัส R, แพ็คเกจ R, หนังสือ, บทหนังสือ, บทความ, ลิงก์ ฯลฯ ) สำหรับการเรียนรู้แนวคิดทางสถิติและคณิตศาสตร์ผ่าน R (อาจเป็นภาษาอื่นได้ แต่ R คือรสนิยมที่ฉันโปรดปราน) ความท้าทายคือการเรียนรู้ของวัสดุอาศัยการเขียนโปรแกรมไม่ใช่เพียงแค่วิธีการเรียกใช้โค้ดที่ดำเนินการตามขั้นตอนวิธี ดังนั้น (ตัวอย่าง) หนังสือเช่นรุ่นเชิงเส้นที่มี R (ซึ่งเป็นหนังสือที่ยอดเยี่ยม) ไม่ใช่สิ่งที่ฉันกำลังมองหา นี่เป็นเพราะว่าหนังสือเล่มนี้ส่วนใหญ่แสดงวิธีการใช้ตัวแบบเชิงเส้นใน R แต่มันไม่ได้หมุนรอบการสอนแบบเชิงเส้นโดยใช้ R ไฟล์ช่วยเหลือสำหรับแพ็คเกจการสอน (มหัศจรรย์) เป็นตัวอย่างที่ดีของสิ่งที่ฉันกำลังมองหา มันเป็นแพคเกจ R ซึ่งรวมถึงฟังก์ชั่นสำหรับการเรียนรู้แนวคิดทางสถิติผ่านแอปเพล็ต R และการจำลองต่างๆ ไฟล์ช่วยเหลือมาพร้อมดี แน่นอนว่าไม่เพียงพอและต้องใช้ตำราเรียนภายนอกเพื่อฝึกฝนรายละเอียดที่แน่นอนหลายอย่างเพื่อเรียนรู้ (เช่นไฟล์ช่วยเหลือ) โอกาสในการขายทั้งหมดจะได้รับการชื่นชมมาก

1
เมื่อใดที่เขตข้อมูลสุ่มของ Markov
ในตำราเรียนของพวกเขารุ่นกราฟิกครอบครัวเอกและแปรผันอนุมาน , เอ็มจอร์แดนและเอ็มเวนไรท์หารือเกี่ยวกับการเชื่อมต่อระหว่างครอบครัวเอกและมาร์คอฟทุ่งสุ่ม (ไม่มีทิศทางรูปแบบกราฟิก) ฉันพยายามเข้าใจความสัมพันธ์ที่ดีขึ้นระหว่างพวกเขาด้วยคำถามต่อไปนี้: MRF ทุกคนเป็นสมาชิกของครอบครัวผู้ชี้แจงหรือไม่ สมาชิกทุกคนในตระกูลเอ็กซ์โปเนนเชียลสามารถแสดงตนเป็น MRF ได้หรือไม่? หาก MRFs ครอบครัวชี้แจงสิ่งที่เป็นตัวอย่างที่ดีของการกระจายของประเภทหนึ่งไม่ ncluded ในอื่น ๆ ?≠≠\neq จากสิ่งที่ฉันเข้าใจในตำราเรียนของพวกเขา (บทที่ 3) จอร์แดนและเวนไรท์นำเสนอข้อโต้แย้งต่อไป: บอกว่าเรามี AA เกลา X ตัวแปรสุ่มที่ตามบางส่วนกระจายและวาดnสังเกต IID X 1 , ... X nและเราต้องการที่จะระบุPพีพีpnnnX1, … XnX1,...XnX^1, \ldots X^nพีพีp เราคำนวณความคาดหวังเชิงประจักษ์ของฟังก์ชั่นบางอย่างφαφα\phi_\alpha% สำหรับทุกอัลฟ่า∈ฉันμ^α= 1nΣni = 1φα( Xผม) ,μ^α=1nΣผม=1nφα(Xผม),\hat{\mu}_\alpha= \frac{1}{n}\sum^n_{i=1}\phi_\alpha(X^i), อัลฟ่า∈ ฉันα∈ผม\alpha \in \mathcal{I} ที่แต่ละในบางชุดฉันทำดัชนีฟังก์ชั่นϕ …

2
การแจกแจงแบบใดที่มีวิธีแก้ปัญหาแบบปิดเพื่อการประมาณค่าโอกาสสูงสุด
การแจกแจงแบบใดมีวิธีแก้ปัญหาแบบปิดสำหรับการประมาณค่าความน่าจะเป็นสูงสุดของพารามิเตอร์จากตัวอย่างการสังเกตการณ์อิสระ

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
สัญชาตญาณที่อยู่เบื้องหลังการนิยามความสมบูรณ์ในสถิติเป็นสิ่งที่เป็นไปไม่ได้ที่จะสร้างตัวประมาณที่ไม่มีอคติเท่ากับจากอะไร?
ในสถิติคลาสสิคมีคำจำกัดความว่าสถิติของชุดข้อมูลถูกกำหนดให้สมบูรณ์สำหรับพารามิเตอร์มันเป็นไปไม่ได้ที่จะสร้างตัวประมาณค่าที่ไม่เอนเอียงเป็นจากมันโดยไม่ตั้งใจ นั่นคือวิธีเดียวที่จะมีสำหรับทั้งหมดคือการมีเป็นเกือบแน่นอนTTTy1,…,yny1,…,yny_1, \ldots, y_nθθ\theta000Eh(T(y))=0Eh(T(y))=0E h(T (y )) = 0θθ\thetahhh000 มีปรีชาเบื้องหลังนี้ไหม ดูเหมือนว่าจะเป็นวิธีที่ใช้ในการกำหนดสิ่งนี้ฉันรู้ว่าสิ่งนี้ได้รับการถามมาก่อน แต่สงสัยว่ามีสัญชาตญาณที่เข้าใจได้ง่ายซึ่งจะทำให้นักเรียนเกริ่นนำมีเวลาย่อยวัสดุได้ง่ายขึ้น

4
ตัวอย่างของการแจกแจงแบบไม่ต่อเนื่องที่ไม่เป็นลบโดยที่ค่าเฉลี่ย (หรือช่วงเวลาอื่น) ไม่อยู่?
ฉันกำลังทำงานใน scipy และการสนทนาเกิดขึ้นกับสมาชิกของกลุ่ม scipy หลักว่าตัวแปรสุ่มแยกแบบไม่ต่อเนื่องสามารถมีช่วงเวลาที่ไม่ได้กำหนด ฉันคิดว่าเขาถูกต้อง แต่ไม่มีข้อพิสูจน์ที่มีประโยชน์ ทุกคนสามารถแสดง / พิสูจน์ข้อเรียกร้องนี้ได้หรือไม่? (หรือถ้าการเรียกร้องนี้ไม่ได้พิสูจน์หักล้างจริง) ฉันไม่ได้มีตัวอย่างที่มีประโยชน์ถ้าตัวแปรสุ่มแบบแยกนั้นสนับสนุนแต่ดูเหมือนว่าการแจกจ่าย Cauchy บางรุ่นที่ไม่ควรนำมาใช้เป็นตัวอย่างเพื่อให้ได้ช่วงเวลาที่ไม่ได้กำหนด เงื่อนไขของการไม่ปฏิเสธ (อาจรวมถึง ) เป็นสิ่งที่ดูเหมือนจะทำให้ปัญหาท้าทาย (อย่างน้อยสำหรับฉัน) 0ZZ\mathbb{Z}000

5
ตัวอย่างที่หลักการความน่าจะเป็น * สำคัญจริงๆหรือ?
มีตัวอย่างที่การทดสอบที่ป้องกันได้สองแบบที่แตกต่างกันซึ่งมีความน่าจะเป็นสัดส่วนจะนำไปสู่การอนุมานที่แตกต่างกันอย่างชัดเจน (และการป้องกันที่เท่ากัน) อย่างเช่นที่ p-values ​​เป็นลำดับของขนาดไกลออกไป ตัวอย่างทั้งหมดที่ฉันเห็นนั้นโง่มากการเปรียบเทียบทวินามกับลบทวินามโดยที่ p-value ของอันแรกคือ 7% และ 3% ที่สองซึ่งเป็น "แตกต่าง" เพียงอย่างเดียวที่จะทำการตัดสินใจไบนารีบนธรณีประตูตามอำเภอใจ อย่างมีนัยสำคัญเช่น 5% (ซึ่งโดยวิธีการเป็นมาตรฐานที่ค่อนข้างต่ำสำหรับการอนุมาน) และไม่ต้องกังวลกับการดูที่อำนาจ ถ้าฉันเปลี่ยนเกณฑ์เป็น 1% ทั้งคู่นำไปสู่ข้อสรุปเดียวกัน ฉันไม่เคยเห็นตัวอย่างที่จะนำไปสู่ข้อสรุปที่แตกต่างและชัดเจนซึ่งสามารถป้องกันได้ มีตัวอย่างเช่นนี้หรือไม่? ฉันถามเพราะฉันเห็นหมึกจำนวนมากที่ใช้ในหัวข้อนี้ราวกับว่าหลักการความน่าจะเป็นเป็นพื้นฐานในการอนุมานเชิงสถิติ แต่ถ้าตัวอย่างที่ดีที่สุดมีตัวอย่างที่ไร้สาระเหมือนตัวอย่างข้างต้นหลักการนั้นดูเหมือนจะไม่สมบูรณ์ ดังนั้นฉันกำลังมองหาตัวอย่างที่น่าสนใจมากซึ่งหากไม่มีใครทำตาม LP น้ำหนักของหลักฐานจะชี้ไปในทิศทางเดียวอย่างท่วมท้นเมื่อได้รับการทดสอบเพียงครั้งเดียว แต่ในการทดสอบอื่นที่มีความเป็นไปได้สัดส่วนน้ำหนักของหลักฐานจะ จะชี้ไปในทิศทางตรงกันข้ามอย่างท่วมท้นและข้อสรุปทั้งสองดูสมเหตุสมผล ตามหลักการแล้วเราสามารถแสดงให้เห็นว่าเรามีคำตอบที่ห่างไกล แต่มีเหตุผลเช่นการทดสอบด้วยp=0.1พี=0.1p =0.1เทียบกับp=10−10พี=10-10p= 10^{-10}ด้วยความน่าจะเป็นสัดส่วนและพลังงานที่เทียบเท่าในการตรวจหาทางเลือกเดียวกัน PS:คำตอบของบรูซไม่ได้ตอบคำถามเลย

7
เหตุใดเมทริกซ์เชิงบวกแน่นอนที่แน่นอน (SPD) จึงมีความสำคัญมาก
ฉันรู้ว่าคำจำกัดความของเมทริกซ์ definite positive (SPD) positive symmetric แต่ต้องการเข้าใจมากกว่านี้ ทำไมพวกเขาถึงมีความสำคัญอย่างสังหรณ์ใจ? นี่คือสิ่งที่ฉันรู้ มีอะไรอีกบ้าง? สำหรับข้อมูลที่กำหนดเมทริกซ์ความแปรปรวนร่วมคือ SPD เมทริกซ์ความแปรปรวนร่วมเป็นตัวชี้วัดที่สำคัญให้ดูโพสต์ที่ยอดเยี่ยมนี้สำหรับคำอธิบายที่เข้าใจง่าย รูปแบบสมการกำลังสองนูนออกหากคือ SPD Convexity เป็นคุณสมบัติที่ดีสำหรับฟังก์ชั่นที่สามารถตรวจสอบให้แน่ใจว่าโซลูชันในพื้นที่นั้นเป็นโซลูชันระดับโลก สำหรับปัญหานูนมีวิธีการแก้ปัญหาที่ดีมากมาย แต่ไม่ใช่สำหรับปัญหาที่ไม่ใช่ covex12x⊤Ax−b⊤x+c12x⊤Ax−b⊤x+c\frac 1 2 x^\top Ax-b^\top x +cAAA เมื่อคือ SPD โซลูชันเพิ่มประสิทธิภาพสำหรับรูปแบบสมการกำลังสองและโซลูชันสำหรับระบบเชิงเส้นเหมือนกัน ดังนั้นเราจึงสามารถทำการแปลงระหว่างสองปัญหาคลาสสิค สิ่งนี้มีความสำคัญเพราะช่วยให้เราสามารถใช้เทคนิคที่ค้นพบในโดเมนหนึ่งในอีกโดเมนหนึ่ง ตัวอย่างเช่นเราสามารถใช้วิธีการไล่ระดับสีแบบคอนจูเกตเพื่อแก้ปัญหาระบบเชิงเส้นAAAminimize 12x⊤Ax−b⊤x+cminimize 12x⊤Ax−b⊤x+c\text{minimize}~~~ \frac 1 2 x^\top Ax-b^\top x +cAx=bAx=bAx=b มีอัลกอริธึมที่ดีมากมาย (เร็วและเสถียรเป็นตัวเลข) ที่ทำงานได้ดีกว่าสำหรับเมทริกซ์ SPD เช่นการสลายตัวของ Cholesky แก้ไข: ฉันไม่ได้พยายามถามตัวตนของเมทริกซ์ SPD …

8
สถิติไม่ใช่คณิตศาสตร์ใช่ไหม
สถิติเป็นคณิตศาสตร์หรือไม่? เนื่องจากว่าเป็นตัวเลขทั้งหมดส่วนใหญ่สอนโดยแผนกคณิตศาสตร์และคุณได้รับเครดิตคณิตศาสตร์สำหรับมันฉันสงสัยว่าผู้คนหมายถึงมันเป็นเรื่องตลกเพียงครึ่งเดียวเมื่อพวกเขาพูดเช่นบอกว่ามันเป็นเพียงส่วนน้อยของคณิตศาสตร์หรือแค่ใช้คณิตศาสตร์ ฉันสงสัยว่าบางอย่างเช่นสถิติซึ่งคุณไม่สามารถสร้างทุกอย่างบนสัจพจน์พื้นฐานนั้นถือเป็นคณิตศาสตร์ได้หรือไม่ ตัวอย่างเช่นซึ่งเป็นแนวคิดที่เกิดขึ้นเพื่อทำความเข้าใจกับข้อมูล แต่ไม่ใช่ผลลัพธ์เชิงตรรกะของหลักการพื้นฐานเพิ่มเติมppp

1
ค่าที่คาดหวังและความแปรปรวนของบันทึก (ก)
ฉันมีตัวแปรสุ่มที่เป็นปกติกระจาย2) สิ่งที่ฉันสามารถพูดเกี่ยวกับและ ? การประมาณจะเป็นประโยชน์เช่นกันN ( μ , σ 2 ) E ( X ) V a r ( X )X( a ) = บันทึก( a )X(a)=log⁡(a)X(a) = \log(a)ยังไม่มีข้อความ( μ , σ2)N(μ,σ2)\mathcal N(\mu,\sigma^2)E( X)E(X)E(X)VR ( X)Var(X)Var(X)

3
การเชื่อมต่อระหว่างตัวชี้วัดฟิชเชอร์และเอนโทรปีสัมพัทธ์
บางคนสามารถพิสูจน์การเชื่อมต่อต่อไปนี้ระหว่างตัวชี้วัดข้อมูลฟิชเชอร์กับเอนโทรปีสัมพัทธ์ (หรือ KL divergence) อย่างเคร่งครัดทางคณิตศาสตร์อย่างหมดจด? D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(∥da∥3)D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(‖da‖3)D( p(\cdot , a+da) \parallel p(\cdot,a) ) =\frac{1}{2} g_{i,j} \, da^i \, da^j + (O( \|da\|^3)= ( 1 , ... , n ) , วันที่= ( วันที่1 , ... , วันที่n ) กรัมฉัน, J = ∫ ∂ ฉัน ( เข้าสู่ระบบP ( x ; a ) …

2
คำนวณปริมาณโดยประมาณสำหรับจำนวนเต็มโดยใช้ช่วงเวลา?
อพยพมาจากmath.stackexchange ฉันกำลังประมวลผลจำนวนเต็มจำนวนมากและกำลังพิจารณาการติดตามสักครู่เพื่อให้สามารถคำนวณเปอร์เซ็นต์ไทล์สำหรับสตรีมได้โดยไม่ต้องจัดเก็บข้อมูลมากนัก วิธีที่ง่ายที่สุดในการคำนวณหาเปอร์เซ็นต์ไทล์คืออะไร มีวิธีที่ดีกว่าที่เกี่ยวข้องกับการจัดเก็บข้อมูลจำนวนเล็กน้อยเท่านั้นหรือไม่?

2
หลักฐานการบรรจบกันของค่า k
สำหรับงานที่มอบหมายฉันถูกขอให้แสดงหลักฐานว่า k-หมายถึงการบรรจบกันในขั้นตอนจำนวน จำกัด นี่คือสิ่งที่ฉันเขียน: คคCE( C) = ∑xนาทีi = 1k∥ x - cผม∥2E(ค)=Σxนาทีผม=1k‖x-คผม‖2E(C)=\sum_{\mathbf{x}}\min_{i=1}^{k}\left\Vert \mathbf{x}-\mathbf{c}_{i}\right\Vert ^{2}E( C)E(ค)E(C) ขั้นตอนที่ 2 อ้างถึงขั้นตอนที่ติดป้ายแต่ละจุดข้อมูลโดยศูนย์คลัสเตอร์ที่ใกล้ที่สุดและขั้นตอนที่ 3 เป็นขั้นตอนที่ศูนย์มีการปรับปรุงโดยใช้ค่าเฉลี่ย สิ่งนี้ไม่เพียงพอที่จะพิสูจน์ว่าการบรรจบกันในขั้นตอนที่ จำกัด พลังงานมีขนาดเล็กลงเรื่อย ๆ แต่ก็ไม่ได้ตัดทอนความเป็นไปได้ที่จุดศูนย์กลางสามารถกระโดดได้โดยไม่ต้องเปลี่ยนพลังงานมากนัก กล่าวอีกนัยหนึ่งอาจมีพลังงานขั้นต่ำหลายอย่างและอัลกอริทึมสามารถข้ามไปมาระหว่างกันได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.