คำถามติดแท็ก self-study

แบบฝึกหัดประจำจากตำราหลักสูตรหรือแบบทดสอบที่ใช้สำหรับชั้นเรียนหรือเรียนด้วยตนเอง นโยบายของชุมชนนี้คือ "ให้คำแนะนำที่เป็นประโยชน์" สำหรับคำถามดังกล่าวแทนที่จะตอบเต็ม

3
เนย์แมน - เพียร์สันบทแทรก
ฉันได้อ่านบทสรุปของเนย์แมน - เพียร์สัน จากหนังสือ บทนำสู่ทฤษฎีสถิติโดย Mood, Graybill และ Boes แต่ฉันไม่เข้าใจบทแทรก ใครช่วยอธิบายบทแทรกให้ฉันด้วยคำพูดธรรมดา ๆ ได้ไหม? มันระบุว่าอะไร? Neyman-Pearson Lemma:ให้เป็นตัวอย่างแบบสุ่มจากโดยที่เป็นหนึ่งในสองค่าที่รู้จักและและให้ได้รับการแก้ไข .X1,…,XnX1,…,XnX_1,\ldots,X_nf(x;θ)f(x;θ)f(x;\theta)θθ\thetaθ0θ0\theta_0θ1θ1\theta_10&lt;α&lt;10&lt;α&lt;10<\alpha<1 ให้ เป็นค่าคงที่เป็นบวกและเป็นเซตย่อยของซึ่งตอบสนอง: \ text {และ} \ quad \ lambda \ ge \ quad k ^ * \ ข้อความ {ถ้า} (x_1, \ ldots, x_n) \ in \ bar C ^ * จากนั้นทดสอบ\ gamma ^ …

4
จะทดสอบได้อย่างไรว่าการกระจายตัวของฉันนั้นต่อเนื่องหลายรูปแบบ?
เมื่อฉันพล็อตฮิสโตแกรมของข้อมูลของฉันมันมีสองจุด: นั่นหมายความว่าอาจมีการกระจายแบบหลายโหมดหรือไม่? ฉันวิ่งdip.testใน R ( library(diptest)) และผลลัพธ์คือ: D = 0.0275, p-value = 0.7913 ฉันสามารถสรุปได้ว่าข้อมูลของฉันมีการกระจายหลายโหมด? ข้อมูล 10346 13698 13894 19854 28066 26620 27066 16658 9221 13578 11483 10390 11126 13487 15851 16116 24102 30892 25081 14067 10433 15591 8639 10345 10639 15796 14507 21289 25444 26149 23612 19671 12447 13535 10667 …

1
ความแตกต่างระหว่างโมเดล Markov ที่ซ่อนอยู่กับตัวกรองอนุภาค (และตัวกรองคาลมาน)
นี่คือคำถามเก่าของฉัน ฉันอยากถามว่ามีใครรู้ถึงความแตกต่าง (ถ้ามีความแตกต่างใด ๆ ) ระหว่าง Hidden Markov models (HMM) และ Particle Filter (PF) หรือไม่และเป็นผลจาก Kalman Filter หรือในกรณีที่เราใช้อัลกอริทึมใด ฉันเป็นนักเรียนและฉันต้องทำโครงการ แต่ก่อนอื่นฉันต้องเข้าใจบางสิ่ง ดังนั้นตามบรรณานุกรมทั้งสองรัฐอวกาศรุ่นรวมทั้งที่ซ่อนอยู่ (หรือแฝงหรือสังเกต) รัฐ ตามที่ Wikipedia (Hidden_Markov_model) “ใน HMM พื้นที่สถานะของตัวแปรที่ซ่อนอยู่นั้นไม่ต่อเนื่องในขณะที่การสังเกตตัวเองสามารถแยกออกจากกัน (โดยทั่วไปจะเกิดจากการกระจายแบบแบ่งหมวดหมู่) หรือต่อเนื่อง (โดยทั่วไปมาจากการแจกแจงแบบเกาส์) โมเดลมาร์คอฟที่ซ่อนยังสามารถวางนัยเพื่ออนุญาตให้มีพื้นที่ของรัฐอย่างต่อเนื่อง ตัวอย่างของแบบจำลองเหล่านั้นคือสิ่งที่กระบวนการมาร์คอฟเหนือตัวแปรที่ซ่อนอยู่เป็นระบบพลวัตเชิงเส้นที่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรที่เกี่ยวข้องและที่ที่ตัวแปรที่ซ่อนอยู่ ในกรณีง่าย ๆ เช่นระบบพลวัตเชิงเส้นที่กล่าวถึงการอนุมานที่แน่นอนนั้นง่ายต่อการใช้งาน (ในกรณีนี้ใช้ตัวกรองคาลมาน); อย่างไรก็ตามโดยทั่วไปการอนุมานที่แน่นอนใน HMMs ที่มีตัวแปรแฝงต่อเนื่องเป็นไปไม่ได้และต้องใช้วิธีการโดยประมาณ” แต่สำหรับฉันมันค่อนข้างสับสน ... ในคำง่ายๆนี้หมายถึงการติดตาม (จากการวิจัยเพิ่มเติมที่ฉันได้ทำไป): ใน HMM พื้นที่รัฐสามารถเป็นได้ทั้งที่ไม่ต่อเนื่องหรือต่อเนื่อง นอกจากนี้ยังมีข้อสังเกตที่ตัวเองสามารถเป็นได้ทั้งที่ไม่ต่อเนื่องหรือต่อเนื่อง นอกจากนี้ …

3
เหตุใด nls () ให้ข้อผิดพลาด“ เมตริกซ์การไล่ระดับสีเอกพจน์ที่ประมาณการพารามิเตอร์เริ่มต้น” ให้ฉัน
ฉันมีข้อมูลพื้นฐานเกี่ยวกับการลดการปล่อยก๊าซและราคาต่อคัน: q24 &lt;- read.table(text = "reductions cost.per.car 50 45 55 55 60 62 65 70 70 80 75 90 80 100 85 200 90 375 95 600 ",header = TRUE, sep = "") ฉันรู้ว่านี่เป็นฟังก์ชั่นเอ็กซ์โปเนนเชียลดังนั้นฉันคาดหวังว่าจะสามารถหาแบบจำลองที่เหมาะกับ: model &lt;- nls(cost.per.car ~ a * exp(b * reductions) + c, data = q24, start = …

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

4
ทุกคนสามารถอธิบายแนวคิดของ "ผลรวมของตัวแปรสุ่ม"
ในชั้นความน่าจะเป็นของฉันคำว่า "ผลรวมของตัวแปรสุ่ม" ถูกนำมาใช้อย่างต่อเนื่อง อย่างไรก็ตามฉันติดอยู่กับสิ่งที่ว่าหมายถึงอะไร? เรากำลังพูดถึงผลรวมของกลุ่มของการรับรู้จากตัวแปรสุ่มหรือไม่? ถ้าใช่นั่นจะไม่รวมกันเป็นตัวเลขเดียวใช่หรือไม่ ผลรวมของการรับรู้ตัวแปรแบบสุ่มนำเราไปสู่การแจกแจงอย่างไรหรือ cdf / pdf / ฟังก์ชันทุกชนิด และถ้าไม่ใช่การรับรู้ตัวแปรแบบสุ่มแล้วจะมีอะไรเพิ่มเข้ามาบ้าง?

2
ข้อดีของตระกูลเอ็กซ์โปแนนเชียล: ทำไมเราควรศึกษาและใช้มัน?
ดังนั้นที่นี่ฉันกำลังศึกษาอนุมาน ฉันต้องการให้ใครบางคนสามารถระบุข้อดีของตระกูลเอ็กซ์โปเนนเชียล โดยตระกูลเอ็กซ์โพเนนเชียลฉันหมายถึงการแจกแจงที่ได้รับเป็น ฉ( x | θ ) = h ( x ) exp{ η( θ ) T( x ) - B ( θ ) }ฉ(x|θ)=ชั่วโมง(x)ประสบการณ์⁡{η(θ)T(x)-B(θ)}\begin{align*} f(x|\theta) = h(x)\exp\left\{\eta(\theta)T(x) - B(\theta)\right\} \end{align*} สนับสนุนซึ่งไม่ขึ้นอยู่กับพารามิเตอร์\นี่คือข้อดีที่ฉันค้นพบ:θθ\theta (a) ประกอบด้วยการกระจายที่หลากหลาย (b) มีสถิติที่เพียงพอตามธรรมชาติตามทฤษฎีบทของเนย์แมน - ฟิชเชอร์T( x )T(x)T(x) (ค) มันทำให้เป็นไปได้เพื่อให้เป็นสูตรที่ดีสำหรับฟังก์ชั่นช่วงเวลาที่ก่อให้เกิดของT(x )T(x)T(x)(x) (d) ทำให้ง่ายต่อการแยกความสัมพันธ์ระหว่างการตอบสนองและตัวทำนายจากการแจกแจงแบบมีเงื่อนไขของการตอบสนอง (ผ่านฟังก์ชั่นลิงค์) ใครสามารถให้ประโยชน์อื่น ๆ ได้บ้าง?

2
คุณ“ ควบคุม” สำหรับปัจจัย / ตัวแปรอย่างไร
เพื่อความเข้าใจของฉัน "การควบคุม" สามารถมีความหมายสองอย่างในสถิติ กลุ่มควบคุม: ในการทดสอบจะไม่มีการรักษาให้กับสมาชิกของกลุ่มควบคุม ตัวอย่าง: ยาหลอกเทียบกับยา: คุณให้ยาแก่กลุ่มหนึ่งและไม่ให้อีกกลุ่มหนึ่ง (กลุ่มควบคุม) ซึ่งเรียกอีกอย่างว่า "การทดลองที่ควบคุม" การควบคุมตัวแปร: เทคนิคการแยกเอฟเฟกต์ของตัวแปรอิสระเฉพาะ ชื่ออื่นที่ให้กับเทคนิคนี้คือ "การบัญชีสำหรับ", "การถือค่าคงที่", "การควบคุมสำหรับ", ตัวแปรบางตัว ตัวอย่างเช่น: ในการศึกษาดูฟุตบอล (เหมือนหรือไม่ชอบ) คุณอาจต้องการใช้เอฟเฟกต์ของเพศเมื่อเราคิดว่าเพศเป็นสาเหตุของความลำเอียงนั่นคือผู้ชายอาจชอบมากกว่าผู้หญิง ดังนั้นคำถามของฉันมีไว้สำหรับจุด (2) สองคำถาม: คุณ "ควบคุม" / "บัญชีสำหรับ" ตัวแปรโดยทั่วไปได้อย่างไร ใช้เทคนิคอะไร (ในแง่ของการถดถอยกรอบ ANOVA) ในตัวอย่างด้านบนการเลือกชายและหญิงจะเป็นการควบคุมแบบสุ่มหรือไม่? นั่นคือ "การสุ่ม" เป็นหนึ่งในเทคนิคในการควบคุมเอฟเฟกต์อื่น ๆ หรือไม่?

2
สมมติว่า
เป็นอะไรที่ง่ายที่สุดวิธีที่จะเห็นว่าคำสั่งดังต่อไปนี้เป็นจริงหรือไม่? สมมติว่า(1) แสดง1)Y 1 , … , Y n iid ∼ Exp ( 1 ) Y1,…,Yn∼iidExp(1)Y_1, \dots, Y_n \overset{\text{iid}}{\sim} \text{Exp}(1)∑ n i = 1 ( Y i - Y ( 1 ) ) ∼ Gamma ( n - 1 , 1 )∑ni=1(Yi−Y(1))∼Gamma(n−1,1)\sum_{i=1}^{n}(Y_i - Y_{(1)}) \sim \text{Gamma}(n-1, 1) โปรดทราบว่าn}Y ( 1 …

1
วิธีที่สองช่วงเวลาเคลื่อนไหวบราวเนียน?
ให้Bเสื้อBเสื้อB_tเป็นภาพเคลื่อนไหว Brownian มาตรฐาน ให้แสดงถึงเหตุการณ์และให้ที่หมายถึงฟังก์ชั่นตัวบ่งชี้ มีเช่นนั้นสำหรับสำหรับทั้งหมดหรือไม่ ฉันสงสัยว่าคำตอบคือใช่; ฉันได้ลองสับสนกับวิธีช่วงเวลาที่สอง แต่ไม่ได้ประโยชน์มาก สามารถแสดงด้วยวิธีโมเมนต์ที่สองได้หรือไม่ หรือฉันควรจะลองอย่างอื่น?{ B t = 0 สำหรับบาง j - 1EJ,nEj,nE_{j, n}Kn=22nΣJ=2n+11EJ,n,1ρ&gt;0P{Kn≥ρ2n}≥ρn{Bt= 0 สำหรับบางคน j−12n≤ t ≤j2n} ,{Bt=0 สำหรับบางคน J-12n≤เสื้อ≤J2n},\left\{B_t = 0 \text{ for some }{{j-1}\over{2^n}} \le t \le {j\over{2^n}}\right\},Kn=∑j=2n+122n1Ej,n,Kn=∑j=2n+122n1Ej,n,K_n = \sum_{j = 2^n + 1}^{2^{2n}} 1_{E_{j,n}},111ρ&gt;0ρ&gt;0\rho > 0P{Kn≥ρ2n}≥ρP{Kn≥ρ2n}≥ρ\mathbb{P}\{K_n \ge \rho2^{n}\} \ge \rhonnn

1
พิสูจน์สูตร LOOCV
จากบทนำสู่การเรียนรู้เชิงสถิติโดย James et al. การประมาณค่าการตรวจสอบความถูกต้องแบบข้ามใบ (LOOCV) ถูกกำหนดโดย ที่ 2CV ( n ) = 1n n Σฉัน=1MSEฉันCV(n)=1n∑i=1nMSEi\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\text{MSE}_iMSEฉัน=(y ที่ฉัน - Yฉัน)2MSEi=(yi−y^i)2\text{MSE}_i = (y_i-\hat{y}_i)^2 โดยไม่มีการพิสูจน์สมการ (5.2) ระบุว่าสำหรับการถดถอยแบบพหุนามหรือพหุนามอย่างน้อยที่สุด (ไม่ว่าสิ่งนี้จะนำไปใช้กับการถดถอยของตัวแปรเพียงตัวเดียวไม่รู้จักกับฉัน) โดยที่ "คือ TH ค่าติดตั้งจากน้อยสแควร์เดิมพอดี ( ความคิดที่ไม่มีสิ่งนี้หมายความว่าโดยวิธีการที่มันไม่ได้หมายความว่าจากการใช้ทั้งหมดของจุดในชุดข้อมูล?) และคืองัด" ซึ่งถูกกำหนดโดยCV ( n ) = 1n n Σฉัน=1( Y ฉัน- Yฉัน1 - เอชฉัน )2ปีฉันฉันCV(n)=1n∑i=1n(yi−y^i1−hi)2\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\left(\dfrac{y_i …

2
Hidden Markov Model เทียบกับ Markov Transition Model เทียบกับ State-Space Model …?
สำหรับวิทยานิพนธ์ปริญญาโทของฉันฉันกำลังทำงานเพื่อพัฒนาแบบจำลองทางสถิติสำหรับการเปลี่ยนระหว่างสถานะต่าง ๆ ที่กำหนดโดยสถานะทางเซรุ่มวิทยา สำหรับตอนนี้ฉันจะไม่ให้รายละเอียดมากเกินไปในบริบทนี้เนื่องจากคำถามของฉันเป็นเรื่องทั่วไป / ทางทฤษฎี อย่างไรก็ตามปรีชาญาณของฉันคือฉันควรใช้ Hidden Markov Model (HMM); ปัญหาที่ฉันเจอในขณะที่ฉันอ่านวรรณกรรมและการวิจัยพื้นฐานอื่น ๆ ที่จำเป็นในการสร้างแบบจำลองของฉันคือความสับสนเกี่ยวกับคำศัพท์และความแตกต่างที่แน่นอนระหว่างแบบจำลองกระบวนการที่ซ่อนอยู่ประเภทต่างๆ ฉันเพียง แต่ตระหนักถึงสิ่งที่แตกต่างอย่างชัดเจน (ตัวอย่างมา) ยิ่งกว่านั้นฉันคิดว่าอย่างน้อยจากสิ่งที่ฉันได้เห็นในวรรณคดีมีคำศัพท์ที่ไม่ได้มาตรฐานที่สร้างขึ้นจากการสร้างแบบจำลองนี้ ดังนั้นฉันหวังว่าผู้คนจะช่วยให้ฉันเข้าใจคำศัพท์บางส่วนให้ฉันได้ ฉันมีคำถามจำนวนหนึ่ง แต่ฉันเดาว่าเป็นหนึ่งหรือสองคนได้รับคำตอบที่น่าพอใจส่วนที่เหลือจะกลายเป็น disentangled ฉันหวังว่านี่จะไม่ยืดยาวเกินไป หากผู้ดำเนินรายการต้องการให้ฉันแยกส่วนนี้ออกเป็นหลายโพสต์ ไม่ว่าในกรณีใดฉันใส่คำถามตัวหนาแล้วตามด้วยรายละเอียดของคำถามที่ฉันค้นพบระหว่างการค้นหาวรรณกรรม ดังนั้นในลำดับที่ไม่มี: 1) "รูปแบบกระบวนการที่ซ่อนอยู่" คืออะไร? ฉันทำงานภายใต้ความประทับใจว่า "แบบจำลองกระบวนการซ่อนเร้น" เป็นคำศัพท์ในร่มที่สามารถใช้อธิบายแบบจำลองทางสถิติหลายประเภทคำอธิบายความน่าจะเป็นทั้งหมดของข้อมูลอนุกรมเวลาที่สร้างขึ้นโดย "ระบบการซ้อนทับกัน" อาจซ่อนกระบวนการเชิงเส้น "([1]) อันที่จริง [2] กำหนด "แบบจำลองกระบวนการซ่อนเร้น" เป็น "คำทั่วไปหมายถึงทั้งแบบพื้นที่รัฐหรือแบบจำลองมาร์คอฟที่ซ่อนอยู่" [1] ดูเหมือนจะอนุมานได้ว่าแบบจำลองของมาร์คอฟที่ซ่อนอยู่เป็นรูปแบบย่อยของแบบจำลองกระบวนการที่ซ่อนไว้ซึ่งมุ่งเน้นไปที่การอนุมานในสถานะไบนารี ความหมายพื้นฐานดูเหมือนว่าสำหรับฉันว่าโมเดลกระบวนการที่ซ่อนอยู่เป็นลักษณะทั่วไปของโมเดลมาร์คอฟที่ซ่อนอยู่ บางครั้งฉันเห็น "แบบจำลองกระบวนการที่ซ่อนอยู่" และวลี " สัญชาตญาณในส่วนของฉันนี้ถูกต้องหรือไม่? ถ้าไม่มีใครมีการอ้างอิงที่ชัดเจนกว่าวิธีการเหล่านี้หรือไม่ …

4
สัญชาตญาณที่อยู่เบื้องหลังความเป็นอิสระของ
ฉันหวังว่าจะมีคนเสนอข้อโต้แย้งว่าทำไมตัวแปรสุ่ม และ , มีการแจกแจงแบบปกติมาตรฐานมีความเป็นอิสระทางสถิติ การพิสูจน์ความจริงนั้นเกิดขึ้นได้อย่างง่ายดายจากเทคนิค MGF แต่ฉันพบว่ามันตอบโต้ได้ง่ายมากY1=X2−X1Y1=X2−X1Y_1=X_2-X_1Y2=X1+X2Y2=X1+X2Y_2=X_1+X_2XiXiX_i ฉันจะขอบคุณสัญชาตญาณที่นี่ถ้ามี ขอบคุณล่วงหน้า. แก้ไข : ห้อยไม่ได้ระบุสถิติการสั่งซื้อ แต่การสังเกต IID จากการกระจายปกติมาตรฐาน

9
คำขออ้างอิง: โมเดลเชิงเส้นทั่วไป
ฉันกำลังมองหาหนังสือระดับเบื้องต้นถึงระดับกลางเกี่ยวกับโมเดลเชิงเส้นทั่วไป นอกจากทฤษฎีแล้วฉันจะต้องการให้มันรวมแอพพลิเคชั่นและตัวอย่างใน R หรือภาษาการเขียนโปรแกรมอื่น - ฉันได้ยินว่า SAS เป็นตัวเลือกยอดนิยม ฉันตั้งใจจะศึกษาด้วยตัวเองและมันจะช่วยได้ถ้ามันให้คำตอบกับแบบฝึกหัดของตัวเอง คุณสามารถสมมติว่าฉันได้เรียนหลักสูตรปียาวแบบดั้งเดิมในแคลคูลัสและทฤษฎีความน่าจะเป็น ฉันคุ้นเคยกับพื้นฐานของการวิเคราะห์การถดถอย

3
จำนวนที่คาดว่าจะโยนจนกว่าจะถึงหัวครั้งแรกขึ้นมา
สมมติว่าเหรียญยุติธรรมถูกโยนซ้ำ ๆ จนกว่าจะได้รับหัวเป็นครั้งแรก จำนวนของการโยนที่คาดว่าจะต้องมีเท่าไหร่? จำนวนหางที่คาดหวังที่จะได้รับก่อนที่จะได้รับหัวแรกคืออะไร?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.