คำถามติดแท็ก moments

ช่วงเวลาเป็นบทสรุปของคุณลักษณะของตัวแปรสุ่ม (เช่นที่ตั้งขนาด) ใช้สำหรับช่วงเวลาที่เป็นเศษส่วน

2
ฉันสามารถใช้ช่วงเวลาของการแจกแจงเพื่อเก็บตัวอย่างการกระจายได้หรือไม่
ฉันสังเกตเห็นในวิธีการเรียนรู้สถิติ / เครื่องการแจกแจงมักจะเป็นแบบเกาส์จากนั้นก็ใช้แบบเกาส์สำหรับการสุ่มตัวอย่าง พวกเขาเริ่มต้นโดยการคำนวณทั้งสองช่วงเวลาแรกของการจัดจำหน่ายและการใช้งานเหล่านั้นเพื่อประเมินμμ\muและ 2 จากนั้นพวกเขาสามารถสุ่มตัวอย่างจากเกาส์นนั้นได้σ2σ2\sigma^2 ดูเหมือนว่าสำหรับฉันในช่วงเวลาที่ฉันคำนวณมากขึ้นฉันควรจะประมาณตัวอย่างการกระจายตัวที่ดีกว่าที่ฉันต้องการ จะเกิดอะไรขึ้นถ้าฉันคำนวณ 3 ช่วงเวลา ... ฉันจะใช้สิ่งเหล่านั้นเพื่อสุ่มตัวอย่างจากการแจกแจงได้อย่างไร และนี่สามารถขยายไปสู่ช่วงเวลา N ได้หรือไม่?

2
ปรีชาสักครู่เกี่ยวกับความหมายของการแจกแจงหรือไม่?
ใครสามารถให้สัญชาตญาณว่าทำไมช่วงเวลาที่สูงขึ้นของการแจกแจงความน่าจะเป็นเช่นช่วงเวลาที่สามและสี่สอดคล้องกับความเบ้และความโด่งตามลำดับ? ทำไมค่าเบี่ยงเบนเกี่ยวกับค่าเฉลี่ยยกกำลังสามหรือสี่จึงแปลเป็นตัวชี้วัดความเบ้และความโด่ง มีวิธีที่เกี่ยวข้องกับสิ่งนี้กับอนุพันธ์อันดับสามหรือสี่ของฟังก์ชันหรือไม่?pXpXp_X พิจารณาคำจำกัดความของความเบ้และความโด่ง: Skewness(X)=E[(X−μX)3]/σ3,Kurtosis(X)=E[(X−μX)4]/σ4.Skewness(X)=E[(X−μX)3]/σ3,Kurtosis(X)=E[(X−μX)4]/σ4.\begin{matrix} \text{Skewness}(X) = \mathbb{E}[(X - \mu_{X})^3] / \sigma^3, \\[6pt] \text{Kurtosis}(X) = \mathbb{E}[(X - \mu_{X})^4] / \sigma^4. \\[6pt] \end{matrix} ในสมการเหล่านี้เราเพิ่มค่าปกติเป็นพลังงานและนำค่าที่คาดไว้ ไม่ชัดเจนสำหรับฉันว่าทำไมการเพิ่มตัวแปรสุ่มให้เป็นกำลังสี่ให้ "ความแหลม" หรือทำไมการเพิ่มตัวแปรสุ่มให้เป็นกำลังสามควรให้ "ความเบ้" ดูเหมือนว่ามหัศจรรย์และลึกลับ!(X−μ)/σ(X−μ)/σ(X-\mu)/\sigma

1
เหตุใดเลขคณิตจึงมีขนาดเล็กกว่าการแจกแจงจึงมีความหมายในการแจกแจงแบบล็อก - ปกติ
ดังนั้นฉันจึงมีการสร้างกระบวนการสุ่มเข้าสู่ระบบกระจายตามปกติตัวแปรสุ่มXนี่คือฟังก์ชันความหนาแน่นของความน่าจะเป็นที่สอดคล้องกัน:XXX ผมอยากประมาณการกระจายตัวของการแจกแจงแบบเดิมสักครู่, สมมุติว่าช่วงเวลาที่ 1: ค่าเฉลี่ยเลขคณิต ในการทำเช่นนั้นฉันวาด 100 ตัวแปรสุ่ม 10,000 ครั้งเพื่อให้ฉันสามารถคำนวณค่าเฉลี่ยเลขคณิตได้ 10,000 ค่า มีสองวิธีที่แตกต่างกันในการประมาณค่าเฉลี่ย (อย่างน้อยนั่นคือสิ่งที่ฉันเข้าใจ: ฉันอาจผิด): โดยการคำนวณทางคณิตศาสตร์อย่างชัดเจนหมายถึงวิธีปกติ: X¯= ∑i = 1ยังไม่มีข้อความXผมยังไม่มีข้อความ.X¯=∑i=1NXiN.\bar{X} = \sum_{i=1}^N \frac{X_i}{N}. หรือโดยการประมาณและจากการแจกแจงปกติพื้นฐาน:จากนั้นค่าเฉลี่ยเป็นμ μ = N Σฉัน= 1ล็อก( X ฉัน )σσ\sigmaμμ\muˉ X =exp(μ+1μ = ∑i = 1ยังไม่มีข้อความเข้าสู่ระบบ( Xผม)ยังไม่มีข้อความσ2= ∑i = 1ยังไม่มีข้อความ( บันทึก( Xผม) - μ )2ยังไม่มีข้อความμ=∑i=1Nlog⁡(Xi)Nσ2=∑i=1N(log⁡(Xi)−μ)2N\mu = \sum_{i=1}^N \frac{\log …

1
ทดสอบสองตัวอย่างอิสระเพื่อหาค่าความเอียงที่เท่ากันหรือไม่
การทดสอบใดที่มีให้สำหรับการทดสอบสองตัวอย่างอิสระสำหรับสมมติฐานว่างที่มาจากประชากรที่มีความเบ้เท่ากัน? มีการทดสอบแบบคลาสสิก 1 ตัวอย่างว่าค่าความลาดเอียงนั้นมีค่าคงที่หรือไม่ (การทดสอบเกี่ยวข้องกับช่วงเวลาตัวอย่างที่ 6!); มีการแปลแบบตรงไปตรงมาสำหรับการทดสอบ 2 ตัวอย่างหรือไม่? มีเทคนิคที่ไม่เกี่ยวข้องกับช่วงเวลาที่สูงมากของข้อมูลหรือไม่? (ฉันคาดหวังคำตอบของรูปแบบ 'bootstrap it': เป็นเทคนิคการบูตที่ทราบกันว่าเหมาะสมสำหรับปัญหานี้หรือไม่?)

1
ปรีชาสำหรับช่วงเวลาที่สูงขึ้นในสถิติวงกลม
ในสถิติแบบวงกลมค่าความคาดหวังของตัวแปรสุ่มมีค่าในวงกลมSหมายถึง m 1 ( Z ) = ∫ S z P Z ( θ ) d θ (ดูวิกิพีเดีย ) นี่เป็นคำจำกัดความที่เป็นธรรมชาติมากเช่นเดียวกับนิยามของความแปรปรวน V a r ( Z ) = 1 - | m 1 ( Z ) | . ดังนั้นเราไม่ต้องการช่วงเวลาที่สองเพื่อกำหนดความแปรปรวน!ZZZSSSm1(Z)=∫SzPZ(θ)dθm1(Z)=∫SzPZ(θ)dθ m_1(Z)=\int_S z P^Z(\theta)\textrm{d}\theta Var(Z)=1−|m1(Z)|.Var(Z)=1−|m1(Z)|. \mathrm{Var}(Z)=1-|m_1(Z)|. อย่างไรก็ตามเรากำหนดช่วงเวลาที่สูง ฉันยอมรับว่ามันดูเป็นธรรมชาติเหมือนกันตั้งแต่แรกเห็นและคล้ายกับนิยามในสถิติเชิงเส้น แต่ฉันก็ยังรู้สึกอึดอัดเล็กน้อยและมีสิ่งต่อไปนี้mn(Z)=∫SznPZ(θ)dθ.mn(Z)=∫SznPZ(θ)dθ. m_n(Z)=\int_S z^n P^Z(\theta)\textrm{d}\theta. คำถาม: …

5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


1
อสมการ Chebyshev ด้านเดียวสำหรับช่วงเวลาที่สูงขึ้น
มีอะนาล็อกในช่วงเวลาที่อสมการของ Chebyshev ที่สูงกว่าในกรณีด้านเดียวหรือไม่? ความไม่เท่าเทียมกันของ Chebyshev-Cantelli นั้นดูเหมือนจะทำงานเพื่อความแปรปรวนได้เท่านั้นในขณะที่ความไม่เท่าเทียมของ Chebyshevs นั้นสามารถสร้างขึ้นได้อย่างง่ายดายสำหรับเลขชี้กำลังทั้งหมด ไม่มีใครรู้ถึงความไม่เท่าเทียมด้านเดียวโดยใช้ช่วงเวลาที่สูงขึ้นหรือไม่?

5
เป็นไปได้ว่าตัวแปรสุ่มสองตัวจากตระกูลการแจกจ่ายเดียวกันมีความคาดหวังและความแปรปรวนเหมือนกัน แต่ช่วงเวลาที่สูงกว่าต่างกันหรือไม่
ฉันกำลังคิดถึงความหมายของครอบครัวในระดับตำแหน่ง ความเข้าใจของฉันคือสำหรับสมาชิกทุกคนในตระกูลมาตราส่วนตำแหน่งที่ตั้งที่มีพารามิเตอร์ตำแหน่งและมาตราส่วนจากนั้นการกระจายของไม่ขึ้นอยู่กับพารามิเตอร์ใด ๆ และมันก็เหมือนกันสำหรับทุกที่เป็นของตระกูลนั้นXXXaaabbbZ=(X- a ) / bZ=(X−a)/bZ =(X-a)/bXXX ดังนั้นคำถามของฉันคือคุณสามารถให้ตัวอย่างที่สุ่มสองตัวจากตระกูลการแจกจ่ายเดียวกันเป็นมาตรฐาน แต่ไม่ส่งผลให้ตัวแปรสุ่มที่มีการแจกแจงแบบเดียวกันได้หรือไม่ พูดว่าและมาจากตระกูลการแจกจ่ายเดียวกัน (โดยที่ครอบครัวฉันหมายถึงตัวอย่างเช่น Normal หรือ Gamma และอื่น ๆ .. ) กำหนด:XXXYYY Z1=X-μσZ1=X−μσZ_1 = \dfrac{X-\mu}{\sigma} Z2=Y-μσZ2=Y−μσZ_2 = \dfrac{Y-\mu}{\sigma} เรารู้ว่าทั้งสองและมีความคาดหวังเหมือนกันและแปรปรวน 1Z1Z1Z_1Z2Z2Z_2μZ= 0 , σ2Z= 1μZ=0,σZ2=1\mu_Z =0, \sigma^2_Z =1 แต่พวกเขาสามารถมีช่วงเวลาที่สูงขึ้นแตกต่างกันได้หรือไม่ ความพยายามของฉันที่จะตอบคำถามนี้คือถ้าการแจกแจงของและขึ้นอยู่กับพารามิเตอร์มากกว่า 2 ตัว และฉันกำลังคิดถึง general ทั่วไปที่มี 3 พารามิเตอร์XXXYYYt - s t ude n …

1
พิสูจน์ว่าถ้าช่วงเวลาที่สูงกว่ามีอยู่ช่วงเวลาที่ต่ำกว่าก็มีอยู่
rrrขณะ -th ของตัวแปรสุ่มXXXคือแน่นอนถ้า E(|Xr|)&lt;∞E(|Xr|)&lt;∞ \mathbb E(|X^r|)< \infty ฉันพยายามที่จะแสดงให้เห็นว่าสำหรับจำนวนเต็มบวกs&lt;rs&lt;rs<rแล้ว ช่วงเวลาsss -th E[|Xs|]E[|Xs|]\mathbb E[|X^s|]มีขอบเขต จำกัด

1
วิธีปรับให้พอดีกับ PDF โดยประมาณ (เช่น: การประเมินความหนาแน่น) โดยใช้ช่วงเวลา k (เชิงประจักษ์) ครั้งแรก
ฉันมีสถานการณ์ที่ฉันสามารถประมาณค่าช่วงเวลาแรกของชุดข้อมูลและต้องการใช้เพื่อสร้างการประมาณของฟังก์ชันความหนาแน่นkkk ฉันได้พบกับการกระจายของเพียร์สันแล้ว แต่ฉันรู้ว่ามันขึ้นอยู่กับช่วงเวลา 4 ช่วงแรกเท่านั้น ฉันยังเข้าใจว่าช่วงเวลาที่ จำกัด ใด ๆ นั้นไม่เพียงพอที่จะ "ตรึง" การแจกแจงเฉพาะเมื่อไม่ใช้สมมติฐานเพิ่มเติม อย่างไรก็ตามฉันยังต้องการการแจกแจงระดับทั่วไปเพิ่มเติม (นอกเหนือจากการแจกแจงแบบครอบครัวของเพียร์สัน) มองไปที่คำถามอื่น ๆ ที่ฉันไม่สามารถหาเช่นการกระจาย (ดู: ที่นี่ , ที่นี่ , ที่นี่ , ที่นี่ , ที่นี่และที่นี่ ) มีการกระจายทั่วไป ("ง่าย") ครอบครัวที่สามารถกำหนดสำหรับช่วงเวลาใด ๆ ? (อาจเป็นชุดของการแปลงที่สามารถทำการแจกแจงแบบปกติมาตรฐานและแปลงมันจนกว่ามันจะยืนยันกับทุกช่วงเวลา )kkkkkk (ฉันไม่สนใจมากถ้าเราถือว่าช่วงเวลาอื่นเป็น 0 หรือไม่)k + 1 … ∞k+1...∞k+1\ldots\infty ขอบคุณ PS: ฉันจะมีความสุขสำหรับตัวอย่างเพิ่มเติม ควรมีตัวอย่างรหัส R เป็นพิเศษ

1
การประเมินความแข็งแรงของความแข็งแรง?
ฉันกำลังใช้ตัวประมาณปกติสำหรับ kurtosisแต่ฉันสังเกตเห็นว่าแม้แต่ 'ค่าผิดปกติ' ในการแจกแจงเชิงประจักษ์ของฉัน เช่นยอดเขาเล็ก ๆ ห่างจากศูนย์กลางส่งผลกระทบอย่างมาก มีตัวประมาณค่าความโด่งซึ่งมีความทนทานกว่านี้หรือไม่?K^= μ^4σ^4K^=μ^4σ^4\hat{K}=\frac{\hat{\mu}_4}{\hat{\sigma}^4}

3
ประมาณ
เป็นวิธีที่ดีที่สุดที่จะใกล้เคียงกับสำหรับจำนวนเต็มสองจำนวนที่กำหนดเมื่อคุณรู้ว่าหมายถึงแปรปรวนเบ้และโด่งเกินของการกระจายต่อเนื่องและเป็นที่ชัดเจนจากการวัดรูปร่างและ (ไม่ใช่ศูนย์) ที่การประมาณปกติไม่เหมาะสมหรือไม่ม. , n μ σ 2 γ 1 γ 2 X γ 1 γ 2Pr[n≤X≤m]Pr[n≤X≤m]Pr[n \leq X \leq m]m,nm,nm,nμμ\muσ2σ2\sigma^2γ1γ1\gamma_1γ2γ2\gamma_2XXXγ1γ1\gamma_1γ2γ2\gamma_2 ปกติฉันจะใช้การประมาณค่าปกติกับการแก้ไขจำนวนเต็ม ... Pr[(n−½)≤X≤(m+½)]=Pr[(n−½)−μσ≤Z≤(m+½)−μσ]=Φ((m+½)−μσ)−Φ((n−½)−μσ)Pr[(n−½)≤X≤(m+½)]=Pr[(n−½)−μσ≤Z≤(m+½)−μσ]=Φ((m+½)−μσ)−Φ((n−½)−μσ)Pr[(n - \text{½})\leq X \leq (m + \text{½})] = Pr[\frac{(n - \text{½})-\mu}{\sigma}\leq Z \leq \frac{(m + \text{½})-\mu}{\sigma}] = \Phi(\frac{(m + \text{½})-\mu}{\sigma}) - \Phi(\frac{(n - \text{½})-\mu}{\sigma}) ... ถ้าความเบ้และความโด่งเกินเป็น …

3
การแปรรูปเปลี่ยนความเบ้โดยไม่กระทบต่อ kurtosis?
ฉันอยากรู้อยากเห็นหากมีการเปลี่ยนแปลงที่เปลี่ยนแปลงความลาดเอียงของตัวแปรสุ่มโดยไม่ส่งผลกระทบต่อ kurtosis นี่จะคล้ายกับวิธีการแปลงเลียนแบบของ RV ส่งผลต่อค่าเฉลี่ยและความแปรปรวน แต่ไม่ใช่ความเบ้และความโด่ง (ส่วนหนึ่งเป็นเพราะความเบ้และความโด่งนั้นถูกกำหนดให้เปลี่ยนแปลงอย่างต่อเนื่อง) นี่เป็นปัญหาที่ทราบหรือไม่?

1
การรวมเมทริกซ์ความแปรปรวนร่วมสองแบบ
ฉันคำนวณความแปรปรวนร่วมของการแจกแจงแบบขนานและฉันต้องรวมผลลัพธ์ที่กระจายเข้าด้วยกันบน Gaussian เอกพจน์ ฉันจะรวมสองวิธีเข้าด้วยกันได้อย่างไร การสอดแทรกเชิงเส้นตรงระหว่างสองอย่างนี้เกือบจะได้ผลถ้ามันมีการกระจายและขนาดใกล้เคียงกัน Wikipediaมีฟอรัมอยู่ที่ด้านล่างสำหรับชุดค่าผสม แต่ดูเหมือนจะไม่ถูกต้อง การแจกแจงแบบกระจายสองตัวที่เหมือนกันควรมีความแปรปรวนร่วมเดียวกัน แต่สูตรที่ด้านล่างของหน้าเพิ่มความแปรปรวนร่วมสองเท่า มีวิธีการรวมสองเมทริกซ์หรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.