คำถามติดแท็ก markov-process

กระบวนการสุ่มกับทรัพย์สินที่อนาคตเป็นอิสระจากเงื่อนไขที่กำหนดในปัจจุบัน

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

2
การประเมินกลุ่มของลูกโซ่มาร์คอฟอันดับหนึ่ง
ฉันจัดกลุ่มชุดข้อมูลของมาร์คอฟอันดับหนึ่งหลายพันกลุ่มเป็นกลุ่มประมาณ 10 กลุ่ม มีวิธีที่แนะนำบางอย่างที่ฉันสามารถประเมินกลุ่มเหล่านี้และค้นหารายการในกลุ่มที่ใช้ร่วมกันและสิ่งที่แตกต่างจากกลุ่มอื่น ๆ ? ดังนั้นฉันสามารถสร้างคำสั่งเช่น "กระบวนการในกลุ่ม A มักจะอยู่ในสถานะ Y เมื่อพวกเขาไปถึงที่นั่นซึ่งไม่เป็นความจริงสำหรับกระบวนการในกลุ่มอื่น ๆ " เมทริกซ์การเปลี่ยนแปลงของเชนมาร์คอฟนั้นใหญ่เกินกว่าที่จะ "มองและมอง" พวกมันค่อนข้างเบาบางหากสามารถช่วยได้ ความคิดของฉันคือการใช้เมทริกซ์การเปลี่ยนแปลงทั้งหมดในกลุ่มรวมพวกเขาและพล็อตมันเป็นความเข้มในภาพ (ในระดับจาก 0 ถึง 255) มีอะไรเป็น "มืออาชีพ" มากกว่านี้ที่ฉันควรลอง?

3
จำนวนที่คาดว่าจะโยนเหรียญเพื่อให้ N ติดต่อกันตามลำดับ M
สัมภาษณ์มี CodeSprint ที่สองของพวกเขาในเดือนมกราคมที่รวมคำถามด้านล่าง คำตอบแบบเป็นโปรแกรมจะโพสต์ แต่ไม่มีคำอธิบายทางสถิติ (คุณสามารถดูปัญหาดั้งเดิมและวิธีแก้ปัญหาที่โพสต์ได้โดยลงชื่อเข้าใช้เว็บไซต์ Interviewstreet ด้วยเครดิต Google จากนั้นไปที่ปัญหา Coin Tosses จากหน้านี้) โยนเหรียญ คุณมีเหรียญที่ไม่ฝักใฝ่ฝ่ายใดซึ่งคุณต้องการที่จะโยนต่อไปจนกว่าจะได้รับ N หัวติดต่อกัน คุณได้โยนเหรียญ M ครั้งและน่าประหลาดใจการโยนทั้งหมดทำให้เกิดหัว จำนวนที่ต้องการเพิ่มเติมของการโยนจนกว่าคุณจะได้รับ N หัวติดต่อกันคืออะไร? อินพุต: บรรทัดแรกมีจำนวนเคส T แต่ละบรรทัด T ถัดไปมีสองตัวเลข N และ M เอาต์พุต: บรรทัดเอาต์พุต T ที่มีคำตอบสำหรับกรณีทดสอบที่สอดคล้องกัน พิมพ์คำตอบที่ถูกปัดเศษเป็นทศนิยม 2 ตำแหน่ง ตัวอย่างอินพุต: 4 2 0 2 1 3 3 3 2 ตัวอย่างผลลัพธ์: …

3
โมเดล Markov ที่ซ่อนอยู่และอัลกอริทึมการเพิ่มความคาดหวังสูงสุด
ใครสามารถอธิบายได้ว่าแบบจำลองของมาร์คอฟที่ซ่อนอยู่เกี่ยวข้องกับการเพิ่มความคาดหวังสูงสุดได้อย่างไร ฉันได้ผ่านการเชื่อมโยงมากมาย แต่ไม่สามารถมาพร้อมกับมุมมองที่ชัดเจน ขอบคุณ!

2
ทฤษฎีการ จำกัด ศูนย์กลางสำหรับโซ่มาร์คอฟ
\newcommand{\E}{\mathbb{E}}\newcommand{\P}{\mathbb{P}}ทฤษฎีการ จำกัด ศูนย์กลาง (CLT) ระบุว่าสำหรับX1,X2, ...X1,X2,…X_1,X_2,\dotsอิสระและกระจายแบบเดียวกัน (iid) ด้วยE [Xผม] = 0E[Xi]=0\E[X_i]=0และvar(Xผม) &lt; ∞Var⁡(Xi)&lt;∞\operatorname{ Var} (X_i)<\inftyผลรวมจะรวมกับการแจกแจงแบบปกติเป็นn → ∞n→∞n\to\infty : Σi = 1nXผม→ N( 0 ,n--√) .∑i=1nXi→N(0,n). \sum_{i=1}^n X_i \to N\left(0, \sqrt{n}\right). สมมติว่าX1,X2, ...X1,X2,…X_1,X_2,\dotsเป็นโซ่มาร์คอฟสถานะ จำกัด ที่มีการแจกแจงแบบคงที่P∞P∞\P_\inftyด้วยความคาดหวังที่ 0 และความแปรปรวนที่มีขอบเขต มีการขยาย CLT อย่างง่ายสำหรับกรณีนี้หรือไม่ เอกสารที่ฉันได้พบใน CLT สำหรับ Markov Chains มักจะรักษากรณีทั่วไปมากขึ้น ฉันจะขอบคุณมากสำหรับตัวชี้ไปยังผลลัพธ์ทั่วไปที่เกี่ยวข้องและคำอธิบายเกี่ยวกับวิธีการใช้

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(&gt;|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
โมเดลของมาร์คอฟที่มีความน่าจะเป็นไปตามเงื่อนไข
ก่อนอื่นให้ฉันรับทราบล่วงหน้าว่าฉันไม่เชี่ยวชาญในด้านสถิติและคณิตศาสตร์อย่างที่ฉันต้องการ บางคนอาจบอกว่ามีความรู้เพียงพอที่จะเป็นอันตราย : DI ขออภัยถ้าฉันไม่ได้ใช้คำศัพท์อย่างถูกต้อง ฉันพยายามจำลองความน่าจะเป็นของระบบที่เปลี่ยนจากสถานะหนึ่งไปเป็นอีกสถานะหนึ่ง โมเดลมาร์คอฟแบบง่ายเป็นการเริ่มต้นที่ดี (ชุดของรัฐชุดของความน่าจะเป็นของรัฐเริ่มต้นชุดของความน่าจะเป็นในการเปลี่ยนแปลงระหว่างรัฐ) อย่างไรก็ตามระบบที่ฉันสร้างแบบจำลองนั้นซับซ้อนกว่านั้น ความน่าจะเป็นในการเปลี่ยนผ่านที่นำไปสู่สถานะ ณ เวลา T นั้นแน่นอนที่สุดขึ้นอยู่กับตัวแปรอื่นที่ไม่ใช่สถานะที่ T-1 ตัวอย่างเช่น S1 -&gt; S2 อาจมีความน่าจะเป็นการเปลี่ยนแปลง 40% เมื่อดวงอาทิตย์ส่องแสง แต่ความน่าจะเป็น S1 -&gt; S2 จะอยู่ที่ 80% เมื่อฝนตก ข้อมูลเพิ่มเติมจากคำถามของผู้แสดงความคิดเห็น: รัฐสามารถสังเกตได้ จะมีเพียง 5-10 รัฐเท่านั้น ขณะนี้มีผู้ร่วมทุนประมาณ 30 คนที่เราต้องการตรวจสอบแม้ว่าตัวแบบสุดท้ายจะมีน้อยกว่านี้อย่างแน่นอน โควาเรียตบางตัวต่อเนื่องและอื่น ๆ ไม่ต่อเนื่อง คำถามสามข้อ: ฉันจะรวมความน่าจะเป็นแบบเปลี่ยนแปลงเงื่อนไขเข้ากับโมเดลของฉันได้อย่างไร หรือมีมุมมองอื่นทั้งหมดที่ฉันควรแนวทางปัญหานี้? นอกจากนี้ฉันควรค้นหาคำหลัก / แนวคิดออนไลน์เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับเรื่องนี้อย่างไร ฉันใช้เว็บค้นหาสิ่งต่าง ๆ เช่น "โมเดลมาร์คอฟที่มีความเป็นไปได้ในการเปลี่ยนแปลงตามเงื่อนไข" …

2
การเรียนรู้การเสริมแรงในสภาพแวดล้อมที่ไม่หยุดนิ่ง [ปิด]
ปิด คำถามนี้จะต้องมีมากขึ้นมุ่งเน้น ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้มุ่งเน้นที่ปัญหาเดียวโดยแก้ไขโพสต์นี้ ปิดให้บริการใน22 วันที่ผ่านมา คำถามที่ 1: มีวิธีการทั่วไปหรือเป็นที่ยอมรับในการจัดการกับสภาพแวดล้อมที่ไม่อยู่นิ่งในการเรียนรู้การเสริมแรงโดยทั่วไปหรือไม่? Q2: ใน gridworld ของฉันฉันได้เปลี่ยนฟังก์ชั่นการให้รางวัลเมื่อมีการเยี่ยมชมรัฐ ทุก ๆ ตอนรางวัลจะรีเซ็ตเป็นสถานะเริ่มต้น ทั้งหมดที่ฉันต้องการให้ตัวแทนของฉันเรียนรู้คือ "อย่าย้อนกลับไปเว้นแต่คุณต้องการจริงๆ" อย่างไรก็ตามสิ่งนี้ทำให้สภาพแวดล้อมไม่อยู่กับที่ สามารถ / ควรรวมกฎง่ายๆนี้ไว้ในโมเดล MDP หรือไม่และอย่างไร Q-learning เป็นทางออกที่ดีที่สุดในการจัดการกับปัญหานี้หรือไม่? ข้อเสนอแนะหรือตัวอย่างที่มีอยู่? คำถามที่ 3: ฉันได้ดู Q-learning ด้วยการเล่นซ้ำประสบการณ์เป็นวิธีแก้ไขปัญหาเกี่ยวกับสภาพแวดล้อมที่ไม่หยุดนิ่งเนื่องจากมันสัมพันธ์กับการปรับปรุงที่ต่อเนื่อง นี่เป็นการใช้วิธีที่ถูกต้องหรือมากกว่านั้นเพื่อจัดการกับการเรียนรู้ข้อมูลที่มีประสิทธิภาพมากขึ้นหรือไม่ และฉันเห็นว่ามันใช้กับการประมาณค่าเท่านั้น ฉันไม่แน่ใจว่ามันเป็น overkill หรือเปล่าที่จะใช้มันสำหรับพื้นที่ที่แยกออกง่าย ๆ เช่น gridworld หรือมีเหตุผลอื่นสำหรับเรื่องนี้ โปรดตอบหรือแสดงความคิดเห็นแม้ว่าคุณจะไม่สามารถตอบคำถามทุกข้อได้

1
การคำนวณโอกาสในการบันทึกสำหรับ MLE ที่กำหนด (เชนมาร์คอฟ)
ขณะนี้ฉันทำงานร่วมกับมาร์คอฟเชนและคำนวณค่าความน่าจะเป็นสูงสุดโดยใช้ความน่าจะเป็นในการเปลี่ยนแปลงตามที่แนะนำโดยหลาย ๆ แหล่ง (เช่นจำนวนช่วงการเปลี่ยนภาพจาก a ถึง b หารด้วยจำนวนการเปลี่ยนภาพโดยรวมจาก a ไปยังโหนดอื่น ๆ ) ตอนนี้ฉันต้องการคำนวณความน่าจะเป็นของ MLE

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn &lt;- function(data, indices){ data &lt;- data[indices, ] mod &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out &lt;- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

4
ค่า Worm และ Apple ที่คาดหวัง
แอปเปิ้ลตั้งอยู่ที่จุดสุดยอดของเพนตากอนและหนอนตั้งอยู่สองจุดอยู่ห่างออกไปที่Cทุกวันหนอนจะคลานด้วยความน่าจะเป็นที่เท่ากันของหนึ่งในสองจุดยอดที่อยู่ติดกัน ดังนั้นหลังจากที่วันหนึ่งหนอนที่จุดสุดยอดหรือแต่ละคนมีความน่าจะเป็น1/2หลังจากสองวันหนอนอาจกลับมาที่อีกครั้งเนื่องจากไม่มีหน่วยความจำของตำแหน่งก่อนหน้า เมื่อถึงจุดสุดยอดมันจะหยุดรับประทานอาหารAAAABCDEABCDEABCDECCCBBBDDD1/21/21/2CCCAAA (a) จำนวนวันจนกระทั่งอาหารค่ำคืออะไร? (b) ให้ p เป็นความน่าจะเป็นที่จำนวนวันเป็นหรือมากกว่า ความไม่เท่าเทียมของมาร์คอฟพูดถึงอย่างไร100100100ppp สำหรับ (a) ให้เป็นตัวแปรสุ่มที่กำหนดโดยจำนวนวันจนกระทั่งอาหารเย็น ดังนั้นP (X = 0) = 0 \\ P (X = 1) = 0 \\ P (X = 2) = \ frac {1} {\ binom {5} {2}} \\ \ vdotsXXXP(X=0)=0P(X=1)=0P(X=2)=1(52)⋮P(X=0)=0P(X=1)=0P(X=2)=1(52)⋮ P(X = 0) = 0 \\ P(X=1) = …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.