คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

3
การทดสอบทางสถิติที่ดีที่สุดสำหรับอนุกรมเวลาคืออะไร?
ฉันมีอนุกรมเวลาอย่างง่ายพร้อมจุดข้อมูล 5-10 จุดต่อชุดข้อมูลในช่วงเวลาปกติ ฉันสงสัยว่าอะไรเป็นวิธีที่ดีที่สุดในการพิจารณาว่าชุดข้อมูลสองชุดนั้นแตกต่างกันหรือไม่ ฉันควรลองทดสอบ t บนจุดข้อมูลแต่ละจุดหรือดูบริเวณใต้เส้นโค้งหรือมีตัวแบบหลายตัวแปรหลายตัวที่จะทำงานได้ดีขึ้นหรือไม่

2
วิธีใดที่สามารถใช้เพื่อกำหนดลำดับการรวมของอนุกรมเวลา
econometricians มักจะพูดคุยเกี่ยวกับซีรีส์ครั้งที่ถูกบูรณาการกับการสั่งซื้อ k ผม (k) kเป็นจำนวนต่ำสุดของความแตกต่างที่จำเป็นเพื่อให้ได้อนุกรมเวลาที่อยู่กับที่ วิธีการหรือการทดสอบทางสถิติใดที่สามารถใช้เพื่อกำหนดระดับความเชื่อมั่นลำดับของการรวมกลุ่มของเวลา

2
วิธีการกรอกข้อมูลที่ขาดหายไปในอนุกรมเวลา?
ฉันมีชุดข้อมูลมลพิษจำนวนมากที่ถูกบันทึกทุก ๆ 10 นาทีตลอดระยะเวลา 2 ปี แต่มีข้อมูลจำนวนมากในช่องว่าง ข้อมูลดูเหมือนจะเป็นไปตามฤดูกาลและมีความแปรปรวนขนาดใหญ่ในระหว่างวันเมื่อเปรียบเทียบกับคืนที่ค่าไม่เปลี่ยนแปลงมากนักและจุดข้อมูลลดลง ฉันได้พิจารณาแบบจำลองที่เหมาะกับชุดวันและเวลากลางคืนแยกต่างหาก (เนื่องจากมีความแตกต่างที่ชัดเจนระหว่างพวกเขา) และจากนั้นทำนายค่าของข้อมูลที่หายไปและเติมจุดเหล่านี้ ฉันสงสัยว่านี่เป็นวิธีที่เหมาะสมในการเข้าถึงปัญหานี้หรือไม่และหากมีความจำเป็นที่จะต้องเพิ่มการเปลี่ยนแปลงในท้องถิ่นลงในจุดที่คาดการณ์ไว้

2
ประมาณค่าสัมประสิทธิ์ ARMA ผ่านการตรวจ ACF และ PACF
คุณประเมินแบบจำลองการพยากรณ์ที่เหมาะสมสำหรับอนุกรมเวลาอย่างไรโดยการตรวจสอบด้วยตาเปล่าของแผนการแปลง ACF และ PACF ตัวไหน (เช่น ACF หรือ PACF) บอก AR หรือ MA (หรือพวกเขาทั้งสอง)? กราฟใดที่บอกส่วนของฤดูกาลและไม่ใช่ฤดูกาลสำหรับ ARIMA ตามฤดูกาล พิจารณาฟังก์ชั่น ACF และ PCF ที่แสดงด้านล่าง พวกเขามาจากบันทึกการเปลี่ยนชุดที่ได้รับการ differenced สองแตกต่างกันอย่างใดอย่างหนึ่งที่ง่ายและฤดูกาลหนึ่ง ( ข้อมูลเดิม , บันทึกข้อมูลเปลี่ยน ) คุณจะอธิบายลักษณะของซีรี่ส์อย่างไร แบบไหนที่เหมาะกับมันที่สุด?

2
ข้อกำหนดความคงที่ของการใช้การถดถอยกับข้อผิดพลาด ARIMA สำหรับการอนุมานคืออะไร?
ข้อกำหนดความคงที่ของการใช้การถดถอยกับข้อผิดพลาด ARIMA (การถดถอยแบบไดนามิก) สำหรับการอนุมานคืออะไร? โดยเฉพาะผมมีความไม่หยุดนิ่งตัวแปรผลอย่างต่อเนื่องที่ไม่หยุดนิ่งทำนายอย่างต่อเนื่องตัวแปรและชุดรักษาตัวแปรหุ่นx_bฉันต้องการทราบว่าการรักษานั้นมีความสัมพันธ์กับการเปลี่ยนแปลงของตัวแปรผลลัพธ์ที่มากกว่าข้อผิดพลาดสองมาตรฐานจากการเปลี่ยนแปลงศูนย์หรือไม่YYyxaxax_axขxขx_b ฉันไม่แน่ใจว่าฉันต้องการสร้างความแตกต่างให้กับซีรี่ส์เหล่านี้ก่อนดำเนินการถดถอยด้วยการทำโมเดลข้อผิดพลาด ARIMA หรือไม่ ในคำตอบของคำถามอื่นIrishStat กล่าวว่าwhile the original series exhibit non-stationarity this does not necessarily imply that differencing is needed in a causal model.จากนั้นเขาก็จะเพิ่ม เข้าไปunwarranted usage [of differencing] can create statistical/econometric nonsenseอีก SAS คู่มือการใช้งานที่แสดงให้เห็นว่ามันจะปรับรูปแบบการถดถอยพอดีกับข้อผิดพลาด ARIMA แบบไม่หยุดนิ่งโดยไม่ต้อง differencing ตราบใดที่เหลือจะไม่หยุดนิ่ง: โปรดทราบว่าข้อกำหนดของความคงที่จะมีผลกับชุดเสียง หากไม่มีตัวแปรอินพุตชุดการตอบกลับ (หลังจากแตกต่างและลบด้วยค่าเฉลี่ย) และชุดเสียงจะเหมือนกัน อย่างไรก็ตามหากมีอินพุตชุดเสียงเป็นส่วนที่เหลือหลังจากเอาเอฟเฟกต์ของอินพุตออก ไม่มีข้อกำหนดว่าชุดข้อมูลป้อนเข้าสู่โหมดนิ่ง หากอินพุตเป็นแบบไม่คงที่ชุดตอบสนองจะเป็นแบบไม่คงที่แม้ว่ากระบวนการสัญญาณรบกวนอาจหยุดนิ่ง เมื่อใช้ชุดอินพุตแบบไม่ต่อเนื่องคุณสามารถปรับตัวแปรอินพุตก่อนโดยไม่มีแบบจำลอง …

3
การใช้แพ็กเกจการคาดการณ์ R พร้อมค่าที่ขาดหายไปและ / หรืออนุกรมเวลาที่ผิดปกติ
ฉันประทับใจในforecastแพ็คเกจR เช่นเดียวกับzooแพ็คเกจสำหรับอนุกรมเวลาที่ผิดปกติและการแก้ไขค่าที่หายไป ใบสมัครของฉันอยู่ในพื้นที่ของการพยากรณ์การจราจร Call Center เพื่อให้ข้อมูลเกี่ยวกับวันหยุดสุดสัปดาห์เป็น (เกือบ) zooเสมอหายไปซึ่งสามารถจัดการได้เป็นอย่างดีโดย นอกจากนี้บางจุดที่ขาดหายไปอาจหายไปฉันแค่ใช้ R NAเพื่อจุดนั้น สิ่งที่เป็นทุกมายากลที่ดีของแพคเกจการคาดการณ์เช่นeta(), auto.arima()ฯลฯ ดูเหมือนจะคาดหวังธรรมดาtsวัตถุเช่น equispaced อนุกรมเวลาไม่ได้มีข้อมูลที่ขาดหายไป ฉันคิดว่าแอปพลิเคชันในโลกแห่งความเป็นจริงสำหรับซีรี่ย์เวลาที่เท่ากันเท่านั้นนั้นมีอยู่จริง แต่สำหรับความเห็นของฉันนั้นมี จำกัด ปัญหาของการต่อเนื่องไม่กี่NAค่าจะสามารถแก้ไขได้อย่างง่ายดายโดยใช้ใด ๆ ของฟังก์ชั่นการแก้ไขที่นำเสนอในเช่นเดียวกับzoo forecast::interpหลังจากนั้นฉันก็ทำการพยากรณ์ คำถามของฉัน: ไม่มีใครแนะนำวิธีแก้ปัญหาที่ดีกว่า? (คำถามหลักของฉัน)อย่างน้อยที่สุดในโดเมนแอปพลิเคชันของฉันการคาดคะเนปริมาณการใช้งานศูนย์บริการข้อมูล (และเท่าที่ฉันสามารถจินตนาการได้ว่าโดเมนปัญหาอื่น ๆ ส่วนใหญ่) อนุกรมเวลาไม่เท่ากัน อย่างน้อยเราก็มีรูปแบบ "วันทำการ" ที่เกิดขึ้นซ้ำ ๆ หรือบางอย่าง อะไรคือวิธีที่ดีที่สุดในการจัดการสิ่งนั้นและยังคงใช้เวทย์มนตร์เท่ห์ ๆ ของแพ็คเกจพยากรณ์? ฉันควรเพียงแค่ "บีบอัด" อนุกรมเวลาเพื่อเติมวันหยุดสุดสัปดาห์ทำการพยากรณ์แล้ว "ขยาย" ข้อมูลอีกครั้งเพื่อแทรกค่า NA ในวันหยุดสุดสัปดาห์อีกครั้งหรือไม่ (นั่นจะเป็นความอัปยศฉันคิดว่า?) มีแผนใดที่จะทำให้แพ็คเกจพยากรณ์ใช้งานได้กับแพคเกจอนุกรมเวลาที่ผิดปกติอย่างสวนสัตว์หรือ ถ้าใช่เมื่อใดและถ้าไม่ทำไมไม่ ฉันค่อนข้างใหม่ต่อการคาดการณ์ (และสถิติโดยทั่วไป) …

6
จะค้นหายอดเขา / หุบเขาในชุดข้อมูลได้อย่างไร?
นี่คือการทดลองของฉัน: ฉันใช้findPeaksฟังก์ชันในแพ็คเกจquantmod : ฉันต้องการตรวจหายอด "ท้องถิ่น" ภายในค่าเผื่อ 5 นั่นคือตำแหน่งแรกหลังจากที่อนุกรมเวลาลดลงจากยอดเขาท้องถิ่น 5: aa=100:1 bb=sin(aa/3) cc=aa*bb plot(cc, type="l") p=findPeaks(cc, 5) points(p, cc[p]) p ผลลัพธ์คือ [1] 3 22 41 ดูเหมือนว่าผิดเพราะฉันคาดว่าจะมี "ยอดเขา" มากกว่า 3 คน ... ความคิดใด ๆ
16 r  time-series 

3
การตรวจจับค่าผิดปกติที่แข็งแกร่งในไทม์ทางการเงิน
ฉันกำลังมองหาเทคนิคที่มีประสิทธิภาพในการลบค่าผิดพลาดและข้อผิดพลาด (ไม่ว่าจะเกิดอะไร) จากข้อมูลอนุกรมเวลาการเงิน (เช่น tickdata) ข้อมูลอนุกรมเวลาทางการเงินแบบ Tick-by-tick นั้นยุ่งมาก มันมีช่องว่างขนาดใหญ่ (เวลา) เมื่อการแลกเปลี่ยนถูกปิดและกระโดดอย่างมากเมื่อการแลกเปลี่ยนเปิดขึ้นอีกครั้ง เมื่อการแลกเปลี่ยนเปิดขึ้นปัจจัยทุกชนิดจะแนะนำการซื้อขายในระดับราคาที่ไม่ถูกต้อง (ไม่ได้เกิดขึ้น) และ / หรือไม่ได้เป็นตัวแทนของตลาด (ขัดขวางเนื่องจากการเสนอราคาที่ป้อนไม่ถูกต้องหรือขอราคาตัวอย่าง) บทความนี้โดย tickdata.com (PDF) ทำงานได้ดีในการสรุปปัญหา แต่เสนอวิธีแก้ไขปัญหาที่เป็นรูปธรรมเล็กน้อย เอกสารส่วนใหญ่ที่ฉันสามารถหาได้ทางออนไลน์ที่กล่าวถึงปัญหานี้ก็คือไม่ต้องสนใจ (ติ๊กถูกสันนิษฐานว่าถูกกรอง) หรือรวมการกรองไว้เป็นส่วนหนึ่งของรูปแบบการค้าขนาดใหญ่ซึ่งซ่อนขั้นตอนการกรองที่มีประโยชน์ มีใครตระหนักถึงการทำงานในเชิงลึกมากขึ้นในพื้นที่นี้หรือไม่? อัปเดต: คำถามนี้ดูเหมือนกับพื้นผิว แต่: ซีรี่ส์เวลาทางการเงินคือ (อย่างน้อยก็ที่ระดับเห็บ) ที่ไม่ใช่งวด เอฟเฟ็กต์เปิดเป็นปัญหาใหญ่เพราะคุณไม่สามารถใช้ข้อมูลของวันสุดท้ายเป็นการเริ่มต้นแม้ว่าคุณจะชอบจริงๆ (เพราะไม่เช่นนั้นคุณก็ไม่มีอะไร) เหตุการณ์ภายนอกอาจทำให้การเปิดตัวของวันใหม่แตกต่างกันอย่างมากทั้งในระดับที่แน่นอนและความผันผวนจากวันก่อนหน้า ความถี่ที่ผิดปกติอย่างมากของข้อมูลที่เข้ามา ใกล้เปิดและปิดของวันจำนวนดาต้าพอยน์ / วินาทีสามารถสูงกว่าค่าเฉลี่ย 10 ครั้งในระหว่างวัน คำถามอื่น ๆ ที่เกี่ยวข้องกับข้อมูลตัวอย่างเป็นประจำ "ค่าผิดปกติ" ในข้อมูลทางการเงินแสดงรูปแบบเฉพาะบางอย่างที่สามารถตรวจพบได้ด้วยเทคนิคเฉพาะที่ไม่สามารถใช้ได้ในโดเมนอื่นและฉันกำลังมองหาเทคนิคเฉพาะเหล่านั้น ในกรณีที่รุนแรงมากขึ้น (เช่นเกิดความผิดพลาดของแฟลช) ค่าผิดปกติอาจมีจำนวนมากกว่า 75% …

1
วิธีการเปรียบเทียบแบบใดที่จะใช้สำหรับโมเดล lmer: lsmeans หรือ glht
ฉันกำลังวิเคราะห์ชุดข้อมูลโดยใช้โมเดลเอฟเฟกต์ผสมกับเอฟเฟ็กต์คงที่หนึ่งรายการ (เงื่อนไข) และเอฟเฟกต์แบบสุ่มสองรายการ (ผู้เข้าร่วมเนื่องจากการออกแบบภายในและคู่ของเรื่อง) รูปแบบที่ถูกสร้างขึ้นด้วยแพคเกจ:lme4exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp) ต่อไปฉันทำการทดสอบอัตราส่วนความน่าจะเป็นของโมเดลนี้เทียบกับโมเดลโดยไม่มีผลกระทบคงที่ (เงื่อนไข) และมีความแตกต่างอย่างมีนัยสำคัญ ชุดข้อมูลของฉันมี 3 เงื่อนไขดังนั้นฉันจึงต้องการเปรียบเทียบหลายรายการ แต่ฉันไม่แน่ใจว่าจะใช้วิธีใด ฉันพบคำถามที่คล้ายกันจำนวนหนึ่งใน CrossValidated และฟอรัมอื่น ๆ แต่ฉันยังสับสนอยู่ จากสิ่งที่ฉันเห็นผู้คนแนะนำให้ใช้ 1.lsmeansแพคเกจ - lsmeans(exp.model,pairwise~condition)ซึ่งทำให้ผมส่งออกต่อไปนี้: condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts …

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

2
การคาดการณ์จากรุ่น BSTS (ใน R) ล้มเหลวอย่างสมบูรณ์
หลังจากอ่านโพสต์บล็อกนี้เกี่ยวกับแบบจำลองอนุกรมเวลาของ Bayesian ฉันต้องการดูการใช้สิ่งนี้ในบริบทของปัญหาที่ฉันเคยใช้ ARIMA สำหรับ ฉันมีข้อมูลบางส่วนที่มีส่วนประกอบตามฤดูกาลที่ทราบ (แต่มีเสียงดัง) มีองค์ประกอบประจำปีรายเดือนและรายสัปดาห์สำหรับเรื่องนี้และยังมีผลกระทบบางอย่างเนื่องจากวันพิเศษ (เช่นวันหยุดราชการหรือวันหยุดทางศาสนา) ฉันใช้bstsแพคเกจเพื่อใช้งานและเท่าที่ฉันสามารถบอกได้ว่าฉันไม่ได้ทำอะไรผิดพลาดถึงแม้ว่าส่วนประกอบและการคาดการณ์จะไม่ดูอย่างที่ฉันคาดไว้ ไม่ชัดเจนสำหรับฉันหากการนำไปใช้ของฉันผิดไม่สมบูรณ์หรือมีปัญหาอื่น ซีรี่ส์เต็มเวลามีลักษณะดังนี้: ฉันสามารถฝึกโมเดลในส่วนย่อยของข้อมูลและโมเดลโดยทั่วไปจะดูดีในแง่ของความพอดี (พล็อตต่ำกว่า) รหัสที่ฉันใช้ในการทำสิ่งนี้อยู่ที่นี่: library(bsts) predict_length = 90 training_cut_date <- '2015-05-01' test_cut_date <- as.Date(training_cut_date) + predict_length df = read.csv('input.tsv', sep ='\t') df$date <- as.Date(as.character(df$date),format="%Y-%m-%d") df_train = df[df$date < training_cut_date,] yts <- xts(log10(df_train$count), order.by=df_train$date) ss <- AddLocalLinearTrend(list(), yts) ss <- …
15 r  time-series  bayesian  mcmc  bsts 

1
การทำให้เป็นมาตรฐานสำหรับโมเดล ARIMA
ฉันตระหนักถึง LASSO, สันและชนิดยืดหยุ่นสุทธิของการทำให้เป็นระเบียบในแบบจำลองการถดถอยเชิงเส้น คำถาม: การประมาณแบบลงโทษนี้ (หรือคล้ายกัน) สามารถนำไปใช้กับแบบจำลอง ARIMA (ที่มีส่วน MA ที่ไม่ว่างเปล่า) ได้หรือไม่? pmaxpmaxp_{max}qmaxqmaxq_{max}p⩽pmaxp⩽pmaxp \leqslant p_{max}q⩽qmaxq⩽qmaxq \leqslant q_{max} คำถามเพิ่มเติมของฉันคือ: เราสามารถรวมคำทั้งหมดได้สูงสุด ( , ) แต่จะลงโทษขนาดของสัมประสิทธิ์ (อาจเป็นไปได้จนหมดศูนย์) มันสมเหตุสมผลไหมpmaxpmaxp_{max}qmaxqmaxq_{max} ถ้าเป็นเช่นนั้นมีการนำไปใช้ใน R หรือซอฟต์แวร์อื่น ๆ หรือไม่? ถ้าไม่ปัญหาคืออะไร โพสต์ที่เกี่ยวข้องบ้างที่สามารถพบได้ที่นี่

1
วิธีการคาดการณ์ในเชิงบวกอย่างเคร่งครัด?
ฉันทำงานในชุดเวลาที่มีค่าเป็นบวกอย่างเคร่งครัด การทำงานกับรุ่นต่างๆรวมถึง AR, MA, ARMA และอื่น ๆ ฉันไม่สามารถหาวิธีที่ง่ายในการบรรลุการคาดการณ์ในเชิงบวกอย่างเคร่งครัด ฉันใช้Rเพื่อทำการคาดการณ์ของฉันและสิ่งที่ฉันสามารถหาได้คือ forecast.hts {hts} ที่มีพารามิเตอร์เชิงบวกที่อธิบายไว้ที่นี่: พยากรณ์ชุดลำดับชั้นหรือเวลาที่จัดกลุ่มแพ็กเกจ hts ## S3 method for class 'gts': forecast((object, h, method = c("comb", "bu", "mo", "tdgsf", "tdgsa", "tdfp", "all"), fmethod = c("ets", "rw", "arima"), level, positive = FALSE, xreg = NULL, newxreg = NULL, ...)) positive If TRUE, …

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

2
การประเมิน ARIMA ด้วยมือ
ฉันพยายามที่จะเข้าใจวิธีการประมาณค่าพารามิเตอร์ในการสร้างแบบจำลอง ARIMA / Box Jenkins (BJ) น่าเสียดายที่ไม่มีหนังสือเล่มใดที่ฉันได้พบอธิบายขั้นตอนการประมาณค่าเช่นขั้นตอนการประมาณความน่าจะเป็นบันทึกโดยละเอียด ฉันพบเว็บไซต์ / สื่อการสอนที่มีประโยชน์มาก ต่อไปนี้เป็นสมการจากแหล่งอ้างอิงข้างต้น L L ( θ ) = - n2เข้าสู่ระบบ( 2 π) - n2เข้าสู่ระบบ( σ2) - ∑t = 1nอี2เสื้อ2 σ2LL(θ)=-n2เข้าสู่ระบบ⁡(2π)-n2เข้าสู่ระบบ⁡(σ2)-Σเสื้อ=1nอีเสื้อ22σ2 LL(\theta)=-\frac{n}{2}\log(2\pi) - \frac{n}{2}\log(\sigma^2) - \sum\limits_{t=1}^n\frac{e_t^2}{2\sigma^2} ฉันต้องการเรียนรู้การประมาณค่า ARIMA / BJ ด้วยการทำเอง ดังนั้นฉันจึงใช้เพื่อเขียนโค้ดเพื่อประมาณค่า ARMA ด้วยมือ ด้านล่างนี้คือสิ่งที่ผมทำในR ,RRRRRR ฉันจำลอง ARMA (1,1) เขียนสมการข้างต้นเป็นฟังก์ชัน ใช้ข้อมูลจำลองและฟังก์ชันเพิ่มประสิทธิภาพเพื่อประมาณค่าพารามิเตอร์ AR …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.