คำถามติดแท็ก time-series

อนุกรมเวลาเป็นข้อมูลที่สังเกตได้ตลอดเวลา

4
ฟังก์ชั่นการวิเคราะห์องค์ประกอบหลัก (FPCA): มันเกี่ยวกับอะไร?
ฟังก์ชั่นการวิเคราะห์องค์ประกอบหลัก (FPCA) เป็นสิ่งที่ฉันสะดุดและไม่เคยเข้าใจ มันเกี่ยวกับอะไร? ดูที่"การสำรวจการวิเคราะห์องค์ประกอบหลักของการทำงาน" โดย Shang, 2011และฉันอ้างถึง: PCA ประสบปัญหาร้ายแรงในการวิเคราะห์ข้อมูลการใช้งานเพราะ“ คำสาปของมิติ” (Bellman 1961) "การสาปแช่งของมิติ" มาจากข้อมูล sparsity ในพื้นที่มิติสูง แม้ว่าคุณสมบัติทางเรขาคณิตของ PCA จะยังคงใช้งานได้และแม้ว่าเทคนิคเชิงตัวเลขจะให้ผลลัพธ์ที่คงที่ แต่เมทริกซ์ความแปรปรวนร่วมตัวอย่างก็เป็นค่าประมาณที่ไม่ดีของเมทริกซ์ความแปรปรวนร่วมของประชากร เพื่อที่จะเอาชนะความยากลำบากนี้ FPCA ได้เตรียมวิธีที่ให้ข้อมูลในการตรวจสอบโครงสร้างความแปรปรวนร่วมตัวอย่างมากกว่า PCA [... ] ฉันแค่ไม่เข้าใจ บทความนี้อธิบายถึงข้อเสียเปรียบอะไร PCA ไม่ควรจะเป็นวิธีที่ดีที่สุดในการจัดการสถานการณ์เช่น "คำสาปแห่งมิติ"?

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
วิธีตีความแปลง acf และ pacf เหล่านี้
ต่อไปนี้เป็นพล็อต acf และ pacf ของชุดข้อมูลรายเดือน เนื้อเรื่องที่สองคือ acf with ci.type = 'ma': การคงอยู่ของค่าสูงในพล็อต acf อาจแสดงแนวโน้มเชิงบวกระยะยาว คำถามคือถ้าสิ่งนี้แสดงถึงความผันแปรตามฤดูกาลหรือไม่ ฉันพยายามดูไซต์ต่าง ๆ ในหัวข้อนี้ แต่ฉันไม่แน่ใจว่าแผนการเหล่านี้แสดงฤดูกาลหรือไม่ การวิเคราะห์พล็อต ACF และ PACF ช่วยตีความ ACF- และ PACF-plots ช่วยทำความเข้าใจภาพต่อไปนี้ของ ACF Autocorrelation และการตีความ autocorrelation บางส่วน แก้ไข: ต่อไปนี้เป็นกราฟสำหรับความล่าช้าสูงสุด 60: ต่อไปนี้เป็นแผนของ diff (my_series): และไม่เกิน 60: แก้ไข: ข้อมูลนี้มาจาก: นี่เป็นวิธีที่เหมาะสมในการทดสอบผลกระทบตามฤดูกาลในข้อมูลการนับการฆ่าตัวตายหรือไม่ ที่นี่ผู้ให้ข้อมูลไม่ได้พิจารณาพล็อต acf และ pacf ของซีรีย์ดั้งเดิมหรือต่างกันที่ควรค่าแก่การกล่าวถึง (ดังนั้นจะต้องไม่สำคัญ) …

2
การจำลองอนุกรมเวลาที่ให้กำลังและความหนาแน่นสเปกตรัมข้าม
ฉันมีปัญหาในการสร้างชุดของชุดสีเวลาคงที่ให้เมทริกซ์ความแปรปรวนร่วมของพวกเขา (ความหนาแน่นสเปกตรัมพลังงานของพวกเขา (PSDs) และความหนาแน่นสเปกตรัมข้ามอำนาจ (CSDs) ฉันรู้ว่าเมื่อได้รับอนุกรมเวลาสองชุดและฉันสามารถประเมินความหนาแน่นเชิงสเปกตรัมกำลัง (PSDs) และความหนาแน่นข้ามสเปกตรัม (CSDs) โดยใช้กิจวัตรที่มีอยู่มากมายเช่นและฟังก์ชั่นใน Matlab เป็นต้น PSDs และ CSD ประกอบขึ้นเป็นเมทริกซ์ความแปรปรวนร่วม: Yผม( t)Yผม(เสื้อ)y_{I}(t)YJ( t )YJ(เสื้อ)y_{J}(t)psd()csd()C ( f) = ( Pผมผม(ฉ)PJผม(ฉ)PผมJ(ฉ)PJJ(ฉ)),ค(ฉ)=(Pผมผม(ฉ)PผมJ(ฉ)PJผม(ฉ)PJJ(ฉ)), \mathbf{C}(f) = \left( \begin{array}{cc} P_{II}(f) & P_{IJ}(f)\\ P_{JI}(f) & P_{JJ}(f) \end{array} \right)\;, ซึ่งอยู่ในฟังก์ชั่นทั่วไปของความถี่ฉ ฉฉf จะเกิดอะไรขึ้นถ้าฉันต้องการย้อนกลับ รับเมทริกซ์ความแปรปรวนร่วมฉันจะสร้างการรับรู้ของและอย่างไรYผม( t )Yผม(เสื้อ)y_{I}(t)YJ( t )YJ(เสื้อ)y_{J}(t) โปรดรวมทฤษฎีพื้นหลังใด ๆ หรือชี้ให้เห็นเครื่องมือที่มีอยู่ใด ๆ ที่ทำสิ่งนี้ …

3
การทดสอบความสำคัญของยอดเขาในความหนาแน่นสเปกตรัม
บางครั้งเราใช้พล็อตความหนาแน่นสเปกตรัมเพื่อวิเคราะห์ช่วงเวลาในอนุกรมเวลา โดยปกติเราวิเคราะห์พล็อตโดยการตรวจสอบด้วยสายตาและจากนั้นพยายามวาดข้อสรุปเกี่ยวกับช่วงเวลา แต่นักสถิติได้ทำการพัฒนาการทดสอบเพื่อตรวจสอบว่าสไปค์ใด ๆ ในพล็อตนั้นแตกต่างจากเสียงสีขาวหรือไม่? ผู้เชี่ยวชาญด้าน R ได้พัฒนาแพ็คเกจใด ๆ สำหรับการวิเคราะห์ความหนาแน่นสเปกตรัมและสำหรับการทำแบบทดสอบนั้นหรือไม่? ดีมากถ้ามีคนช่วยได้ ขอแสดงความนับถือ, P.

2
การเลือกวิธีการสลายตัวตามฤดูกาล
การปรับตามฤดูกาลเป็นขั้นตอนสำคัญในการประมวลผลข้อมูลล่วงหน้าเพื่อการวิจัยเพิ่มเติม อย่างไรก็ตามนักวิจัยมีตัวเลือกมากมายสำหรับการแยกย่อยของแนวโน้มตามฤดูกาล ที่พบมากที่สุด (ตัดสินโดยจำนวนของการอ้างอิงในวรรณคดีเชิงประจักษ์) คู่แข่งวิธีการสลายตัวตามฤดูกาล X-11 (12) -ARIMA, TRAMO / ที่นั่ง (ทั้งการดำเนินการในDemetra + ) และ 's STL การค้นหาเพื่อหลีกเลี่ยงการสุ่มเลือกระหว่างเทคนิคการสลายตัวที่กล่าวถึงข้างต้น (หรือวิธีการง่าย ๆ เช่นตัวแปรตัวแปรตามฤดูกาล) ฉันต้องการทราบกลยุทธ์พื้นฐานที่นำไปสู่การเลือกวิธีการสลายตัวตามฤดูกาลได้อย่างมีประสิทธิภาพRRR คำถามย่อยที่สำคัญหลายอย่าง (ยินดีต้อนรับลิงก์ไปยังการสนทนาด้วย) อาจเป็น: อะไรคือความเหมือนและความแตกต่างจุดแข็งและจุดอ่อนของวิธีการคืออะไร? มีกรณีพิเศษหรือไม่เมื่อวิธีการหนึ่งเป็นที่นิยมมากกว่าวิธีอื่น? คุณสามารถให้คำแนะนำทั่วไปกับสิ่งที่อยู่ในกล่องดำของวิธีการสลายตัวที่แตกต่างกันได้อย่างไร มีเทคนิคพิเศษในการเลือกพารามิเตอร์สำหรับวิธีการ (ฉันไม่พอใจกับค่าเริ่มต้นเสมอstlตัวอย่างเช่นมีพารามิเตอร์จำนวนมากที่ต้องจัดการกับบางครั้งฉันรู้สึกว่าฉันไม่รู้วิธีเลือกสิ่งเหล่านี้อย่างถูกวิธี) เป็นไปได้หรือไม่ที่จะแนะนำเกณฑ์บางอย่าง (สถิติ) ว่าอนุกรมเวลาได้รับการปรับตามฤดูกาลอย่างมีประสิทธิภาพ (การวิเคราะห์ความสัมพันธ์, ความหนาแน่นของสเปกตรัมหรือไม่? เกณฑ์ขนาดตัวอย่างขนาดเล็ก - ความทนทาน?)

9
จำนวน lags ที่ต้องใช้ในการทดสอบ Ljung-Box ของอนุกรมเวลา
หลังจากแบบจำลอง ARMA เหมาะสมกับอนุกรมเวลาเป็นเรื่องปกติที่จะตรวจสอบสิ่งตกค้างผ่านการทดสอบกระเป๋าหิอง - กล่อง (รวมถึงการทดสอบอื่น ๆ ) การทดสอบ Ljung-Box ส่งคืนค่า ap มันมีพารามิเตอร์, h , ซึ่งเป็นจำนวนของความล่าช้าที่จะทดสอบ บางตำราแนะนำให้ใช้h = 20; คนอื่น ๆ แนะนำให้ใช้h = ln (n); ส่วนใหญ่ไม่ได้พูดในสิ่งที่เอชกับการใช้งาน แทนที่จะใช้ค่าเดียวสำหรับhสมมติว่าฉันทำการทดสอบ Ljung-Box สำหรับh <50 ทั้งหมดแล้วเลือกhซึ่งให้ค่า p ต่ำสุด วิธีการนี้เหมาะสมหรือไม่ ข้อดีและข้อเสียคืออะไร? (ข้อเสียอย่างหนึ่งที่เห็นได้ชัดคือเวลาในการคำนวณเพิ่มขึ้น แต่นั่นไม่ใช่ปัญหาที่นี่) มีวรรณกรรมเกี่ยวกับเรื่องนี้หรือไม่? อธิบายอย่างละเอียดเล็กน้อย .... ถ้าการทดสอบให้ p> 0.05 สำหรับทุกชั่วโมงชัดว่าอนุกรมเวลา (ส่วนที่เหลือ) ผ่านการทดสอบ คำถามของฉันเกี่ยวกับวิธีตีความการทดสอบถ้า p <0.05 สำหรับบางค่าของhและไม่ใช่สำหรับค่าอื่น …

2
จะตีความ PCA บนข้อมูลอนุกรมเวลาได้อย่างไร
ฉันกำลังพยายามที่จะเข้าใจการใช้ PCA ในบทความวารสารล่าสุดเรื่อง "การทำแผนที่สมองในระดับที่มีการประมวลผลแบบกลุ่ม" Freeman et al., 2014 (pdf ฟรีมีให้บริการบนเว็บไซต์แล็บ ) พวกเขาใช้ข้อมูลอนุกรมเวลา PCA และใช้น้ำหนัก PCA เพื่อสร้างแผนที่ของสมอง ข้อมูลนี้เป็นข้อมูลการถ่ายภาพแบบทดลองโดยเฉลี่ยเก็บไว้เป็นเมทริกซ์ (เรียกว่าในกระดาษ) โดยมี voxels (หรือตำแหน่งถ่ายภาพในสมอง)เวลาชี้ (ความยาวของเดี่ยว กระตุ้นให้สมอง) n× TY^Y^\hat {\mathbf Y}nnn×t^×t^\times \hat t พวกเขาใช้ SVD ส่งผลให้ (บ่งชี้ว่าการเคลื่อนย้ายของเมทริกซ์ )V⊤VY^=USV⊤Y^=USV⊤\hat {\mathbf Y} = \mathbf{USV}^\topV⊤V⊤\mathbf V^\topVV\mathbf V ผู้เขียนกล่าวว่า องค์ประกอบหลัก (คอลัมน์ของ ) เป็นเวกเตอร์ของความยาวและคะแนน (คอลัมน์ของ ) เป็นเวกเตอร์ของความยาว (จำนวน voxels) …

5
วิธีลดข้อมูลมิติสูงเพื่อการสร้างภาพข้อมูล
ฉันกำลังทำงานกับการจำลองทางกายภาพแบบ 2D และฉันกำลังรวบรวมข้อมูลในเวลาหลายจุด จุดที่ไม่ต่อเนื่องเหล่านี้มีลักษณะเป็นเส้นแนวตั้งโดยมีหลายเส้นในทิศทางตามแนวแกน ทำให้ชุดข้อมูลมีประสิทธิภาพ 4D ตัวอย่างเช่นสมมติว่าฉันมีคะแนนสะสมที่ (X, Y) พิกัดของ: (0,0), (1,0), (2,0) (0,1), (1,1), (2,1) (0,2), (1,2), (2,2) และในแต่ละจุดฉันกำลังรวบรวมโดยที่คือความดัน,คืออุณหภูมิ,เป็นองค์ประกอบ X และ Y ของความเร็ว ในการวนซ้ำของการจำลองแต่ละครั้งตัวแปรเหล่านี้จะถูกเก็บไว้สำหรับจุดรวบรวมทั้งหมด 9 จุด ดังนั้นข้อมูลของฉันทั้งหมดจะต่อเนื่องในเวลาที่แต่ละจุดแยกในอวกาศP T U , V{ P, T, U, โวลต์}{P,T,U,V}\{P,T,U,V\}PPPTTTยู, โวลต์U,VU,V ตัวอย่างเช่นข้อมูลสำหรับจุดเดียวจะมีลักษณะดังนี้: ฉันสนใจที่จะแสดง, พูด, กดดันทุกจุดตลอดเวลาเพื่อแสดงคลื่นแนวตั้งและแนวแกน ถ้าฉันทำสิ่งนี้ตามบรรทัดเดียว (ทั้งแนวตั้งหรือแนวแกน) ฉันสามารถใช้พล็อตน้ำตกกับแกน (Y, เวลา, ความกดดัน) แต่ถ้าฉันมีเส้นแนวตั้ง 3 เส้นและแนวแกน …

3
การตีความแบบจำลอง ARIMA
ฉันมีคำถามเกี่ยวกับแบบจำลอง ARIMA สมมติว่าฉันมีอนุกรมเวลาที่ฉันต้องการคาดการณ์และแบบจำลองดูเหมือนจะเป็นวิธีที่ดีในการทำแบบฝึกหัดการพยากรณ์ ตอนนี้รั้ง 's หมายความว่าชุดของฉันในวันนี้เป็นผลมาจากเหตุการณ์ที่เกิดขึ้นก่อน มันสมเหตุสมผลแล้ว แต่การตีความข้อผิดพลาดคืออะไร? สิ่งที่เหลือก่อนหน้าของฉัน (ฉันจะคำนวณได้อย่างไร) มีอิทธิพลต่อมูลค่าของซีรี่ส์ของฉันในวันนี้ ส่วนที่เหลือล้าหลังจะคำนวณได้อย่างไรในการถดถอยนี้เนื่องจากเป็นผลิตภัณฑ์ / ส่วนที่เหลือของการถดถอย ARIMA ( 2 , 2 ) Δ Y t = α 1 Δ Y t - 1 + α 2 Δ Y t - 2 + ν t + θ 1 ν t - 1 + …

1
การวิเคราะห์อนุกรมเวลาที่มีค่าเป็นศูนย์จำนวนมาก
ปัญหานี้เป็นจริงเกี่ยวกับการตรวจจับอัคคีภัย แต่ก็คล้ายกับปัญหาการตรวจจับการสลายตัวของกัมมันตภาพรังสี ปรากฏการณ์ที่ถูกสังเกตมีทั้งเป็นระยะและแปรผันสูง ดังนั้นอนุกรมเวลาจะประกอบด้วยสตริงยาวเป็นศูนย์ซึ่งถูกขัดจังหวะด้วยค่าตัวแปร วัตถุประสงค์ไม่ได้เป็นเพียงการรวบรวมเหตุการณ์ (แบ่งเป็นศูนย์) แต่เป็นการอธิบายลักษณะเชิงปริมาณของเหตุการณ์เอง อย่างไรก็ตามเซ็นเซอร์มีข้อ จำกัด และบางครั้งจะบันทึกเป็นศูนย์แม้ว่า "ความจริง" จะไม่เป็นศูนย์ ด้วยเหตุผลนี้จึงต้องรวมศูนย์เมื่อเปรียบเทียบเซ็นเซอร์ เซ็นเซอร์ B อาจมีความไวมากกว่าเซ็นเซอร์ A และฉันอยากจะอธิบายสถิติได้ สำหรับการวิเคราะห์นี้ฉันไม่มี "ความจริง" แต่ฉันมีเซนเซอร์ C ซึ่งเป็นอิสระจากเซ็นเซอร์ A&B ดังนั้นความคาดหวังของฉันคือข้อตกลงที่ดีกว่าระหว่าง A / B และ C บ่งชี้ถึงข้อตกลงที่ดีกว่ากับ "ความจริง" (นี่อาจดูสั่นคลอน แต่คุณจะต้องเชื่อใจฉัน - ฉันอยู่บนพื้นแข็งที่นี่ตามสิ่งที่เป็นที่รู้จักจากการศึกษาอื่น ๆ เกี่ยวกับเซ็นเซอร์) จากนั้นปัญหาคือวิธีหาปริมาณ "ข้อตกลงที่ดีกว่าของอนุกรมเวลา" ความสัมพันธ์เป็นตัวเลือกที่ชัดเจน แต่จะได้รับผลกระทบจากศูนย์ทั้งหมด (ซึ่งไม่สามารถละทิ้งได้) และแน่นอนได้รับผลกระทบอย่างไม่เป็นสัดส่วนจากค่าสูงสุด สามารถคำนวณ RMSE ได้เช่นกัน แต่จะถูกถ่วงน้ำหนักอย่างมากต่อพฤติกรรมของเซ็นเซอร์ในกรณีใกล้ศูนย์ คำถามที่ 1: …

3
วิธีใช้ DLM พร้อมตัวกรอง Kalman สำหรับการคาดการณ์
มีคนแนะนำฉันผ่านตัวอย่างเกี่ยวกับวิธีใช้ตัวกรอง DLM Kalman ใน R ในอนุกรมเวลา บอกว่าฉันมีค่าเหล่านี้ (ค่ารายไตรมาสที่มีฤดูกาลประจำปี); คุณจะใช้ DLM เพื่อทำนายค่าต่อไปอย่างไร และ BTW ฉันมีข้อมูลในอดีตเพียงพอหรือไม่ 89 2009Q1 82 2009Q2 89 2009Q3 131 2009Q4 97 2010Q1 94 2010Q2 101 2010Q3 151 2010Q4 100 2011Q1 ? 2011Q2 ฉันกำลังมองหาคำตอบแบบทีละขั้นตอนสำหรับวิธีทำทีละขั้นตอน ความแม่นยำในการทำนายไม่ใช่เป้าหมายหลักของฉันฉันแค่ต้องการเรียนรู้ลำดับของรหัสที่ให้ตัวเลขสำหรับไตรมาสที่ 2 ปี 2011 ถึงแม้ว่าฉันจะมีข้อมูลไม่เพียงพอ

4
โมเดลเชิงเส้นเรียบง่ายพร้อมข้อผิดพลาดที่เกี่ยวข้องอัตโนมัติใน R [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามดังนั้นจึงเป็นหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน8 เดือนที่ผ่านมา ฉันจะพอดีกับโมเดลเชิงเส้นที่มีข้อผิดพลาดอัตโนมัติที่สัมพันธ์กันใน R ได้อย่างไร ใน stata ฉันจะใช้praisคำสั่ง แต่ฉันไม่พบ R เทียบเท่า ...

1
วิธีตั้งค่าอาร์กิวเมนต์ xreg ใน auto.arima () ใน R [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามดังนั้นจึงเป็นหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน6 ปีที่ผ่านมา ฉันกำลังทำงานในโครงการขนาดเล็กที่มีอนุกรมเวลาหนึ่งซึ่งวัดข้อมูลการเยี่ยมชมลูกค้า (รายวัน) โควาเรียตของฉันเป็นตัวแปรต่อเนื่องDayในการวัดจำนวนวันที่ผ่านไปนับตั้งแต่วันแรกของการรวบรวมข้อมูลและตัวแปรจำลองบางอย่างเช่นวันนั้นเป็นวันคริสต์มาสหรือวันไหนของสัปดาห์เป็นต้น ส่วนหนึ่งของข้อมูลของฉันดูเหมือนว่า: Date Customer_Visit Weekday Christmas Day 11/28/11 2535 2 0 1 11/29/11 3292 3 0 2 11/30/11 4103 4 0 3 12/1/11 4541 5 0 4 12/2/11 6342 6 0 5 12/3/11 7205 7 0 6 12/4/11 3872 1 0 …

2
การปรับปรุงความน่าจะเป็นในการจำแนกประเภทในการถดถอยโลจิสติกตลอดเวลา
ฉันกำลังสร้างแบบจำลองการทำนายที่คาดการณ์ความน่าจะเป็นของความสำเร็จของนักเรียนเมื่อสิ้นสุดภาคการศึกษา ฉันสนใจเป็นพิเศษว่านักเรียนจะประสบความสำเร็จหรือล้มเหลวโดยที่ความสำเร็จมักจะถูกกำหนดให้เป็นการสำเร็จหลักสูตรและบรรลุคะแนน 70% หรือมากกว่านั้นจากคะแนนทั้งหมดที่เป็นไปได้ เมื่อฉันปรับใช้แบบจำลองการประมาณความน่าจะเป็นความสำเร็จจะต้องได้รับการอัปเดตตลอดเวลาเนื่องจากมีข้อมูลเพิ่มเติม - โดยทันทีหลังจากมีบางสิ่งเกิดขึ้นเช่นเมื่อนักเรียนส่งการบ้านหรือได้เกรดหนึ่ง การอัปเดตนี้ฟังดูคล้ายกับ Bayesian สำหรับฉัน แต่เมื่อฉันได้รับการฝึกอบรมด้านสถิติการศึกษาซึ่งอยู่นอกเขตความสะดวกสบายของฉัน ฉันได้ใช้การถดถอยโลจิสติก (จริง ๆ lasso) กับชุดข้อมูลในอดีตที่มีสแนปชอตตามสัปดาห์ ข้อมูลชุดนี้มีข้อสังเกตความสัมพันธ์ตั้งแต่นักเรียนแต่ละคนมีTe r m L e n gt h / 7TอีRม.Lอีnก.เสื้อชั่วโมง/7TermLength/7สังเกต; การสังเกตสำหรับนักเรียนหนึ่งคนนั้นมีความสัมพันธ์กัน ฉันไม่ได้เป็นแบบอย่างเฉพาะความสัมพันธ์ภายในการสังเกตรายสัปดาห์ของนักเรียนโดยเฉพาะ ฉันเชื่อว่าฉันเพียงแค่ต้องพิจารณาว่าในการตั้งค่ารองเนื่องจากข้อผิดพลาดมาตรฐานจะมีขนาดเล็กเกินไป ฉันคิดว่า - แต่ไม่แน่ใจในเรื่องนี้ - ปัญหาเดียวที่เกิดขึ้นจากการสังเกตที่สัมพันธ์กันคือฉันต้องระวังเมื่อฉันตรวจสอบความถูกต้องเพื่อให้การสังเกตแบบคลัสเตอร์เป็นส่วนหนึ่งของข้อมูลเพื่อที่ฉันจะไม่ได้รับ อัตราความผิดพลาดนอกตัวอย่างต่ำโดยไม่ได้ตั้งใจจากการคาดการณ์เกี่ยวกับบุคคลที่โมเดลได้เห็นแล้ว ฉันใช้แพ็คเกจ glmnet ของ Rเพื่อทำ lasso ด้วย model logistic เพื่อสร้างความน่าจะเป็นที่จะประสบความสำเร็จ / ล้มเหลวและเลือกตัวทำนายสำหรับหลักสูตรใดหลักสูตรหนึ่งโดยอัตโนมัติ ฉันใช้ตัวแปรสัปดาห์เป็นปัจจัยโต้ตอบกับตัวทำนายอื่น ๆ ทั้งหมด ฉันไม่คิดว่าสิ่งนี้แตกต่างกันโดยทั่วไปจากการประเมินแบบจำลองแต่ละสัปดาห์ยกเว้นว่าจะให้ความเห็นว่าอาจมีรูปแบบทั่วไปบางอย่างที่ถือตลอดระยะเวลาที่ปรับผ่านปัจจัยการปรับความเสี่ยงต่าง …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.