คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '

1
การติดตั้ง GLOM แบบทวินาม (glmer) กับตัวแปรตอบกลับที่เป็นสัดส่วนหรือเศษส่วน
ฉันหวังว่าใครบางคนสามารถช่วยในสิ่งที่ฉันคิดว่าเป็นคำถามที่ค่อนข้างง่ายและฉันคิดว่าฉันรู้คำตอบ แต่ไม่มีการยืนยันมันกลายเป็นสิ่งที่ฉันไม่แน่ใจ ฉันมีข้อมูลการนับเป็นตัวแปรตอบกลับและฉันต้องการวัดว่าตัวแปรนั้นเปลี่ยนแปลงไปอย่างไรด้วยการมีสัดส่วนของบางสิ่งบางอย่าง ในรายละเอียดเพิ่มเติมตัวแปรตอบสนองจะนับการมีอยู่ของสปีชีส์ของแมลงในหลาย ๆ ไซต์ดังนั้นตัวอย่างจะถูกสุ่มตัวอย่าง 10 ครั้งและสปีชีส์นี้อาจเกิดขึ้น 4 ครั้ง ฉันต้องการที่จะดูว่าสิ่งนี้มีความสัมพันธ์กับการปรากฏตัวตามสัดส่วนของกลุ่มพันธุ์พืชใน commmunity โดยรวมของพืชที่เว็บไซต์เหล่านี้ ซึ่งหมายความว่าข้อมูลของฉันมีลักษณะดังนี้ (นี่เป็นเพียงตัวอย่าง) Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence 1, 5, 10, 0.5 2, 3, 10, 0.3 3, 7, 9, 0.6 4, 0, 9, 0.1 ข้อมูลยังรวมถึงเอฟเฟกต์แบบสุ่มสำหรับตำแหน่ง ฉันคิดว่าสองวิธีหนึ่งจะเป็นแบบจำลองเชิงเส้น ( lmer) กับแมลงที่แปลงเป็นสัดส่วนเช่น lmer.model<-lmer(insectCount/NumberOfInsectSamples~ ProportionalPlantGroupPresence+(1|Location),data=Data) ครั้งที่สองจะเป็นแบบทวินาม GLMM ( glmer) เช่น glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~ …

3
วิธีจัดการกับคำเตือน“ ไม่เป็นจำนวนเต็ม” จากลบ binomial GLM อย่างไร
ฉันพยายามจำลองความเข้มเฉลี่ยของปรสิตที่มีผลต่อโฮสต์ใน R โดยใช้โมเดลทวินามลบ ฉันได้รับคำเตือน 50 คำขึ้นไปที่บอกว่า: In dpois(y, mu, log = TRUE) : non-integer x = 251.529000 ฉันจะจัดการกับสิ่งนี้ได้อย่างไร รหัสของฉันมีลักษณะเช่นนี้: mst.nb = glm.nb(Larvae+Nymphs+Adults~B.type+Month+Season, data=MI.df)

5
สถิติการทดสอบของเดอร์บินวัตสัน
ฉันใช้การทดสอบ DW กับโมเดลการถดถอยของฉันใน R และฉันได้สถิติการทดสอบ DW ที่ 1.78 และค่า p เท่ากับ 2.2e-16 = 0 นี่หมายความว่าไม่มีความสัมพันธ์อัตโนมัติระหว่างส่วนที่เหลือเพราะสถิติอยู่ใกล้กับ 2 ด้วยค่า p เล็ก ๆ หรือหมายความว่าแม้ว่าสถิติใกล้เคียงกับ 2 ค่า p มีค่าน้อยดังนั้นเราจึงปฏิเสธสมมติฐานว่างที่มีอยู่ ไม่มีความสัมพันธ์อัตโนมัติ?

3
ค่าสเกลในการวิเคราะห์ discriminant เชิงเส้น (LDA) สามารถนำมาใช้เพื่อพล็อตตัวแปรอธิบายบน discriminants เชิงเส้นได้หรือไม่
การใช้ biplot ของค่าที่ได้จากการวิเคราะห์องค์ประกอบหลักเป็นไปได้ที่จะสำรวจตัวแปรอธิบายที่ประกอบกันเป็นองค์ประกอบหลัก นี่เป็นไปได้ไหมกับการวิเคราะห์จำแนกเชิงเส้น? ตัวอย่างที่มีให้ใช้ข้อมูลคือ "ข้อมูล Iris Data ของ Edgar Anderson" ( http://en.wikipedia.org/wiki/Iris_flower_data_set ) นี่คือข้อมูลม่านตา : id SLength SWidth PLength PWidth species 1 5.1 3.5 1.4 .2 setosa 2 4.9 3.0 1.4 .2 setosa 3 4.7 3.2 1.3 .2 setosa 4 4.6 3.1 1.5 .2 setosa 5 5.0 3.6 1.4 …

2
วิธีสร้างแบบจำลองเดือนต่อเดือนผลกระทบในข้อมูลอนุกรมเวลารายวัน?
ฉันมีชุดข้อมูลรายวันสองชุด หนึ่งคือsign-upsและอื่น ๆterminationsของการสมัครสมาชิก ฉันต้องการทำนายหลังโดยใช้ข้อมูลที่มีอยู่ในตัวแปรทั้งสอง เมื่อมองดูกราฟของซีรี่ส์เหล่านี้เห็นได้ชัดว่าการเลิกจ้างมีความสัมพันธ์กับการลงชื่อสมัครเข้าใช้หลายรายการก่อนหน้านี้หลายเดือน นั่นคือการขัดขวางการลงชื่อสมัครใช้ในวันที่ 10 พฤษภาคมจะนำไปสู่การเพิ่มขึ้นของการยุติในวันที่ 10 มิถุนายน 10 กรกฎาคมและ 10 สิงหาคมเป็นต้นไปแม้ว่าผลจะหมดไป ฉันหวังว่าจะได้คำใบ้ว่าฉันควรใช้แบบจำลองรุ่นใดเพื่อแก้ปัญหาเฉพาะนี้ คำแนะนำใด ๆ ที่จะได้รับการชื่นชมมาก .. จนถึงตอนนี้ฉันกำลังคิดแบบจำลอง VAR แต่ฉันไม่แน่ใจว่าจะรวมเอฟเฟกต์รายเดือนอย่างไรให้ใช้คำสั่งล่าช้าสูงมากหรือเพิ่มองค์ประกอบตามฤดูกาลอย่างใด

3
การสร้างค่าสุ่มที่มีความสัมพันธ์อัตโนมัติใน R
เรากำลังพยายามสร้างค่าสุ่มที่มีความสัมพันธ์โดยอัตโนมัติซึ่งจะใช้เป็นชุดเวลา เราไม่มีข้อมูลที่เราอ้างถึงและเพียงต้องการสร้างเวกเตอร์ตั้งแต่เริ่มต้น ในอีกด้านหนึ่งเราต้องการกระบวนการสุ่มที่มีการแจกแจงและ SD ในอีกทางหนึ่งความสัมพันธ์อัตโนมัติที่มีอิทธิพลต่อกระบวนการสุ่มจะต้องมีการอธิบาย ค่าของเวกเตอร์นั้นมีความสัมพันธ์กันโดยอัตโนมัติพร้อมกับความแข็งแรงลดลงในช่วงเวลาต่าง ๆ เช่น lag1 มี 0.5, lag2 0.3, lag1 0.1 เป็นต้น ดังนั้นในที่สุดเวกเตอร์ควรมองสิ่งที่: 2, 4, 7, 11, 10, 8, 5, 4, 2, -1, 2, 5, 9, 12, 13, 10, 8, 4, 3, 1, -2, -5 และอื่น ๆ

1
ฟิชเชอร์ทดสอบใน R
สมมติว่าเรามีชุดข้อมูลต่อไปนี้: Men Women Dieting 10 30 Non-dieting 5 60 ถ้าฉันใช้การทดสอบที่แน่นอนของฟิชเชอร์ใน R ดังนั้นอะไรalternative = greater(หรือน้อยกว่า) หมายถึงอะไร ตัวอย่างเช่น: mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") ฉันจะได้รับและp-value = 0.01588 odds ratio = 3.943534นอกจากนี้เมื่อฉันพลิกแถวของตารางฉุกเฉินเช่นนี้ mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") แล้วฉันจะได้รับและp-value = 0.9967 odds ratio = 0.2535796แต่เมื่อผมทำงานตารางสองฉุกเฉินโดยไม่มีข้อโต้แย้งทางเลือก (เช่นfisher.test(mat)) p-value = 0.02063แล้วฉันจะได้รับ คุณช่วยอธิบายเหตุผลให้ฉันได้ไหม นอกจากนี้สมมติฐานว่างและสมมติฐานทางเลือกในกรณีข้างต้นคืออะไร? ฉันสามารถทำการทดสอบการประมงบนโต๊ะฉุกเฉินได้ไหม …

4
สิ่งที่ต้องทำในห้องอธิบายเวลา
หลังจากที่ได้ทำงานกับข้อมูลภาคตัดขวางมาจนถึงตอนนี้และเมื่อเร็ว ๆ นี้การสืบค้นดูสะดุดไปกับวรรณคดีอนุกรมเวลาเบื้องต้นฉันสงสัยว่าสิ่งใดที่ตัวแปรอธิบายบทบาทกำลังเล่นอยู่ในการวิเคราะห์อนุกรมเวลา ฉันต้องการอธิบายแนวโน้มแทนการยกเลิกแนวโน้ม ส่วนใหญ่ของสิ่งที่ฉันอ่านเป็นบทนำถือว่าซีรีส์เกิดจากกระบวนการสุ่ม ฉันอ่านเกี่ยวกับกระบวนการ AR (p) และ MA รวมถึงแบบจำลอง ARIMA ต้องการจัดการกับข้อมูลมากกว่ากระบวนการ autoregressive เท่านั้นที่ฉันพบ VAR / VECM และวิ่งตัวอย่างบางส่วน แต่ฉันก็ยังสงสัยว่ามีบางกรณีที่เกี่ยวข้องกับสิ่งที่ explanatories ทำในส่วนต่างๆ แรงจูงใจเบื้องหลังสิ่งนี้คือการสลายตัวของซีรี่ส์ของฉันแสดงให้เห็นว่าเทรนด์เป็นผู้สนับสนุนรายใหญ่ในขณะที่ส่วนที่เหลือและผลกระทบตามฤดูกาลแทบจะไม่มีบทบาท ฉันต้องการอธิบายแนวโน้มนี้ ฉันสามารถ / ควรถอยหลังซีรีส์ของฉันในซีรีย์ต่าง ๆ กันไหม? โดยสังหรณ์ใจฉันจะใช้ gls เนื่องจากความสัมพันธ์แบบอนุกรม (ฉันไม่แน่ใจเกี่ยวกับโครงสร้างคร) ฉันได้ยินเกี่ยวกับการถดถอยที่น่าเกรงขามและเข้าใจว่านี่เป็นข้อผิดพลาด แต่ฉันกำลังมองหาวิธีที่จะอธิบายแนวโน้ม สิ่งนี้ผิดปกติหรือผิดปกติหรือไม่? หรือฉันเพิ่งพลาดบทที่ถูกต้องจนถึงตอนนี้?

1
การตีความการสลายตัวของอนุกรมเวลาโดยใช้ TBATS จากแพ็คเกจพยากรณ์
ฉันต้องการที่จะแยกข้อมูลอนุกรมเวลาต่อไปนี้ออกเป็นฤดูกาลแนวโน้มและส่วนประกอบที่เหลือ ข้อมูลนี้เป็นข้อมูลการระบายความร้อนพลังงานทุกชั่วโมงจากอาคารพาณิชย์: TotalCoolingForDecompose.ts <- ts(TotalCoolingForDecompose, start=c(2012,3,18), freq=8765.81) plot(TotalCoolingForDecompose.ts) มีผลกระทบตามฤดูกาลรายวันและรายสัปดาห์ที่ชัดเจนดังนั้นจึงขึ้นอยู่กับคำแนะนำจาก: วิธีการสลายอนุกรมเวลาที่มีองค์ประกอบตามฤดูกาลหลายรายการ? ฉันใช้tbatsฟังก์ชั่นจากforecastแพ็คเกจ: TotalCooling.tbats <- tbats(TotalCoolingForDecompose.ts, seasonal.periods=c(24,168), use.trend=TRUE, use.parallel=TRUE) plot(TotalCooling.tbats) ซึ่งผลลัพธ์ใน: อะไรlevelและslopeส่วนประกอบของรุ่นนี้อธิบายอะไร ฉันจะได้รับtrendและremainderส่วนประกอบคล้ายกับกระดาษที่อ้างอิงโดยแพคเกจนี้ ( De Livera, Hyndman และ Snyder (JASA, 2011) )

4
ทำไมการทดสอบสมมติฐานเกี่ยวกับชุดข้อมูลที่ resampled ปฏิเสธค่า null บ่อยเกินไป?
tl; dr: เริ่มต้นด้วยชุดข้อมูลที่สร้างขึ้นภายใต้ null ฉัน resampled กรณีที่มีการเปลี่ยนและดำเนินการทดสอบสมมติฐานในแต่ละชุดข้อมูล resampled การทดสอบสมมติฐานเหล่านี้ปฏิเสธค่าว่างมากกว่า 5% ของเวลา ในด้านล่างการจำลองที่ง่ายมากฉันสร้างชุดข้อมูลด้วยและฉันพอดีกับ OLS แบบง่าย ๆ จากนั้นสำหรับแต่ละชุดข้อมูลฉันสร้างชุดข้อมูลใหม่ 1,000 ชุดโดยการสุ่มแถวใหม่ของชุดข้อมูลเดิมพร้อมการแทนที่ (อัลกอริทึมที่อธิบายไว้โดยเฉพาะในข้อความคลาสสิกของ Davison & Hinkley ว่าเหมาะสมสำหรับการถดถอยเชิงเส้น) สำหรับแต่ละอันฉันพอดีกับ OLS รุ่นเดียวกัน ในที่สุดประมาณ 16% ของการทดสอบสมมติฐานในตัวอย่าง bootstrap ปฏิเสธ nullในขณะที่เราควรได้รับ 5% (ตามที่เราทำในชุดข้อมูลดั้งเดิม)X∼N(0,1)⨿Y∼N(0,1)X∼N(0,1)⨿Y∼N(0,1)X \sim N(0,1) \amalg Y \sim N(0,1) ฉันสงสัยว่ามันมีบางอย่างเกี่ยวกับการสังเกตซ้ำ ๆ ทำให้เกิดความสัมพันธ์ที่สูงเกินจริงดังนั้นในการเปรียบเทียบฉันลองวิธีอื่นสองวิธีในรหัสด้านล่าง (แสดงความคิดเห็น) ในวิธีที่ 2 ฉันแก้ไขจากนั้นแทนที่ด้วยส่วนที่เหลือ resampled จากโมเดล OLS …

1
ทำไมฉันถึงได้รับการคาดการณ์ที่แตกต่างกันสำหรับการขยายพหุนามด้วยตนเองและการใช้ฟังก์ชั่น R `poly`
ทำไมฉันถึงได้รับการคาดการณ์ที่แตกต่างกันสำหรับการขยายพหุนามด้วยตนเองและการใช้polyฟังก์ชั่นR set.seed(0) x <- rnorm(10) y <- runif(10) plot(x,y,ylim=c(-0.5,1.5)) grid() # xp is a grid variable for ploting xp <- seq(-3,3,by=0.01) x_exp <- data.frame(f1=x,f2=x^2) fit <- lm(y~.-1,data=x_exp) xp_exp <- data.frame(f1=xp,f2=xp^2) yp <- predict(fit,xp_exp) lines(xp,yp) # using poly function fit2 <- lm(y~ poly(x,degree=2) -1) yp <- predict(fit2,data.frame(x=xp)) lines(xp,yp,col=2) ความพยายามของฉัน: ดูเหมือนว่าจะมีปัญหากับการสกัดกั้นเมื่อฉันพอดีกับรูปแบบที่มีการสกัดกั้นคือไม่มี-1ในรูปแบบformulaทั้งสองเส้นจะเหมือนกัน แต่ทำไมไม่มีการสกัดกั้นสองบรรทัดจึงแตกต่างกัน …

1
จะตรวจสอบข้ามกับ cv.glmnet (LASSO regression ใน R) ได้อย่างไร?
ฉันสงสัยว่าจะเข้าใกล้การฝึกอบรมและทดสอบแบบจำลอง LASSO โดยใช้ glmnet ใน R ได้อย่างไร โดยเฉพาะฉันสงสัยว่าจะทำอย่างไรหากขาดชุดข้อมูลการทดสอบภายนอกทำให้ฉันต้องใช้การตรวจสอบข้าม (หรือวิธีการอื่นที่คล้ายคลึงกัน) เพื่อทดสอบแบบจำลอง LASSO ของฉัน ให้ฉันทำลายสถานการณ์ของฉัน: ฉันมีชุดข้อมูลเพียงชุดเดียวเพื่อแจ้งและฝึกอบรมโมเดล glmnet ของฉัน ดังนั้นฉันจะต้องใช้การตรวจสอบข้ามเพื่อแยกข้อมูลของฉันเพื่อสร้างวิธีทดสอบโมเดลของฉัน ฉันกำลังใช้อยู่cv.glmnetซึ่งตามรายละเอียดแพ็คเกจ : ทำการตรวจสอบความถูกต้องข้ามของ k-fold สำหรับ glmnet, สร้างพล็อตและส่งกลับค่าสำหรับแลมบ์ดา การตรวจสอบข้ามถูกดำเนินการในcv.glmnetการเลือกแลมบ์ดาที่ดีที่สุดหรือเป็นวิธีการตรวจสอบข้ามโดยทั่วไปหรือไม่ กล่าวอีกนัยหนึ่งฉันยังต้องทำอีกขั้นตอนการตรวจสอบข้ามเพื่อ "ทดสอบ" โมเดลของฉันหรือไม่ ฉันทำงานกับข้อสันนิษฐานที่ว่า "ใช่แล้ว" ในกรณีนี้ฉันจะตรวจสอบcv.glmnetรุ่นของฉันได้อย่างไร ฉันต้องทำด้วยตนเองหรืออาจเป็นcaretฟังก์ชั่นที่มีประโยชน์สำหรับรุ่น glmnet หรือไม่? ฉันจะใช้ "ลูป" สองจุดศูนย์กลางของการตรวจสอบความถูกต้องไขว้หรือไม่ ... ฉันใช้ "ลูปด้านใน" ของ CV ผ่านcv.glmnetเพื่อกำหนดค่าแลมบ์ดาที่ดีที่สุดในแต่ละkเท่าของ "ลูปภายนอก" ของการประมวลผลการตรวจสอบความถูกต้องข้าม ? หากฉันทำการตรวจสอบความถูกต้องของcv.glmnetรูปแบบการตรวจสอบความถูกต้องไขว้ฉันจะแยกโมเดล "ดีที่สุด" (จากแลมบ์ดา "ที่ดีที่สุด") …

1
การจำลองผลลัพธ์สำหรับการถดถอยเชิงเส้น glmnet โดยใช้เครื่องมือเพิ่มประสิทธิภาพทั่วไป
ฐานะที่เป็นรัฐชื่อฉันพยายามที่จะทำซ้ำผลจากการ glmnet เชิงเส้นโดยใช้เพิ่มประสิทธิภาพ LBFGS lbfgsจากห้องสมุด เครื่องมือเพิ่มประสิทธิภาพนี้ช่วยให้เราสามารถเพิ่มคำศัพท์ปกติ L1 โดยไม่ต้องกังวลเกี่ยวกับความแตกต่างตราบใดที่ฟังก์ชันวัตถุประสงค์ของเรา (ไม่มีคำศัพท์ปกติของ L1) นั้นเป็นนูน ปัญหาการถดถอยเชิงเส้นแบบยืดหยุ่นสุทธิในกระดาษ glmnetนั้นได้รับโดย ที่X \ in \ mathbb {R} ^ {n \ times p}คือเมทริกซ์การออกแบบy \ in \ mathbb {R} ^ pเป็นเวกเตอร์ของการสังเกต\ alpha \ in [0,1]คือพารามิเตอร์เน็ตยืดหยุ่นและ\ lambda> 0คือพารามิเตอร์การทำให้เป็นมาตรฐาน โอเปอเรเตอร์\ Vert x \ Vert_pหมายถึงบรรทัดฐาน Lp ปกติminβ∈Rp12n∥β0+Xβ−y∥22+αλ∥β∥1+12(1−α)λ∥β∥22minβ∈Rp12n‖β0+Xβ−y‖22+αλ‖β‖1+12(1−α)λ‖β‖22\min_{\beta \in \mathbb{R}^p} \frac{1}{2n}\Vert \beta_0 + X\beta …

2
เปรียบเทียบนัยสำคัญทางสถิติของความแตกต่างระหว่างการถดถอยพหุนามทั้งสองใน R
ดังนั้นก่อนอื่นเลยฉันทำการค้นคว้าเกี่ยวกับฟอรัมนี้และฉันรู้ว่ามี คำถามที่คล้ายกันมากถูกถาม แต่พวกเขามักจะไม่ได้รับคำตอบที่ถูกต้องหรือบางครั้งคำตอบนั้นไม่ละเอียดพอที่จะเข้าใจ ดังนั้นเวลานี้คำถามของฉันคือฉันมีชุดข้อมูลสองชุดในแต่ละชุดฉันทำการถดถอยพหุนามดังนี้: Ratio<-(mydata2[,c(2)]) Time_in_days<-(mydata2[,c(1)]) fit3IRC <- lm( Ratio~(poly(Time_in_days,2)) ) พหุนามถดถอยพหุนามคือ: ค่าสัมประสิทธิ์คือ: > as.vector(coef(fit3CN)) [1] -0.9751726 -4.0876782 0.6860041 > as.vector(coef(fit3IRC)) [1] -1.1446297 -5.4449486 0.5883757 และตอนนี้ฉันอยากรู้ว่าถ้ามีวิธีใช้ฟังก์ชัน R เพื่อทำการทดสอบที่จะบอกฉันว่ามีนัยสำคัญทางสถิติหรือไม่ในความแตกต่างระหว่างการถดถอยพหุนามทั้งสองที่รู้ว่าช่วงเวลาที่เกี่ยวข้องของวันคือ [ 1,100] จากสิ่งที่ฉันเข้าใจฉันไม่สามารถใช้การทดสอบ anova โดยตรงเพราะค่ามาจากชุดข้อมูลที่แตกต่างกันสองชุดหรือ AIC ซึ่งใช้ในการเปรียบเทียบแบบจำลอง / ข้อมูลจริง ฉันพยายามทำตามคำแนะนำของ @Roland ในคำถามที่เกี่ยวข้อง แต่ฉันอาจเข้าใจผิดบางอย่างเมื่อดูผลลัพธ์ของฉัน: นี่คือสิ่งที่ฉันทำ: ฉันรวมทั้งชุดข้อมูลของฉันเป็นหนึ่ง fเป็นตัวแปรที่ @Roland พูดถึง ฉันใส่ 1s สำหรับเซตแรกและ 0s …

1
การพล็อตค่าที่คาดการณ์ไว้ในอนุกรมเวลา ARIMA ใน R
มีความเป็นไปได้มากกว่าหนึ่งความเข้าใจผิดที่ร้ายแรงในคำถามนี้ แต่มันไม่ได้หมายถึงการได้รับการคำนวณที่ถูกต้อง แต่เพื่อกระตุ้นการเรียนรู้ของอนุกรมเวลาที่มีความสำคัญในใจ ในการพยายามที่จะเข้าใจการประยุกต์ใช้อนุกรมเวลาดูเหมือนว่าการตัดแนวโน้มข้อมูลทำให้การคาดการณ์ค่าในอนาคตไม่น่าเชื่อถือ ตัวอย่างเช่นgtempอนุกรมเวลาจากastsaแพ็คเกจมีลักษณะดังนี้: แนวโน้มสูงขึ้นในทศวรรษที่ผ่านมาจะต้องมีการแยกตัวประกอบในเมื่อวางแผนการทำนายค่าในอนาคต อย่างไรก็ตามเพื่อประเมินความผันผวนของอนุกรมเวลาข้อมูลจำเป็นต้องถูกแปลงเป็นอนุกรมเวลาคงที่ ถ้าผมรูปแบบมันเป็นกระบวนการ ARIMA กับ differencing (ฉันเดานี้จะดำเนินการเพราะของกลาง1ในorder = c(-, 1, -)) เช่น: require(tseries); require(astsa) fit = arima(gtemp, order = c(4, 1, 1)) แล้วพยายามทำนายค่าในอนาคต ( ปี) ฉันคิดถึงองค์ประกอบแนวโน้มสูงขึ้น:505050 pred = predict(fit, n.ahead = 50) ts.plot(gtemp, pred$pred, lty = c(1,3), col=c(5,2)) โดยไม่จำเป็นต้องสัมผัสกับการเพิ่มประสิทธิภาพที่แท้จริงของพารามิเตอร์ ARIMA โดยเฉพาะ ฉันจะกู้คืนแนวโน้มขาขึ้นในส่วนที่คาดการณ์ของพล็อตได้อย่างไร ฉันสงสัยว่าจะมี "ซ่อน" ของ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.