Auto.arima กับ autobox แตกต่างกันอย่างไร


16

จากการอ่านโพสต์ในเว็บไซต์นี้ฉันรู้ว่ามีฟังก์ชั่น R auto.arima(ในforecast แพ็คเกจ ) ผมยังไม่ทราบว่าIrishStatเป็นสมาชิกของเว็บไซต์นี้สร้างแพคเกจในเชิงพาณิชย์Autoboxในต้นทศวรรษ 1980 เนื่องจากแพ็คเกจเหล่านี้มีอยู่ในปัจจุบันและเลือกตัวแบบ arima สำหรับชุดข้อมูลที่กำหนดโดยอัตโนมัติ พวกเขาอาจจะสร้างแบบจำลองที่แตกต่างกันสำหรับชุดข้อมูลเดียวกันได้หรือไม่


ขอบคุณสำหรับการแก้ไข @Wayne ฉันไม่คุ้นเคยกับแพ็คเกจการคาดการณ์ R แต่ฉันแน่ใจว่านั่นคือสิ่งที่ฉันหมายถึงการเปรียบเทียบกับออโต้บ็อกซ์
Michael R. Chernick

(ฉันเพิ่งทำการเปลี่ยนแปลงเล็กน้อยของ "auto-arima" เป็น "auto.arima") อาจมีauto.arimaฟังก์ชั่นอื่น ๆ ที่นั่นในแพ็คเกจอื่น ๆ แต่มีหนึ่งในนั้นแน่นอนมีหนึ่งในforecastซึ่งคำอธิบายคือ: "ส่งคืนโมเดล ARIMA ที่ดีที่สุดตาม เป็นค่า AIC, AICc หรือ BIC ฟังก์ชั่นจะทำการค้นหาโมเดลที่เป็นไปได้ภายในข้อ จำกัด การสั่งซื้อที่มีให้ "
Wayne

1
AUTOBOX ปฏิบัติต่อการระบุอัตโนมัติในลักษณะองค์รวมด้วยการทำซ้ำแม้ว่าการระบุอัตโนมัติโดยการประมาณค่าจริงจากนั้นทำขั้นตอนการวิเคราะห์ขั้นตอนและขั้นตอนการวินิจฉัยเพื่อแสดงแบบจำลองที่มีพารามิเตอร์ที่สำคัญทางสถิติเท่านั้นในขณะที่กระบวนการผิดพลาด . ด้วยวิธีนี้ตามสคริปต์ของการทำซ้ำ รุ่นแรก ๆ ของ AUTOBOX ประมาณปี 1975 พยายามใช้ "หนึ่งวิธีการทางสถิติ" แต่พบว่าต้องการรุ่นที่ระบุว่ามีโครงสร้างซ้ำซ้อนหรือโครงสร้างที่โง่ (ตัวอย่างเช่น 5,1,2) หรือโครงสร้างไม่เพียงพอที่เห็นได้ชัด
IrishStat

1
@IriishStat ฟังดูเหมือนเป็นวิธีที่ดี คุณจะทำอย่างไรถ้าคุณพบสองนางแบบคู่แข่งที่ตอบสนองความต้องการของคุณ ดูเหมือนว่าเป็นไปได้ คุณแนะนำรุ่น "ดีที่สุด" ตามเกณฑ์ที่ระบุหรือไม่ ฉันตระหนักถึงการเลือกรูปแบบที่มี "พารามิเตอร์ที่สำคัญทางสถิติ" เท่านั้นที่มีแนวโน้มว่าจะสนับสนุน parsimony แต่ไม่สามารถมีกระบวนการ AR พารามิเตอร์ต่ำและอีกรุ่น AEMA ที่มีลำดับต่ำที่พารามิเตอร์ทั้งหมดมีนัยสำคัญทางสถิติและส่วนที่เหลือมีสีขาว เสียง?
Michael R. Chernick

1
@IriehStat ฉันเห็นด้วยกับคุณ. ในที่สุดสิ่งที่คุณทำเพื่อผู้ใช้ คุณมีรูปแบบเดียวหรือคุณอาจให้รายชื่อเรียงลำดับของแบบจำลองที่ยอมรับได้หรือไม่ ถ้าไม่ใช่อย่างหลังอาจเป็นตัวเลือกที่ดีในการเพิ่มที่คุณ จำกัด รายการไว้ในจำนวนน้อย
Michael R. Chernick

คำตอบ:


9

ไมเคิล / เวย์น

AUTOBOX จะส่งมอบ / ระบุรุ่นที่แตกต่างกันอย่างแน่นอนหากมีคุณสมบัติตรงตามเงื่อนไขต่อไปนี้

1) มีพัลส์ในข้อมูล

2) มีการเปลี่ยนแปลงข้อมูลอย่างน้อย 1 ระดับ

3) หากมีข้อมูลการเต้นของชีพจรตามฤดูกาล

4) มีแนวโน้มเวลาท้องถิ่น 1 ข้อมูลขึ้นไปในข้อมูลที่ไม่ได้แก้ไขเพียงอย่างเดียว

5) ถ้าพารามิเตอร์ของโมเดลเปลี่ยนแปลงตลอดเวลา

6) หากความแปรปรวนของข้อผิดพลาดเปลี่ยนแปลงตลอดเวลาและไม่มีการแปลงพลังงานเพียงพอ

ในแง่ของตัวอย่างที่เฉพาะเจาะจงฉันขอแนะนำให้คุณทั้งคู่เลือก / สร้างอนุกรมเวลาและโพสต์ทั้งคู่ลงในเว็บ ฉันจะใช้ AUTOBOX เพื่อวิเคราะห์ข้อมูลในโหมดอัตโนมัติและฉันจะโพสต์โมเดลลงในรายการ จากนั้นคุณรันโปรแกรม R จากนั้นแต่ละคนทำการวิเคราะห์วัตถุประสงค์แยกกันของผลลัพธ์ทั้งสองอย่างโดยชี้ให้เห็นความเหมือนและความแตกต่าง ส่งแบบจำลองทั้งสองสมบูรณ์พร้อมเนื้อหาสนับสนุนที่มีทั้งหมดรวมถึงข้อกำหนดข้อผิดพลาดขั้นสุดท้ายให้ฉันสำหรับความคิดเห็นของฉัน สรุปและนำเสนอผลลัพธ์เหล่านี้ไปยังรายการแล้วขอให้ผู้อ่านรายการไปยัง VOTE สำหรับขั้นตอนที่เหมาะสมที่สุดสำหรับพวกเขา


คุณหมายถึงการแข่งขันแบบนี้หรือไม่?
whuber

@whuber ใช่ บางทีแม้แต่ใช้ "ตัวอย่างหนังสือตำราเรียนที่ไม่รู้จัก / ใช้รหัส" ซึ่งสามารถใช้เป็นฉากหลังได้
IrishStat

22

พวกเขาเป็นตัวแทนของวิธีการที่แตกต่างกันสองปัญหาที่คล้ายกัน ผมเขียนauto.arimaและ @IrishStat Autoboxเป็นผู้เขียน

auto.arima()เหมาะกับ (ตามฤดูกาล) โมเดลของ ARIMA รวมถึงเงื่อนไขการดริฟท์ Autoboxเหมาะกับฟังก์ชั่นถ่ายโอนรุ่นเพื่อจัดการระดับกะและค่าผิดปกติ ARIMA model เป็นกรณีพิเศษของรูปแบบฟังก์ชั่นการถ่ายโอน

แม้ว่าคุณจะปิดการเลื่อนระดับและการตรวจจับนอกAutoboxคุณจะได้รับแบบจำลอง ARIMA ที่แตกต่างจากauto.arima()ตัวเลือกที่แตกต่างกันในวิธีการระบุพารามิเตอร์ ARIMA

ในการทดสอบข้อมูลการแข่งขัน M3 และ M ของฉันauto.arima()สร้างการคาดการณ์ที่แม่นยำกว่าAutoboxข้อมูลเหล่านี้ อย่างไรก็ตามAutoboxจะทำได้ดีกว่าด้วยข้อมูลที่มีค่าผิดปกติและการเลื่อนระดับ


3
ฉันเชื่อว่าคุณกำลังอ้างถึง AUTOBOX รุ่นจากหลายปีที่ผ่านมา AUTOBOX มีการเปลี่ยนแปลงอย่างมีนัยสำคัญโอ้หลายปีนี้ ถ้าฉันไม่ผิดคุณเพียงเปรียบเทียบความถูกต้องจากแหล่งกำเนิด 1 แห่งซึ่งฉันมั่นใจว่าคุณจะเห็นด้วยคือตัวอย่างที่ 1 ความถูกต้องจะต้องได้รับการประเมินจากแหล่งกำเนิดจำนวนหนึ่ง
IrishStat

15
ฉันหมายถึงการเปรียบเทียบที่ตีพิมพ์ในซีรี่ส์หลายพันเรื่อง ในฐานะหัวหน้าบรรณาธิการวารสารการพยากรณ์ระหว่างประเทศฉันคิดว่าฉันมีความคิดบางอย่างเกี่ยวกับวิธีการประเมินการคาดการณ์
Rob Hyndman

2
ฉันไม่ได้ตั้งใจสำหรับคำถามนี้เพื่อให้เกิดข้อโต้แย้งว่าใครมีอัลกอริทึมการพยากรณ์ที่ดีที่สุด ฉันคิดว่าทั้ง autobox และ auto.arima น่าจะเป็นแพ็คเกจที่ดีมาก การเปรียบเทียบแบบตัวต่อตัวอาจไม่ยุติธรรมด้วยเหตุผลหลายประการ 1) ผู้ใช้อาจไม่เชี่ยวชาญพอที่จะรู้วิธีตัดสินพวกเขา 2) ความแม่นยำในการพยากรณ์ในซีรีย์ครั้งเดียวคือยิงอึ อาจมีข้อผิดพลาดกำลังสองต่ำกว่าในการคาดการณ์ แต่เมื่อใดก็ตามที่เกี่ยวข้องกับการสุ่มจะต้องนำมาพิจารณา คุณต้องดูหลาย ๆ ซีรีย์และ IrishStat แนะนำว่าคุณควรดูจุดเริ่มต้นที่แตกต่างกัน
Michael R. Chernick

นอกจากนี้คะแนนที่แตกต่างในการเริ่มพยากรณ์จะเป็นประโยชน์ 3) ในโลก ARIMA มีตัวแทนจำนวนมากสำหรับโมเดลอนุกรมเวลาเดียวกันกระบวนการ AR จำกัด มีการแสดงค่าเฉลี่ยเคลื่อนที่ที่ไม่มีที่สิ้นสุดและในทางกลับกัน ดังนั้น AR ที่มีลำดับต่ำอาจใกล้เคียงกับค่าเฉลี่ยเคลื่อนที่ที่มีลำดับสูงหรือ ARMA กล่องแนะนำเสมอตามหลักการของ parsimony แต่ถ้าคุณมีข้อมูลจำนวนมากคุณจะได้รับการประมาณค่าพารามิเตอร์ที่ดีและตัวแบบลำดับสูงอาจสร้างการพยากรณ์ที่ใกล้เคียงกับการพยากรณ์แบบเดียวกัน 4) แพคเกจทั้งสองมีวัตถุประสงค์ที่แตกต่างกัน
Michael R. Chernick

3
วิธีการมีการพัฒนาอยู่ตลอดเวลา Dave Reilly มีบทบาทมากในเว็บไซต์นี้เนื่องจาก IrishStat และเขาเปิดกว้างมากเกี่ยวกับการอธิบายว่ามันทำงานอย่างไรในเงื่อนไขทั่วไป มันเป็นสิ่งสำคัญของธุรกิจที่มีความลับทางการค้าและอัลกอริทึมที่เป็นกรรมสิทธิ์ จากมุมมองของเขา R กำลังทำร้ายธุรกิจของเขาเช่นเดียวกับ SPlus แต่เขาไม่ได้แสดงความขมขื่นและเต็มใจที่จะสาธิตซอฟต์แวร์ของเขาอย่างที่คุณเห็นในทุกวันนี้ เขายินดีที่จะทำการทดสอบกับคู่แข่งและฉันเชื่อว่าเขาได้เข้าร่วมการแข่งขันการคาดการณ์อนุกรมเวลา
Michael R. Chernick

11

แก้ไข: ต่อความคิดเห็นของคุณผมเชื่อว่าถ้าคุณปิดหลายตัวเลือกของคุณอาจจะได้คำตอบที่คล้ายกับautobox auto.arimaแต่ถ้าคุณทำไม่ได้และในการปรากฏตัวของค่าผิดปกติจะมีความแตกต่างแน่นอน: auto.arimaไม่สนใจค่าผิดปกติในขณะที่autoboxจะตรวจจับพวกเขาและจัดการพวกเขาอย่างเหมาะสมซึ่งจะให้แบบจำลองที่ดีกว่า อาจมีความแตกต่างอื่น ๆ เช่นกันและฉันมั่นใจว่า IrishStat สามารถอธิบายสิ่งเหล่านั้นได้


ฉันเชื่อว่าautoboxตรวจพบผู้ผิดและสิ่งอื่น ๆ นอกเหนือจากการค้นหาค่าสัมประสิทธิ์ AR, I และ MA ที่ดีที่สุด หากถูกต้องจะต้องใช้การวิเคราะห์มากขึ้นและฟังก์ชั่น R สองตัวอื่น ๆ เพื่อให้มีฟังก์ชั่นคล้าย และ IrishStats เป็นสมาชิกที่มีค่าของชุมชนนี้และเป็นมิตรมาก

แน่นอนว่า R ไม่มีค่าใช้จ่ายและสามารถทำสิ่งที่ยิ่งใหญ่กว่า ARIMA ได้

อีกตัวเลือกหนึ่งที่ฟรีสำหรับ ARIMA แบบเศรษฐศาสตร์คือX13-ARIMA SEATSจาก US Census Bureau ซึ่งเป็นโอเพ่นซอร์ส มีไบนารีสำหรับ Windows และ Linux แต่มันเรียบเรียงตรงไปตรงมาบน Mac ของฉันเนื่องจากฉันได้โหลดคอมไพเลอร์ gfortran ของ gnu แล้ว มันเป็นตัวตายตัวแทนX12-ARIMAและเพิ่งเปิดตัวในไม่กี่วันที่ผ่านมาหลังจากหลายปีของการพัฒนาและทดสอบ (อัปเดต X12 และเพิ่มคุณสมบัติ SEATS / TRAMO X12 เป็นเครื่องมืออย่างเป็นทางการของสหรัฐอเมริกาในขณะที่ SEATS / TRAMO มาจากธนาคารแห่งสเปนและเป็น "เครื่องมือยุโรป")

ฉันชอบ X12 (และตอนนี้ X13) มาก หากคุณส่งออกการวินิจฉัยในปริมาณที่พอสมควรและอ่านและเรียนรู้สิ่งที่พวกเขาหมายถึงพวกเขาจะได้รับการศึกษาที่ค่อนข้างดีใน ARIMA และอนุกรมเวลา ฉันได้พัฒนาเวิร์กโฟลว์ของตัวเอง แต่มีแพ็กเกจ R x12สำหรับการทำงานส่วนใหญ่จากภายใน R (คุณยังต้องสร้างไฟล์โมเดลอินพุต (".spc") สำหรับ X12)

ฉันบอกว่า X12 นั้นดีใน "เศรษฐศาสตร์สไตล์" ARIMA หมายถึงข้อมูลรายเดือนที่มีข้อมูลมากกว่า 3 ปี (คุณต้องใช้ข้อมูลมากกว่า 5 ปีในการใช้คุณสมบัติการวินิจฉัยบางอย่าง) มันมีคุณสมบัติการระบุค่าผิดปกติสามารถจัดการข้อมูลจำเพาะของค่าผิดปกติได้ทุกประเภทและสามารถจัดการวันหยุดวันหยุดลอยตัวผลกระทบของวันซื้อขายและโฮสต์ของสิ่งทางเศรษฐกิจ เป็นเครื่องมือที่รัฐบาลสหรัฐฯใช้ในการสร้างข้อมูลที่ปรับตามฤดูกาล


คำถามของฉันได้รับชุดข้อมูลจริงๆแล้วอัลกอริทึมทั้งสองอาจสร้างตัวเลือกโมเดลที่แตกต่างกัน มันเป็นเครื่องคัดสรรอัตโนมัติที่ฉันสนใจไม่ใช่คุณสมบัติการวินิจฉัยอื่น ๆ ที่คนอื่นอาจไม่ได้ เป็นที่ทราบกันว่าตระกูลของรุ่น ARMA และสองรุ่นในตระกูลนั้นสามารถเป็นตัวแทนที่แน่นอนหรือใกล้เคียงกับรุ่นเดียวกันได้ ดังนั้นหากมีความแตกต่างเล็กน้อยในขั้นตอนการคัดเลือกฉันจะคิดว่าพวกเขาสามารถเลือกรูปแบบที่แตกต่างกันได้
Michael R. Chernick

3
@MichaelChernick: อ่า ฉันเดาว่าถ้าคุณปิดเนื้อหาอัตโนมัติทั้งหมดในautoboxคุณจะได้รับคำตอบเดียวกัน แต่หนึ่งในจุดที่ใช้autoboxคือมันจะตรวจจับค่าผิดปกติและจัดการกับมันดังนั้นโมเดลที่ส่งคืนจะแตกต่างกันหากมีค่าผิดปกติ
Wayne

@Wayne +1 สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ X13-ARIMA SEATS และ SEATS / TRAMO
แกรมวอลช์

@Wayne โดยวิธีการอื่น "เครื่องมือยุโรป" เป็นDEMETRA +
แกรมวอลช์
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.