การทดสอบสมมติฐานและความสำคัญของอนุกรมเวลา


19

การทดสอบความสำคัญตามปกติเมื่อค้นหาประชากรสองคนคือ t-test, paired t-test หากเป็นไปได้ นี่ถือว่าการกระจายเป็นปกติ

มีข้อสมมติฐานที่ทำให้เข้าใจง่ายที่คล้ายกันที่สร้างการทดสอบนัยสำคัญสำหรับอนุกรมเวลาหรือไม่? โดยเฉพาะเรามีประชากรหนูสองตัวที่ค่อนข้างเล็กซึ่งกำลังได้รับการปฏิบัติแตกต่างกันและเราทำการวัดน้ำหนักสัปดาห์ละครั้ง กราฟทั้งสองแสดงฟังก์ชั่นที่เพิ่มขึ้นอย่างราบรื่นด้วยกราฟหนึ่งกราฟเหนืออีกแน่นอน เราจะหาปริมาณ "ความชัดเจน" ในบริบทนี้ได้อย่างไร

สมมติฐานว่างควรเป็นว่าน้ำหนักของประชากรทั้งสอง "ทำงานในลักษณะเดียวกัน" เมื่อเวลาผ่านไป เราจะกำหนดรูปแบบนี้ในรูปแบบง่าย ๆ ที่เป็นเรื่องธรรมดา (เช่นเดียวกับการแจกแจงแบบปกติทั่วไป) ด้วยพารามิเตอร์จำนวนเล็กน้อยเท่านั้น เมื่อเราทำเช่นนั้นแล้วเราจะวัดความสำคัญหรือสิ่งที่คล้ายคลึงกับค่า p ได้อย่างไร แล้วการจับคู่เมาส์จับคู่ลักษณะให้ได้มากที่สุดโดยแต่ละคู่มีตัวแทนหนึ่งคนจากประชากรสองคนแต่ละคน

ฉันยินดีต้อนรับตัวชี้ไปยังหนังสือหรือบทความที่เกี่ยวข้องที่เขียนได้ดีและเข้าใจได้ง่ายเกี่ยวกับอนุกรมเวลา ฉันเริ่มเป็นคนโง่เขลา ขอบคุณสำหรับความช่วยเหลือของคุณ.

David Epstein


คุณอาจต้องการใช้เครือข่ายที่กว้างขึ้นเพราะนี่ไม่ใช่คำถามอนุกรมเวลา จริง ๆ แล้วคำถามพื้นฐานที่สุดอาจเกี่ยวข้องกับวิธีที่ดีที่สุดหรืออย่างน้อยก็เป็นวิธีที่ถูกต้องในการหาจำนวน "ปลายทาง" ของการรักษา: มันหมายถึงการเติบโตของประชากรหลังจากระยะเวลาหนึ่งอัตราการเติบโตเฉลี่ยในช่วงเวลาหรือไม่? หากคุณไม่เคยรู้เรื่องนี้มาก่อนที่จะเริ่มการทดสอบและสังเกตเห็นความแตกต่างอย่างต่อเนื่องในกราฟการเจริญเติบโตคุณก็กำลังทำงานในโหมดสำรวจไม่ใช่แบบยืนยันและการทดสอบสมมติฐานจะดีมาก
whuber

ผลลัพธ์มีคุณภาพตามที่คาดหวังและการทดสอบด้านเดียวดูเหมือนว่าเหมาะสม เหตุผลที่ฉันถามเกี่ยวกับอนุกรมเวลาคือถ้ามีใครวัดเฉพาะน้ำหนักสุดท้าย (ซึ่งเป็นการวัดที่เกี่ยวข้องมากที่สุด) ก็มีใครทิ้งข้อมูลทั้งหมดจากจุดเวลาก่อนหน้านี้และดูเหมือนว่าผิด
David Epstein

ถูกต้อง: คุณไม่ต้องการทิ้งข้อมูลเหล่านั้น แต่เทคนิคอนุกรมเวลามาก่อนสำหรับแบบจำลองของข้อมูลที่ความสัมพันธ์เชิงเวลาของการเบี่ยงเบนจากเส้นโค้งในอุดมคตินั้นมีความสำคัญไม่ว่าจะเพื่อผลประโยชน์ของตัวเองหรือเพราะพวกเขาอาจแทรกแซงการประมาณที่ดี สถานการณ์ของคุณไม่น่าจะตกอยู่ในกรณีใดกรณีหนึ่ง มีวิธีการที่เรียบง่ายและมีความหมายทางวิทยาศาสตร์มากขึ้น
whuber

@ ยิ่งกว่านั้นน้ำหนักของชุดควบคุมหนูไม่ใช่ "โค้งในอุดมคติ" ในบางแง่มุมใช่ไหม? หรืออย่างน้อยแบบจำลองทางทฤษฎีก็พอดีกับข้อมูลนั้น
naught101

1
ใช่ @ ไม่มีนั่นเป็นวิธีที่เหมาะสมในการดู แต่ "เส้นโค้ง" นั้นไม่เหมือนกับ "อนุกรมเวลา" ตัวอย่างเช่นการถดถอยเชิงเส้นสามารถถูกมองว่าเป็นเส้นโค้งที่เหมาะสมกับข้อมูล แต่แยกออกจากการวิเคราะห์อนุกรมเวลาซึ่งเน้นโครงสร้างของสหสัมพันธ์ระหว่างส่วนเบี่ยงเบนระหว่างข้อมูลและเส้นโค้งที่ทำให้เป็นอุดมคติ
whuber

คำตอบ:


1

มีหลายวิธีที่จะทำถ้าคุณคิดว่าการเปลี่ยนแปลงน้ำหนักเป็นกระบวนการพลวัต

ตัวอย่างเช่นมันสามารถสร้างแบบจำลองเป็นผู้รวม x˙(เสื้อ)=θx(เสื้อ)+โวลต์(เสื้อ)

โดยที่คือการแปรผันของน้ำหนักθเกี่ยวข้องกับการเปลี่ยนแปลงของน้ำหนักอย่างรวดเร็วและv ( t )คือการรบกวนสุ่มที่อาจส่งผลกระทบต่อการแปรผันของน้ำหนัก คุณสามารถจำลองv ( t )เป็นN ( 0 , Q )สำหรับQ ที่รู้จัก(คุณสามารถประมาณได้)x(เสื้อ)θโวลต์(เสื้อ)โวลต์(เสื้อ)ยังไม่มีข้อความ(0,Q)Q

θθθ1θ2

สำหรับการอ้างอิงผมสามารถแนะนำนี้หนังสือ


0

ฉันขอแนะนำให้ระบุรูปแบบ ARIMA สำหรับหนูแต่ละตัวแยกต่างหากจากนั้นตรวจสอบพวกเขาสำหรับความคล้ายคลึงและลักษณะทั่วไป ตัวอย่างเช่นหากหนูตัวแรกมี AR (1) และอีกอันมี AR (2) โมเดลที่ใหญ่ที่สุด (ใหญ่ที่สุด) จะเป็น AR (2) ประมาณการรุ่นนี้ทั่วโลกเช่นสำหรับอนุกรมเวลารวมกัน เปรียบเทียบผลรวมข้อผิดพลาดของกำลังสองสำหรับชุดที่รวมกันกับผลรวมของผลรวมข้อผิดพลาดของแต่ละบุคคลที่สองของสี่เหลี่ยมเพื่อสร้างค่า F เพื่อทดสอบสมมติฐานของพารามิเตอร์คงที่ในกลุ่ม ฉันหวังว่าคุณจะสามารถโพสต์ข้อมูลของคุณและฉันจะแสดงให้เห็นถึงการทดสอบนี้อย่างแม่นยำ

ความคิดเห็นเพิ่มเติม:

เนื่องจากชุดข้อมูลนั้นเป็นมาตรฐานปกติที่สัมพันธ์กันโดยอัตโนมัติจึงไม่สามารถใช้งานได้ หากการสังเกตมีความเป็นอิสระในช่วงเวลาหนึ่งก็อาจใช้วิธีการอนุกรมที่ไม่ใช่ที่รู้จักกันดีบางอย่าง ในแง่ของคำขอของคุณเกี่ยวกับหนังสือที่อ่านง่ายเกี่ยวกับอนุกรมเวลาฉันแนะนำข้อความ Wei โดย Addison-Wesley นักวิทยาศาสตร์สังคมจะค้นพบวิธีการที่ไม่ใช่คณิตศาสตร์ของ Mcleary และ Hay (1980) ให้ใช้งานได้ง่ายขึ้น แต่ขาดความเข้มงวด


1
สิ่งนี้ไม่ปรากฏขึ้นเพื่อแก้ไขปัญหาพื้นฐาน (1) ทำไมรูปแบบดังกล่าวจึงเหมาะสม (2) ทำไมเมาส์แต่ละอันควรทำตัวเป็นแบบอย่างและไม่พูดน้ำหนักเฉลี่ยของประชากรหรือน้ำหนักเพิ่มขึ้น? (3) ทำไมการทดสอบพารามิเตอร์คงที่จึงเกี่ยวข้อง? คำถามจะเกิดขึ้นสำหรับการทดสอบแบบด้านเดียว พารามิเตอร์ส่วนใหญ่ที่คุณพูดถึงไม่เกี่ยวข้องกับวิทยาศาสตร์และไม่ได้บอกถึงความรู้สึกของกราฟหนึ่งที่อยู่เหนือกราฟอื่นอย่างสม่ำเสมอ (4) คุณจะควบคุมความแตกต่างที่เป็นไปได้ในลักษณะของประชากรทั้งสองได้อย่างไรในช่วงเริ่มต้นของการทดสอบ
whuber

: whuber ที่ดีที่สุดสำหรับความมั่นคงของพารามิเตอร์ที่เกี่ยวข้องเพราะคุณมี aset ofcoefficients มากลุ่มแรกของ formings formouse 1 & ชุดที่สองของค่าสัมประสิทธิ์สำหรับเมาส์ที่สองคำถามคือ "จะมีความแตกต่างเล็กน้อยระหว่างค่าสัมประสิทธิ์" ต่อไปกับความคิดเห็นของคุณ เนื่องจากหนึ่งในค่าสัมประสิทธิ์แบบจำลองอาจเป็นค่าคงที่และถ้าหากเป็นความแตกต่างระหว่างค่าสัมประสิทธิ์อาจเนื่องจากค่าคงที่ทั้งสองมีความแตกต่างทางสถิติทราบว่าแบบจำลอง ARIMA พื้นฐานอาจไม่จำเป็นต้องเป็นค่าคงที่
IrishStat

1
ฉันคิดว่าคุณถูกต้อง แต่คุณต้องปรับแต่งลักษณะของปัญหา สัมประสิทธิ์ ARIMA จำนวนมากอาจไม่เกี่ยวข้องกับวิทยาศาสตร์ ตัวอย่างเช่นหากหนึ่งในนั้นทำหน้าที่เป็นคำกำลังสองเมื่อเวลาผ่านไปความแตกต่างอาจพูดอะไรบางอย่างเกี่ยวกับรูปร่างของเส้นโค้งการเจริญเติบโต แต่ที่อาจมีประโยชน์น้อย หากมีใครเลือกสัมประสิทธิ์เพื่อสะท้อนถึงจุดสิ้นสุดการทดลองและทดสอบเฉพาะพวกเขาความดีบางอย่างอาจเกิดขึ้นได้ โดยทั่วไปแม้ว่าอนุกรมเวลาจะแนะนำค่าสัมประสิทธิ์ (เช่นการหาค่าสหสัมพันธ์) ซึ่งไม่น่าสนใจโดยตรงที่นี่
whuber

whuber: "ถ้ามีคนเลือกสัมประสิทธิ์เพื่อสะท้อนจุดสิ้นสุดการทดลองและทดสอบเฉพาะพวกเขาความดีบางอย่างอาจบรรลุผลสำเร็จ" ไม่สมเหตุสมผลกับฉันมากนักเพราะมันไม่สนใจจุดกึ่งกลาง ในทางตรงกันข้ามกับความคิดเห็นของคุณโหมดอนุกรมเวลาและค่าสัมประสิทธิ์ที่มาพร้อมกันนั้นมีความสนใจทางวิทยาศาสตร์ที่สำคัญเนื่องจากมันแสดงลักษณะการกระจายของการอ่านและแปลงให้เป็นกระบวนการสุ่ม (เทอมข้อผิดพลาด) ซึ่งไม่มีโครงสร้างอัตโนมัติ ต้องมีกฎเกณฑ์ การทดสอบที่ฉันเสนอนั้นจำเป็นต้องมีข้อสันนิษฐานนั้น
IrishStat

1
ความสัมพันธ์อัตโนมัติอาจมีความสำคัญเล็กน้อยที่นี่ ความสนใจมุ่งเน้นไปที่แนวโน้มอย่างชัดเจน: เส้นโค้งการเติบโตพื้นฐานมีแนวโน้มที่จะแตกต่างกันอย่างไรระหว่างสองประชากร พารามิเตอร์ Autocorrelation เป็นพารามิเตอร์ที่สร้างความรำคาญให้แก่ผู้ที่ได้รับการแนะนำและจัดการกับตราบเท่าที่พวกเขาอาจช่วยปรับปรุงการประมาณของเส้นโค้งการเจริญเติบโตเหล่านั้น สิ่งสำคัญอันดับแรกคือการใช้แบบจำลองทางวิทยาศาสตร์ของการเติบโตแสดงแบบจำลองนั้นพร้อมพารามิเตอร์ที่สามารถตีความได้และเป็นที่สนใจและประมาณไว้ การประยุกต์ใช้เทคนิคอนุกรมเวลาโดยอัตโนมัติไม่น่าเป็นไปได้
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.