การทดสอบความสำคัญของยอดเขาในความหนาแน่นสเปกตรัม


20

บางครั้งเราใช้พล็อตความหนาแน่นสเปกตรัมเพื่อวิเคราะห์ช่วงเวลาในอนุกรมเวลา โดยปกติเราวิเคราะห์พล็อตโดยการตรวจสอบด้วยสายตาและจากนั้นพยายามวาดข้อสรุปเกี่ยวกับช่วงเวลา แต่นักสถิติได้ทำการพัฒนาการทดสอบเพื่อตรวจสอบว่าสไปค์ใด ๆ ในพล็อตนั้นแตกต่างจากเสียงสีขาวหรือไม่? ผู้เชี่ยวชาญด้าน R ได้พัฒนาแพ็คเกจใด ๆ สำหรับการวิเคราะห์ความหนาแน่นสเปกตรัมและสำหรับการทำแบบทดสอบนั้นหรือไม่? ดีมากถ้ามีคนช่วยได้

ขอแสดงความนับถือ,
P.


1
กด @Wesley ฉันลบความคิดสั้น ๆ เกี่ยวกับฟังก์ชั่น autocorrelation และ periodogram (อาจเป็นเขาจริง ๆ คือกูรูการวิเคราะห์โดเมนความถี่ แต่โดยส่วนตัวฉันไม่คิดว่า Bartlett ในขณะที่ทำงานกับ autocorrelations ในโดเมนเวลา) แต่ก็ยังคิดว่า ข้อเสนอแนะที่สองเกี่ยวกับbootspecdensอาจเป็นประโยชน์
Dmitrij Celov

ฉันกำลังตั้งสมมติฐานเกี่ยวกับการตอบสนองของผู้คนต่อ 'ความสัมพันธ์อัตโนมัติคืออะไร' ในลักษณะที่ปรากฏในวรรณคดีซึ่งเกือบทุกอินสแตนซ์ที่ใช้การปรับค่าความสัมพันธ์อัตโนมัติเป็นค่ามาตรฐาน, คำนวณเวลาโดเมน, Autocorrelation Barlett และน่าเสียดายที่มันไม่ดี! :) ฉันขอขอบคุณข้อเสนอแนะbootspecdensจาก Dmitrij; รอคอยที่จะตรวจสอบมันออกมา
Wesley Burr

คำตอบ:


9

คุณควรทราบว่าไม่แนะนำให้ประมาณค่าพลังงานสเปกตรัมโดยใช้ periodogram และในความเป็นจริงแล้วการปฏิบัติที่ไม่ดีตั้งแต่ ~ 1896 มันเป็นตัวประมาณที่ไม่สอดคล้องกันสำหรับตัวอย่างข้อมูลน้อยกว่าล้าน (และแม้กระทั่ง ... ) และโดยทั่วไป ลำเอียง. สิ่งเดียวกันนี้นำไปใช้กับการใช้การประมาณค่ามาตรฐานของความสัมพันธ์อัตโนมัติ (เช่น Bartlett) เนื่องจากเป็นคู่การแปลงฟูริเยร์ เมื่อคุณใช้ตัวประมาณที่สอดคล้องกันมีตัวเลือกบางอย่างให้คุณ

สิ่งที่ดีที่สุดของสิ่งเหล่านี้คือการประเมินสเปกตรัมพลังงาน (หรือเรียว) แบบหลายหน้าต่าง ในกรณีนี้โดยใช้ค่าสัมประสิทธิ์ของแต่ละหน้าต่างด้วยความถี่ที่น่าสนใจคุณสามารถคำนวณสถิติ Harmonic Fเทียบกับสมมติฐานว่างของเสียงสีขาว นี่เป็นเครื่องมือที่ยอดเยี่ยมสำหรับการตรวจจับส่วนประกอบของเส้นเสียงรบกวนและแนะนำเป็นอย่างยิ่ง มันเป็นตัวเลือกเริ่มต้นในชุมชนการประมวลผลสัญญาณสำหรับการตรวจจับเป็นระยะในเสียงภายใต้สมมติฐานของความคงที่

คุณสามารถเข้าถึงทั้งวิธีการประเมินคลื่นความถี่และการทดสอบ F ที่เกี่ยวข้องผ่านทางmultitaperแพคเกจใน R (มีให้ผ่านทาง CRAN) เอกสารที่มาพร้อมกับแพ็คเกจควรจะเพียงพอสำหรับคุณ spec.mtmF-ทดสอบเป็นตัวเลือกที่ง่ายในการเรียกฟังก์ชั่นสำหรับ

การอ้างอิงดั้งเดิมที่กำหนดทั้งสองเทคนิคเหล่านี้และให้อัลกอริทึมสำหรับพวกเขาคือการประมาณค่าสเปกตรัมและการวิเคราะห์ฮาร์มอนิก , DJ Thomson, การดำเนินการของ IEEE, vol. 70, pg. 1055-1096, 1982

นี่คือตัวอย่างการใช้ชุดข้อมูลที่รวมอยู่ในmultitaperแพ็คเกจ

require(multitaper);
data(willamette);
resSpec <- spec.mtm(willamette, k=10, nw=5.0, nFFT = "default",
                    centreWithSlepians = TRUE, Ftest = TRUE,
                    jackknife = FALSE, maxAdaptiveIterations = 100,
                    plot = TRUE, na.action = na.fail) 

พารามิเตอร์ที่คุณควรระวังคือkและnw : นี่คือจำนวนของ windows (ตั้งค่าเป็น 10 ด้านบน) และผลิตภัณฑ์ time-bandwidth (5.0 ด้านบน) คุณสามารถปล่อยให้เป็นค่าเริ่มต้นเสมือนเหล่านี้สำหรับแอปพลิเคชันส่วนใหญ่ได้อย่างง่ายดาย centreWithSlepiansคำสั่งเอาประมาณการที่แข็งแกร่งของค่าเฉลี่ยของชุดเวลาโดยใช้การฉายบน windows Slepian - นี้เป็นยังแนะนำเช่นออกจากค่าเฉลี่ยผลิตจำนวนมากของการใช้พลังงานที่มีความถี่ต่ำ

ฉันขอแนะนำให้พล็อตเอาท์พุทคลื่นความถี่จาก 'spec.mtm' บนสเกลบันทึกเนื่องจากมันล้างสิ่งต่าง ๆ อย่างมีนัยสำคัญ หากคุณต้องการข้อมูลเพิ่มเติมเพียงโพสต์และฉันยินดีที่จะให้มัน


ถึง Burr, Silva และ Celov - ขอบคุณมากสำหรับคำตอบและคำแนะนำที่น่าสนใจของคุณ ฉันหวังว่าจะทดสอบตัวประมาณเหล่านี้ ขอแสดงความนับถือ
Pantera

(+1) คืนนี้ฉันคิดอย่างรอบคอบเกี่ยวกับคำแนะนำของคุณและตัดสินใจว่าโดเมนเวลานั้นเป็นสิ่งสุดท้าย (เนื่องจากความล่าช้าในการตัดทอนและคุณสมบัติที่อ่อนแอในกลุ่มตัวอย่างเล็ก ๆ ) เพื่อลองค้นหาพฤติกรรมการปั่นจักรยาน สิ่งที่ฉันเป็นกังวลเกี่ยวกับตัวเองคือสมมติฐานสำหรับสถิติ F และคุณสมบัติขนาดตัวอย่างเล็ก ๆ ของโครงการที่แนะนำ ดีและอาจเป็นเรื่องดีที่จะเริ่มคำถามแยกต่างหากเกี่ยวกับการเลือกหน้าต่างที่ดีที่สุดเพราะมีอยู่จริง
Dmitrij Celov

มีตัวเลือกหน้าต่างอยู่มากมายถึงแม้ว่าตัวเลือกที่ใช้กันทั่วไปส่วนใหญ่จะเป็น Discrete Prolate Spheroidal Sequence (หรือSlepians ) และแท่งไซน์ หากคุณกำลังมองหาความเข้มข้นของพลังงานสูงสุดในแบนด์วิดท์ในท้องถิ่น Slepians ได้รับการพิสูจน์แล้วว่าเหมาะสมที่สุดและในความเป็นจริงแล้วผลลัพธ์จากรูปแบบสมการอินทิกรัลของความหนาแน่นสเปกตรัม (ดูกระดาษที่ฉันกล่าวถึงรายละเอียดทั้งหมด) เท่าที่สถิติ F ไปมีปัญหาบางอย่างเกี่ยวกับองศาอิสระ แต่โดยรวมแล้วพวกเขาทำงานได้ค่อนข้างดีโดยมี ~ 2k-2 อานนท์
Wesley Burr

สโคปแบบเรียบยังใช้เรียวช่วยให้ FFT หนังสือของ David Stoffer สอนวิธีการคำนวณช่วงความมั่นใจเช่นกัน multitaperแพคเกจนี้ดูเหมือนจะใช้เทคนิคขั้นสูงสำหรับการเรียวและการคำนวณช่วงความมั่นใจ แต่ฉันคิดว่าความคิดนั้นเหมือนกันตามที่ David Stoffer กล่าว นี่เป็นสิ่งเดียวที่ฉันสามารถนึกได้ว่าการสอนวานิลลา peridogoram จริงวันนี้ยังคงทำให้รู้สึก
Stucash

ตกลงดังนั้นคุณเป็นหนึ่งในผู้เขียนของแพคเกจนี้และคุณได้ใช้คำที่แข็งแกร่งมากกับ periodogram ฉันหวังว่าคุณจะกลับมาพร้อมกับหลักฐานเพิ่มเติมวันหนึ่ง ข้อดีและข้อเสียทั่วไปของ Periodogram นั้นเป็นที่รู้จักกันดีเช่นความแปรปรวนระเบิดซึ่งเป็นสาเหตุที่ทำให้การประมาณค่าสเปกตรัมไม่สม่ำเสมอกัน แต่ periodogram ที่ราบรื่นไม่ได้เลวร้ายเท่าที่ควร
Stucash

3

เราได้พยายามที่จะแก้ไขปัญหานี้โดยการแปลงเวฟเล็ตจากการทดสอบทางสเปกตรัมเมื่อเร็ว ๆ นี้ในบทความนี้ โดยพื้นฐานแล้วคุณต้องพิจารณา periodogram กำหนดการแจกแจงคล้ายกับบทความของ Fisher ที่กล่าวถึงในคำตอบก่อนหน้า กระดาษจาก Koen นี้อีกอัน เราได้รับการตีพิมพ์เมื่อเร็ว ๆ นี้แพคเกจ R hwwntest


Savchev ขอบคุณมากสำหรับความคิดเห็นและการอ้างอิงของคุณ ฉันหวังว่าจะทดสอบแพ็คเกจ R ของคุณ
Pantera

2

(ωk)

คุณสามารถรับรายละเอียดเพิ่มเติมเกี่ยวกับการทดสอบใน MB Priestley การวิเคราะห์สเปกตรัมและอนุกรมเวลาสำนักวิชาการลอนดอน 2524 หน้า 406

ใน R แพ็คเกจGeneCycle มีฟังก์ชั่นfisher.g.test():

library(GeneCycle)
?fisher.g.test

หวังว่านี่จะช่วยได้


นี่เป็นสิ่งที่ดี แต่การทดสอบของแพ็คเกจนั้นขึ้นอยู่กับฟังก์ชั่น periodogram ของตัวเองซึ่งมีตัวเลือกที่ จำกัด มากสำหรับการคำนวณสเปกตรัมกำลัง ...
stucash
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.