ตรวจสอบจุดสูงสุดที่มีนัยสำคัญทางสถิติ


14

ฉันมีชุดของข้อมูลที่เป็นและxฉันต้องการทดสอบสมมติฐานต่อไปนี้: มีจุดสูงสุดใน ; นั่นคือเมื่อเพิ่มขึ้นเพิ่มขึ้นก่อนแล้วจึงลดลงYxYxY

ความคิดแรกของฉันคือการติดตั้งและใน SLR นั่นคือถ้าฉันพบว่าสัมประสิทธิ์ก่อนเป็นบวกอย่างมีนัยสำคัญและสัมประสิทธิ์ก่อนเป็นลบอย่างมีนัยสำคัญฉันก็สนับสนุนสมมติฐาน อย่างไรก็ตามสิ่งนี้จะตรวจสอบความสัมพันธ์ประเภทเดียวเท่านั้น (สมการกำลังสอง) และอาจไม่จำเป็นต้องมีอยู่ของจุดสูงสุดxx2xx2

จากนั้นฉันก็คิดว่าจะหาเช่นภูมิภาค (ค่าเรียงลำดับ)นั่นคืออยู่ระหว่างและสองส่วนอื่น ๆ ของที่มีคะแนนอย่างน้อยที่สุดเท่ากับและ และอย่างมีนัยสำคัญ หากสมมติฐานที่เป็นความจริงที่เราควรคาดหวังว่าภูมิภาคดังกล่าวจำนวนมากขดังนั้นหากจำนวนมีขนาดใหญ่พอสมควรก็ควรมีการสนับสนุนสมมติฐานxaxY¯>Ya¯Y¯>Y¯

คุณคิดว่าฉันอยู่ในเส้นทางที่ถูกต้องเพื่อหาแบบทดสอบที่เหมาะสมสำหรับสมมติฐานของฉันหรือไม่? หรือฉันจะประดิษฐ์วงล้อและมีวิธีการที่กำหนดไว้สำหรับปัญหานี้หรือไม่? ฉันจะซาบซึ้งในความคิดเห็นของคุณ

UPDATE ขึ้นอยู่กับตัวแปรของฉันคือนับ (จำนวนเต็มไม่เป็นลบ)Y


ไม่แตกต่างกันได้อย่างราบรื่นด้วยx ? ถ้าเป็นเช่นนั้นคุณสามารถลองปรับรุ่นรวมถึงราบรื่นกว่า (พูด GAM) และคำนวณอนุพันธ์อันดับแรกของความราบรื่นและช่วงความมั่นใจ หากอนุพันธ์เพิ่มขึ้นหากมีการเพิ่มขึ้นของสัญญาหากคุณมีคำตอบ yx
Reinstate Monica - G. Simpson

คำตอบ:


6

ฉันกำลังคิดถึงความคิดที่ราบรื่นเช่นกัน แต่มีพื้นที่ทั้งหมดที่เรียกว่าวิธีการพื้นผิวการตอบสนองที่ค้นหายอดเขาในข้อมูลที่มีเสียงดัง (ส่วนใหญ่เกี่ยวข้องกับการใช้กำลังสองท้องถิ่นเหมาะสมกับข้อมูล) และมีกระดาษที่มีชื่อเสียงที่ฉันจำได้ด้วย "Bump hunting" ในชื่อเรื่อง นี่คือลิงค์ไปยังหนังสือเกี่ยวกับวิธีการตอบสนองพื้นผิว หนังสือของ Ray Myer นั้นเขียนได้ดีเป็นพิเศษ ฉันจะพยายามหากระดาษล่าสัตว์ชน

ระเบียบวิธีพื้นผิวการตอบสนอง: การเพิ่มประสิทธิภาพกระบวนการและผลิตภัณฑ์โดยใช้การทดลองที่ออกแบบมา

วิธีการตอบสนองของพื้นผิวและหัวข้อที่เกี่ยวข้อง

วิธีการตอบสนองพื้นผิว

การสร้างแบบจำลองเชิงประจักษ์และพื้นผิวเผชิญเหตุ

แม้ว่าจะไม่ใช่บทความที่ฉันกำลังมองหา แต่นี่เป็นบทความที่เกี่ยวข้องโดย Jerry Friedman และ Nick Fisher ที่เกี่ยวข้องกับแนวคิดเหล่านี้ที่ใช้กับข้อมูลมิติสูง

นี่คือบทความที่มีความคิดเห็นออนไลน์

ดังนั้นฉันหวังว่าคุณอย่างน้อยขอขอบคุณคำตอบของฉัน ฉันคิดว่าความคิดของคุณเป็นสิ่งที่ดีและถูกต้อง แต่ใช่ฉันคิดว่าคุณอาจจะคิดค้นสิ่งใหม่ ๆ และฉันหวังว่าคุณและคนอื่น ๆ จะมองไปที่การอ้างอิงที่ยอดเยี่ยมเหล่านี้


3
ฉันไม่ได้เป็นหนึ่งในกลุ่มผู้ดาวน์ดาวน์ แต่คาดว่าจะมีคำตอบในไซต์ SE มากกว่าลิงก์ไปยังเนื้อหา การสรุปเนื้อหาหรือจัดให้มีการตอบสนองโดยสรุปจากนั้นเชื่อมโยงไปยังเนื้อหาเพื่อดูรายละเอียดเพิ่มเติมจะดีขึ้น
Reinstate Monica - G. Simpson

2
ฉัน upvoting อันนี้เพราะ (1) มันนำเสนอความคิดที่ดี; (2) มันมีความเห็นบางอย่าง ; และ (3) ได้รับการสนับสนุนด้วยลิงก์ที่เลือกอย่างระมัดระวังรวมถึงเนื้อหาที่มีให้ใช้งานได้อย่างอิสระ ใช่มันดูไม่ดีในรูปแบบตัวอักษรเพราะลิงก์อาจมีรูปแบบที่ดีกว่า แต่ฉันหวังว่าผู้คนจะไม่ชั่งน้ำหนักคำตอบในการตัดสินใจลงคะแนนของพวกเขาอย่างมาก!
whuber

1
@ คนฉันเห็นด้วยหลังจากที่สามารถอ่านได้อย่างชัดเจนเนื่องจากรูปแบบที่ดีโดย Procastinator +1 เช่นกัน ฉันคิดว่ามีการสรุปที่เพียงพอที่นี่และบางหัวข้อมีความซับซ้อนเกินกว่าที่จะเป็นอะไรมากกว่าแนวคิดพื้นฐานและเป็นข้อมูลอ้างอิงสำหรับการอ่านเพิ่มเติม
Erik

5
@MichaelChernick โปรดทราบว่านั่นไม่ใช่คำวิจารณ์จากฉันเพียงเสนอเหตุผลว่าทำไมผู้คนถึงโหวตไม่ได้ ฉันจะไม่เห็นด้วยกับพวกเขาหากนั่นเป็นเหตุผลเพราะฉันคิดว่าคำตอบของคุณคือจุดโดยเฉพาะอย่างยิ่งกับ PRIM; ฉันเพิ่งจะปรึกษาHastie et al (2009)ของฉันเกี่ยวกับสิ่งที่พูดกับ PRIM คุณอาจต้องการเพิ่มลิงก์นั้นไปยังคำตอบเนื่องจากมีสองส่วนใน PRIM นั้นมีและ PDF ให้บริการฟรี
Reinstate Monica - G. Simpson

1
@Nikita สมมติฐานเชิงสถิติอย่างเป็นทางการที่คุณต้องการทดสอบคืออะไร ก่อนอื่นคุณต้องหายอดเขาซึ่งเป็นส่วนสำคัญของเรื่องนี้ คุณกำลังทดสอบว่าจุดสูงสุดไม่ได้เป็นเพียงแค่เสียงรบกวนหรือไม่? ฉันไม่แน่ใจว่ามีวรรณกรรมอะไรที่จะแก้ปัญหานี้ แต่ความคิดของฉันก็คือคุณสามารถใส่พหุนามถดถอยลงในข้อมูลได้ จากนั้นคุณจะมีการประมาณค่าความแปรปรวนที่เหลืออยู่ นัยสำคัญทางสถิติของเทอมกำลังสองจะเป็นการทดสอบความสำคัญของพีค
Michael R. Chernick

1

แม้ว่าคุณจะยังไม่ได้ตอบคำถามของฉันหากการเดาของฉันถูกต้องคุณกำลังมองหาการทดสอบเสียงสีขาวซึ่งมีจำนวนในโดเมนความถี่เพื่อแสดงคลื่นความถี่ว่าแบน ดังนั้นการทดสอบ periodogram ของ Fisher ซึ่งในเอกสารอ้างอิงนี้เรียกว่า Fisher's Kappa ดูลิงค์

http://www4.stat.ncsu.edu/~dickey/Spain/pdf_Notes/Spectral2.pdf

การทดสอบของ Bartlett ยังกล่าวถึงในการอ้างอิง ทีนี้การปฏิเสธสมมติฐานว่างเพื่อหาจุดสูงสุดที่มีนัยสำคัญใน periodogram นี่หมายความว่ามีส่วนประกอบตามงวดในอนุกรมเวลา

เนื่องจากการทดสอบอยู่ในโดเมนความถี่และเกี่ยวข้องกับ periodogram ordinates ordinate มีการแจกแจงไคสแควร์ 2 ภายใต้สมมติฐานว่างและเป็นอิสระ การกระจายแบบพิเศษนี้เกิดขึ้นเพียงเพราะการแปลงเป็นโดเมนความถี่ ถ้า x เป็นเวลาสิ่งนี้จะไม่ทำงานในโดเมนเวลาหรือโดยทั่วไปการแจกแจงสำหรับ ys จะไม่ใช่ไคสแควร์อิสระ

m


Y

ดังนั้น y คือข้อมูลนับและตัวแปรอธิบายอย่างต่อเนื่องของ xa คืออะไร? ข้อเสนอแนะก่อนหน้าของฉันอาจไม่ได้อยู่ในกรณีนั้น แต่มีวรรณกรรมล่าสุดจำนวนมากในแบบจำลองการนับ ดังนั้นหากคุณสามารถเจาะจงมากขึ้นเกี่ยวกับข้อมูลและปัญหาฉันอาจชี้ไปที่วิธีแก้ปัญหา
Michael R. Chernick

Yx

ฉันไม่แน่ใจว่าสิ่งนี้จะช่วยได้หรือไม่ แต่ Cameron และ Trivedi ตีพิมพ์หนังสือเกี่ยวกับแบบจำลองการนับจำนวนและมีรุ่นที่สองออกมาในปี 2013 นี่คือลิงค์ที่มีข้อมูลบางอย่าง: cameron.econ.ucdavis.edu/racd/count .html
Michael R. Chernick
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.