การทดสอบทางสถิติมาตรฐานคืออะไรเพื่อดูว่าข้อมูลเป็นไปตามการแจกแจงแบบเอ็กซ์โพเนนเชียลหรือการแจกแจงปกติ?


12

การทดสอบทางสถิติมาตรฐานคืออะไรเพื่อดูว่าข้อมูลเป็นไปตามการแจกแจงแบบเอ็กซ์โพเนนเชียลหรือการแจกแจงปกติ?


2
การทดสอบที่ดีที่สุดอาจจะขึ้นอยู่กับเหตุผลที่ว่าคุณกำลังทดสอบสำหรับภาวะปกติ / ชี้แจง (ดังนั้นพื้นฐานบางอย่างจะเป็นประโยชน์) แต่คุณสามารถใช้การทดสอบ Kolmogorov Smirnov ในการทดสอบไม่ว่าจะเป็นข้อมูลที่ได้รับการตั้งค่าใด ๆ ที่เหมาะกับการจัดจำหน่ายที่กำหนดไว้ล่วงหน้า ( en.wikipedia .org / wiki / Kolmogorov% E2% 80% 93Smirnov_test ) มีวิธีการมากมายที่ใช้สำหรับการแจกแจงแบบปกติโดยเฉพาะ: en.wikipedia.org/wiki/Normality_test
Macro

ตัวแปรที่ฉันจัดการมีแนวโน้มที่จะติดตามการแจกแจงแบบปกติหรือเลขยกกำลัง นอกจากนี้ฉันมีปัจจัยที่ฉันไม่สนใจ อย่างไรก็ตามมันกำหนดความแตกต่างบางอย่างในข้อมูลของฉัน ดังนั้นฉันต้องการทำให้ตัวแปรปกติเพื่อระงับผลกระทบของปัจจัยความรำคาญนี้ ดังนั้นฉันคิดว่ามันจะดีกว่าที่จะทำให้ค่าความแปรปรวนแต่ละค่าเป็นค่าปกติโดยอิงจากการแจกแจงพื้นฐาน นั่นเป็นเหตุผลที่ฉันต้องการทดสอบเพื่อตัดสินใจระหว่างการแจกแจงสองแบบนี้
smo

1
สิ่งที่ไม่ปกติหมายถึงในประโยคนี้: ฉันคิดว่ามันจะดีกว่าที่จะปรับแต่ละ varible อยู่บนพื้นฐานของการกระจายพื้นฐานของพวกเขา ?
แมโคร

2
ในขณะที่ไม่ใช่การทดสอบQQ แปลงนั้นยอดเยี่ยมสำหรับการตรวจสอบอย่างรวดเร็วว่าข้อมูลของคุณตรงกับการกระจาย
naught101

คำตอบ:


13

ดูเหมือนว่าคุณกำลังพยายามตัดสินใจว่าจะสร้างแบบจำลองข้อมูลของคุณโดยใช้การแจกแจงแบบปกติหรือแบบเอ็กซ์โปเนนเชียล ดูเหมือนว่าจะแปลกสำหรับฉันเนื่องจากการกระจายเหล่านี้แตกต่างจากกันมาก

การแจกแจงแบบปกตินั้นสมมาตรในขณะที่การแจกแจงเอ็กซ์โพเนนเชียลบิดเบี้ยวไปทางขวาอย่างหนักโดยไม่มีค่าลบ โดยปกติจะเป็นตัวอย่างจากการกระจายการชี้แจงจะมีหลายข้อสังเกตค่อนข้างใกล้เคียงกับและ obervations ไม่กี่คนที่เบี่ยงเบนไปทางขวาห่างไกลจาก0ความแตกต่างนี้มักจะเห็นได้ชัดเจน00

นี่คือตัวอย่างที่ฉันจำลองการสังเกตจากการแจกแจงแบบปกติที่มีค่าเฉลี่ยและความแปรปรวนและการแจกแจงเอ็กซ์โพเนนเชียลด้วยค่าเฉลี่ยและความแปรปรวน :n=1002424

Normal vs exponential: ข้อมูลจำลอง

ความสมมาตรของการแจกแจงแบบปกติและความเบ้ของเลขชี้กำลังสามารถดูได้โดยใช้ฮิสโตแกรม, บ็อกซ์พล็อตและการกระจายแบบกระจายตามที่แสดงในภาพด้านบน

อีกหนึ่งเครื่องมือที่มีประโยชน์มากเป็นQQ พล็อต ในตัวอย่างด้านล่างคะแนนควรประมาณตามเส้นถ้าตัวอย่างมาจากการแจกแจงแบบปกติ อย่างที่คุณเห็นนี่เป็นกรณีของข้อมูลปกติ แต่ไม่ใช่สำหรับข้อมูลเอ็กซ์โปเนนเชียล

QQ-plot สำหรับข้อมูลจำลอง

หากการตรวจสอบกราฟิกด้วยเหตุผลบางอย่างไม่เพียงพอสำหรับคุณคุณยังสามารถใช้การทดสอบเพื่อตรวจสอบว่าการกระจายของคุณเป็นปกติหรือเลขยกกำลัง เนื่องจากการแจกแจงแบบปกติเป็นแบบสเกลและตระกูลคุณจะต้องใช้การทดสอบที่ไม่เปลี่ยนแปลงภายใต้การเปลี่ยนแปลงขนาดและตำแหน่ง (เช่นผลการทดสอบไม่ควรเปลี่ยนแปลงหากคุณเปลี่ยนการวัดจากนิ้วเป็นเซนติเมตรหรือเพิ่มการสังเกตทั้งหมดของคุณ)+1

เมื่อสมมติฐานว่างเปล่าคือการแจกแจงปกติและสมมติฐานทางเลือกคือมันเป็นการยกกำลังการทดสอบตำแหน่งและมาตราส่วนคงที่ที่ทรงพลังที่สุดจะได้รับจากสถิติ โดยที่เป็นค่าเฉลี่ยตัวอย่างคือการสังเกตที่เล็กที่สุดในตัวอย่างและคือค่าเบี่ยงเบนมาตรฐานตัวอย่าง เรื่องปรกตินั้นถูกปฏิเสธเนื่องจากเห็นได้ว่าหากใหญ่เกินไป

TE,ยังไม่มีข้อความ=x¯-x(1)s
x¯x(1)sTE,ยังไม่มีข้อความ

การทดสอบนี้เป็นจริงรุ่นด้านเดียวของการทดสอบกรับส์สำหรับค่าผิดปกติ คุณจะพบว่าสิ่งนี้นำไปใช้กับซอฟต์แวร์ทางสถิติส่วนใหญ่ (แต่ให้แน่ใจว่าคุณใช้รุ่นที่ถูกต้อง - มีสถิติการทดสอบทางเลือกมากมายที่ใช้สำหรับการทดสอบที่ผิดปกติ!)

ข้อมูลอ้างอิงสำหรับเป็นแบบทดสอบที่มีประสิทธิภาพมากที่สุด:TE,ยังไม่มีข้อความส่วนที่ 4.2.4 ของการทดสอบตามปกติโดย HC Thode


OP ขอให้คุณทดสอบความเป็นปกติที่คุณจะเลือกทดสอบในสถานการณ์อื่นถ้าคุณทำการทดสอบแบบเลขชี้กำลังคุณจะใช้แบบทดสอบใด ฉันไม่ได้อ่านคำแถลงว่าเขากำลังแนะนำให้ลองทดสอบทั้งสองในชุดข้อมูลเดียวกัน
Michael R. Chernick

ฉันตีความมันในลักษณะนั้นเนื่องจากในการติดตามความคิดเห็นของคำถาม OP ได้เขียนว่า "ตัวแปรที่ฉันติดต่อด้วยมีแนวโน้มที่จะติดตามการแจกแจงแบบปกติหรือเลขชี้กำลัง [... ] นั่นเป็นเหตุผลที่ฉันต้องทำการทดสอบเพื่อ ตัดสินใจเลือกระหว่างการแจกแจงสองอย่างนี้ "
MånsT

ฉันไม่ได้สังเกตว่า ในกรณีนั้นคำตอบของคุณเหมาะสมมาก ฉันกำลังตอบราวกับว่าเขากำลังทดสอบทีละคน
Michael R. Chernick

@Michael: ฉันตีความมันเป็นอย่างนั้นเมื่อฉันอ่านคำถามเดิมเช่นกัน แต่ตัดสินใจที่จะเขียนคำตอบของฉันหลังจากอ่านความคิดเห็น ไม่เช่นนั้นฉันไม่คิดว่าจะมีอะไรเพิ่มในคำตอบ (+1) ของคุณ (นอกเหนือจากคำพูดเล็ก ๆ ที่ฉันทำไว้ในความคิดเห็น)
MånsT

5

BnY¯เข้าสู่ระบบY¯Yผม

Bn=n×{เข้าสู่ระบบY¯-เข้าสู่ระบบY¯}n=2n×{1+(n+1)/(6n)}-1
Bn~χ2(n-1)

ดู KC กะเปอร์และ LR Lamberson ความน่าเชื่อถือในการออกแบบทางวิศวกรรม ไวลีย์ 1977


2
ฉันเจอแหล่งข้อมูลที่กว้างขวางและใหม่กว่านี้เกี่ยวกับการทดสอบเพื่อหาเลขชี้กำลัง 1) บทความ: A Henze, N. และ Meintanis, SG (2005): 'การทดสอบล่าสุดและแบบคลาสสิกสำหรับการยกกำลัง: การทบทวนบางส่วนพร้อมการเปรียบเทียบ' Metrika, vol. 61, pp. 29–45 2) แพ็คเกจ CRAN R ชื่อ 'exptest' ที่ใช้ในการทดสอบบทความที่กล่าวถึง
Yves

การกระจายตัวของ B_n ไม่ค่อยชัดเจน มันคือ Chi Square ที่มี n-1 df หรือ Chi Square ที่มี n-1 df คูณด้วย n-1
Dovini Jayasinghe

ทำงานตามที่เขียนไว้ คุณสามารถตรวจสอบได้โดยใช้รหัส R สองสามบรรทัด
Yves

ขอบคุณ มันควรเป็นการคูณที่ฉันเห็น ในแง่ขององศาอิสระควรเป็น n-1?
Dovini Jayasinghe

Bnn-1

4

สำหรับค่านิยมแอนเดอร์สัน - ดาร์ลิ่งและชาปิโร - วิลค์ถือว่าดีที่สุด สำหรับการทดสอบ Lillerfors เอ็กซ์โพเนนเชียลนั้นได้รับการออกแบบมาโดยเฉพาะสำหรับมัน


5
คำตอบนี้อาจได้รับการปรับปรุงด้วยรายละเอียดเล็กน้อยว่าทำไมการทดสอบแต่ละครั้งจึงถือว่าดี / ดีกว่าการทดสอบอื่น ๆ
naught101

การทดสอบเหล่านี้ดีกว่าในแง่ที่มีประสิทธิภาพมากที่สุดในการออกเดินทางจากปกติ (Anderson-Darling) และเลขชี้กำลัง (Lillefors) ฉันไม่คิดว่ามันเป็นเรื่องง่ายตามเขารูปแบบของการทดสอบเพื่อให้คำอธิบายที่ใช้งานง่าย
Michael R. Chernick

3
@Michael: การทดสอบ Anderson-Darling สำหรับค่านิยม (เช่น Shapiro-Wilk dito) มีอำนาจที่น่านับถือกับทางเลือกที่หลากหลาย แต่แน่นอนว่ามันไม่ได้มีประสิทธิภาพมากที่สุด (โดยทั่วไปหรือโดยทั่วไป) ทางเลือกของการทดสอบควรขึ้นอยู่กับทางเลือกในมือ ฉันไม่เคยได้ยินเกี่ยวกับการทดสอบ Lillerfors - คุณหมายถึงการทดสอบ Lilliefors (ซึ่งจริง ๆ แล้วเป็นการทดสอบความเป็นปกติไม่ใช่การทดสอบเพื่อชี้แจง)
MånsT

แน่นอนฉันหมายถึงการทดสอบ Lillefors สำหรับการอธิบายแบบเอกซ์โปเนลเพราะมันเป็นสิ่งที่ฉันแนะนำสำหรับการแจกแจงแบบเอ็กซ์โปเนนเชียล ฉันระบุชาปิโร่วิลก์และแอนเดอร์สัน - ดาร์ลิ่งเพราะความรู้ของฉันที่ดีที่สุดพวกเขาอยู่ในกลุ่มที่ทรงพลังที่สุดในบรรดาแบบทดสอบเพื่อความเป็นบรรทัดฐาน การทดสอบที่ทรงพลังยิ่งกว่าที่คุณอ้างถึงคืออะไร
Michael R. Chernick

1
ขึ้นอยู่กับประเภทของทางเลือกที่คุณมี ตัวอย่างของทางเลือกที่ลาดเอียงตัวอย่างความเบ้มักมีประสิทธิภาพมากกว่า SW และ AD ส่วนหลังเป็นการทดสอบแบบ Omnibus ที่ค่อนข้างดีโดยเฉลี่ย แต่ถ้าคุณรู้ว่าประเภทใดที่ไม่ใช่มาตรฐานที่คุณเป็นห่วงคุณควรใช้แบบทดสอบโดยตรง (เช่นการทดสอบความเบ้ตัวอย่างซึ่งกำกับที่ทางเลือกแบบเบ้) .
MånsT

4

คุณได้พิจารณาวิธีกราฟิกเพื่อดูว่าข้อมูลทำงานอย่างไร

เทคนิคกราฟความน่าจะเป็นมักจะเกี่ยวข้องกับการจัดอันดับข้อมูลโดยใช้การผกผัน CDF แล้ววางแผนผลลัพธ์บนระนาบคาร์ทีเซียน สิ่งนี้ช่วยให้คุณเห็นว่าหลายค่าเบี่ยงเบนไปจากการแจกแจงแบบตั้งสมมติฐานและอาจอธิบายสาเหตุของการเบี่ยงเบน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.