ฉันสามารถใช้คะแนน Z กับข้อมูลที่เอียงและไม่ปกติได้หรือไม่ [ปิด]


12

ฉันทำงานกับข้อมูลรอบเวลากระบวนการบางอย่างและปรับขนาดโดยใช้คะแนน z มาตรฐานเพื่อเปรียบเทียบระหว่างส่วนของรอบเวลาทั้งหมด

ฉันควรใช้การแปลงรูปแบบอื่นเนื่องจากข้อมูลมีความเบ้อย่างหนัก / ไม่ปกติใช่หรือไม่ ('ค่าผิดปกติ' ไม่สามารถใช้เวลาติดลบและมักใช้เวลานานกว่า 'ค่าเฉลี่ย' มาก)

การใช้คะแนน z ยังคงดูเหมือนว่า "ทำงาน" ...

###############
# R code    
###############
mydata <- rweibull(1000,1,1.5)
hist(mydata)
hist(scale(mydata))

5
คุณจะถามอะไรกันแน่ แน่นอนคุณยังสามารถคำนวณคะแนนแต่คุณพยายามใช้อะไร จำนวนของการเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย (ซึ่งคือสิ่งที่ -score คือ) อาจไม่เป็นสถิติที่มีประโยชน์โดยเฉพาะในบางสถานการณ์ zz
มาโคร

คำตอบ:


5

หาก X มีการบิดเบือนสูงสถิติ Z จะไม่แจกแจงแบบปกติ (หรือ t หากค่าเบี่ยงเบนมาตรฐานต้องถูกประมาณดังนั้นค่าเปอร์เซ็นต์ของ Z จะไม่เป็นค่ามาตรฐานปกติดังนั้นในกรณีนี้จึงใช้งานไม่ได้


เพื่อความเข้าใจของฉัน X การเบ้สูงหมายความว่าขนาดตัวอย่างไม่ใหญ่พอ (ทฤษฎีบทขีด จำกัด กลาง) อย่างไรก็ตามฉันไม่แน่ใจว่าประชากรจะต้องเป็นปกติหรือไม่เพื่อให้สถิติ Z สามารถทำงานได้ ทำมัน?
Andrzej Gis

1
OP กำลังพูดถึงการกระจายตัวของประชากรไม่ใช่การกระจายตัวของค่าเฉลี่ย ดังนั้นขนาดตัวอย่างและทฤษฎีขีด จำกัด กลางจึงไม่มีผล
Michael R. Chernick

2

รหัส R จะใช้งานได้ แต่คะแนน z จะมีความหมายเท่า ๆ กับประโยค "องุ่นกำลังพูดโทรศัพท์เบา ๆ " มันเป็นประโยคที่ถูกต้อง แต่ไม่ได้สื่อความหมายอะไรเลย

ตัดสินโดยรหัส R ของคุณดูเหมือนว่าคุณคิดว่าข้อมูลของคุณกระจาย Weibull ในกรณีนี้ฉันแค่ใช้สถิติ Weibull และไม่ขยายขนาดเว้นแต่ว่าคุณจะต้องทำ แม้ว่าคะแนน z จะได้รับการสอนในทุกระดับสถิติอินโทร แต่นั่นไม่ได้หมายความว่าคุณควรใช้พวกเขาตลอดเวลาและโดยเฉพาะอย่างยิ่งถ้าคุณไม่มีข้อมูลแบบสมมาตร


1

หากประชากรไม่กระจายตามปกติ ในกรณีดังกล่าวการกระจายของ bar (X) {sample mean} เข้าใกล้การแจกแจงปกติตามทฤษฎีบทขีด จำกัด กลาง สำหรับตัวอย่างขนาดใหญ่ แม้ว่าในทางทฤษฎีเราบอกว่าเรากำลังใช้ Student's-t แต่สำหรับค่าที่สูงกว่าของ n (ขนาดตัวอย่างหรือระดับของเสรีภาพ) การแจกแจงค่า t และการแจกแจง Z เกือบเท่ากัน


-4

ข้อมูลของคุณไม่จำเป็นต้องเป็นเรื่องปกติสำหรับการทดสอบ Z (เมือง, 2002) อย่างไรก็ตามตัวแปรต่าง ๆ ควรจะใกล้เคียงกันโดยประมาณ เพื่อตรวจสอบว่าดำเนินการทดสอบแบบทดสอบกับชุดข้อมูลสองชุดของคุณและหากตัวแปรของคุณใกล้เคียงกันเท่ากับผลลัพธ์ผลการทดสอบ Z จะเป็นประโยชน์ หากไม่มีให้ถ่ายโอนข้อมูล


9
คำถามคือเกี่ยวกับการเปลี่ยนแปลงของตัวแปรไม่ใช่แบบทดสอบดังนั้นฉันไม่คิดว่าคำตอบของคุณจะนำไปใช้ นอกจากนี้อาจเป็นข้อมูลเพิ่มเติมถ้าคุณให้การอ้างอิงแบบเต็มแทนที่จะเป็นเพียงการอ้างอิงชื่อปีและบางคนคัดค้านการตะโกน
Maarten Buis

ฉันเห็นด้วยกับ @MaartenBuis แต่ฉันไม่เห็นด้วยกับสิ่งนี้เลย
Erik
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.