1) สิ่งที่ปรากฎเป็นข้อมูล (จัดกลุ่ม) ข้อมูลต่อเนื่องที่วาดเป็นแผนภูมิแท่ง
คุณสามารถสรุปได้อย่างปลอดภัยว่าไม่ใช่การกระจายของปัวซอง
ตัวแปรสุ่มของปัวซองใช้ค่า 0, 1, 2, ... และมีค่าสูงสุดสูงสุดที่ 0 เมื่อค่าเฉลี่ยน้อยกว่า 1 ใช้สำหรับการนับข้อมูล หากคุณวาดแผนภูมิข้อมูลปัวซงคล้ายกันมันอาจดูเหมือนแปลงด้านล่าง:
ข้อแรกคือปัวซองที่แสดงความเบ้คล้ายกับของคุณ คุณสามารถเห็นค่าเฉลี่ยของมันค่อนข้างเล็ก (ประมาณ 0.6)
ประการที่สองคือปัวซองที่มีความหมายคล้ายกัน (ที่คาดเดายากมาก) กับคุณ อย่างที่คุณเห็นมันดูค่อนข้างสมมาตร
คุณสามารถมีความเบ้หรือค่าเฉลี่ยขนาดใหญ่ แต่ไม่ใช่ทั้งสองอย่างในเวลาเดียวกัน
2) (i) คุณไม่สามารถทำให้ข้อมูลไม่ต่อเนื่องเป็นปกติ -
ด้วยข้อมูลที่จัดกลุ่มโดยใช้การแปลงที่เพิ่มขึ้นแบบโมโนโทนิกคุณจะย้ายค่าทั้งหมดในกลุ่มไปยังสถานที่เดียวกันดังนั้นกลุ่มที่ต่ำที่สุดจะยังคงมีจุดสูงสุดสูงสุด - ดูพล็อตด้านล่าง ในพล็อตแรกเราย้ายตำแหน่งของค่า x เพื่อให้ตรงกับ cdf ปกติ:
ในพล็อตที่สองเราจะเห็นฟังก์ชันความน่าจะเป็นหลังจากการแปลง เราไม่สามารถบรรลุสิ่งที่เป็นปกติได้เพราะมันเป็นแบบแยกและเอียง การกระโดดครั้งใหญ่ของกลุ่มแรกจะเป็นการกระโดดครั้งใหญ่ไม่ว่าคุณจะดันมันไปทางซ้ายหรือขวา
(ii) ข้อมูลที่เบ้อย่างต่อเนื่องอาจถูกแปลงให้ดูปกติอย่างสมเหตุสมผล หากคุณมีค่าดิบ (ไม่ได้จัดกลุ่ม) และพวกเขาไม่ได้แยกออกจากกันอย่างหนักคุณสามารถทำอะไรบางอย่างได้ แต่ถึงอย่างนั้นบ่อยครั้งที่ผู้คนพยายามแปลงข้อมูลของพวกเขาว่าไม่จำเป็นหรือปัญหาพื้นฐานสามารถแก้ไขได้ . บางครั้งการเปลี่ยนแปลงเป็นทางเลือกที่ดี แต่มักจะทำด้วยเหตุผลที่ไม่ดีมาก
ดังนั้น ... คุณต้องการแปลงทำไม