สมมติว่าฉันมีตัวแปรที่มีการแจกแจงเบ้บวกในระดับสูงมากเช่นการบันทึกจะไม่เพียงพอเพื่อที่จะนำมันอยู่ในช่วงของความเบ้สำหรับการแจกแจงแบบปกติ ตัวเลือกของฉันมีอะไรบ้างในตอนนี้ ฉันจะทำอย่างไรเพื่อแปลงตัวแปรเป็นการกระจายตัวแบบปกติ
สมมติว่าฉันมีตัวแปรที่มีการแจกแจงเบ้บวกในระดับสูงมากเช่นการบันทึกจะไม่เพียงพอเพื่อที่จะนำมันอยู่ในช่วงของความเบ้สำหรับการแจกแจงแบบปกติ ตัวเลือกของฉันมีอะไรบ้างในตอนนี้ ฉันจะทำอย่างไรเพื่อแปลงตัวแปรเป็นการกระจายตัวแบบปกติ
คำตอบ:
ลองใช้การแปลง Box-Cox แบบตรงตาม Box, GEP และ Cox, DR (1964), "การวิเคราะห์การแปลง" วารสารสมาคมสถิติแห่งราชอาณาจักร, Series B , 26, 211--234 SAS มีคำอธิบายของฟังก์ชัน loglikelihood ในNormalizing Transformationsซึ่งคุณสามารถใช้เพื่อค้นหาพารามิเตอร์ดีที่สุดซึ่งอธิบายไว้ใน Atkinson, AC (1985), Plots, Transformations และ Regressionนิวยอร์ก: Oxford University Press
มันง่ายมากที่จะใช้มันด้วยฟังก์ชั่น LL หรือถ้าคุณมีชุดข้อมูลสถิติเช่น SAS หรือ MATLAB ใช้คำสั่ง: มันเป็นคำสั่งboxcoxใน MATLAB และPROC TRANSREGใน SAS
นอกจากนี้ใน R นี้อยู่ในแพ็คเกจ MASS, ฟังก์ชัน boxcox ()
สำหรับการเอียงเชิงบวก (หางอยู่บนปลายบวกของแกน x) มีการแปลงสแควร์รูทการแปลงล็อกและการแปลงผกผัน / ส่วนกลับ (ตามลำดับของความรุนแรงที่เพิ่มขึ้น) ดังนั้นหากการแปลงบันทึกไม่เพียงพอคุณสามารถใช้การเปลี่ยนแปลงระดับต่อไป Box Cox ดำเนินการแปลงทั้งหมดโดยอัตโนมัติเพื่อให้คุณสามารถเลือกการแปลงที่ดีที่สุด
ชุดซอฟต์แวร์ส่วนใหญ่จะใช้หมายเลขของออยเลอร์เป็นฐานบันทึกเริ่มต้น AKA: บันทึกธรรมชาติ คุณสามารถใช้หมายเลขฐานที่สูงขึ้นเพื่อดึงข้อมูลที่เอียงไปทางขวามากเกินไป วิธีการที่คุณใช้งานไวยากรณ์นั้นขึ้นอยู่กับซอฟต์แวร์ที่คุณใช้
หากคุณต้องการกลับไปหาคุณเปลี่ยนค่าเมื่อการประมาณเสร็จเรียบร้อยแล้วมันอาจจะง่ายกว่าการใช้วิธีนี้เพราะสิ่งที่คุณต้องทำก็คือการใช้ตัวดำเนินการเลขชี้กำลังในตัวแปรของคุณด้วยฐานบันทึกของคุณ