เป็นแปลงราก -th แนะนำ?


12

เพื่อนร่วมงานของฉันต้องการวิเคราะห์ข้อมูลบางอย่างหลังจากเปลี่ยนตัวแปรการตอบสนองด้วยการเพิ่มเป็น (นั่นคือ )18y0.125

ฉันรู้สึกไม่สบายใจกับสิ่งนี้ แต่การดิ้นรนเพื่ออธิบายว่าทำไม ฉันไม่สามารถนึกถึงเหตุผลเชิงกลไกใด ๆ สำหรับการเปลี่ยนแปลงนี้ ฉันไม่เคยเห็นมาก่อนและฉันกังวลว่าบางทีมันอาจทำให้อัตราความผิดพลาดของ Type I หรือบางอย่างเพิ่มขึ้น - แต่ฉันไม่มีอะไรจะสนับสนุนข้อกังวลเหล่านี้!

นอกจากนี้เพื่อนร่วมงานของฉันพบว่าโมเดลที่แปลงเหล่านี้มีประสิทธิภาพสูงกว่าโมเดลที่ไม่ได้รับการแปลงในการเปรียบเทียบ AIC ในตัวมันเองปรับการใช้งานให้เหมาะสมหรือไม่?


9
เพียง FYI,ดูจำนวนมากเช่นสำหรับช่วงหลายปีการแปลงบันทึกมักจะเป็นธรรมในหลายกรณี (แต่ก็มักจะใช้ในกรณีที่ไม่ยุติธรรมเช่นกัน) y1/8log(y)y
หน้าผา AB


5
คุณไม่สามารถเปรียบเทียบ AICs อย่างมีความหมายระหว่างแบบจำลองกับตัวแปรที่ขึ้นกับการแปลง (การแปลงตัวแปรอิสระนั้นใช้ได้)
Stephan Kolassa

5
@CliffAB ถูกต้อง ความแตกต่างในทางปฏิบัติที่สำคัญระหว่างพลังบวกขนาดเล็กและลอการิทึมคือคุณสามารถรับพลังของศูนย์ได้ เมื่อมีศูนย์สองสามในข้อมูล (อาจเป็นเพราะความไม่แน่นอนในการบันทึกตัวเลข) บางครั้งพลังงานขนาดเล็ก (0.1 หรือแม้แต่ 0.01) ทำงานแทนลอการิทึม (ยังดีกว่า: ใช้การเปลี่ยนแปลง Box-Coxสำหรับธุรกิจขนาดเล็ก .) เนื่องจากกฎหมายธรรมชาติน้อยมากที่เกี่ยวข้องกับการใช้พลังงาน 1/8 แม้ว่าและอีกมากมายที่เกี่ยวข้องกับปรากฏการณ์ชี้แจงโดยใช้ล็อกสามารถ บางครั้งให้ข้อมูลเชิงลึกและการตีความที่ดีกว่าพลังขนาดเล็ก y=(xp1)/pp
whuber

3
นี่เป็น riff ขนาดเล็กบนแนวคิดที่ว่าการแปลงนี้อาจใช้แทนลอการิทึมหากค่าศูนย์เกิดขึ้น ลิงก์ลอการิทึมสำหรับโมเดลเชิงเส้นทั่วไปบอกว่าค่าเฉลี่ยของการตอบสนองนั้นแตกต่างกันไป แต่ไม่ถือว่าค่าทั้งหมดเป็นค่าบวก ดังนั้นจึงยอมให้มีค่าศูนย์ในข้อมูล ความหมายโดยประมาณคือพวกเขาควรหรือจะเป็นบวกหากทำได้: เช่นศูนย์ที่รายงาน (ตัวอย่างศูนย์เป็นศูนย์ตัวอย่างความเข้มข้นศูนย์ตามเครื่อง) บางครั้งก็หมายความว่าไม่ได้ตรวจพบ แม้จะมีชื่อ Box-Cox ที่ยอดเยี่ยมดูเหมือนว่าจะถูกขายออกไปเมื่อใดก็ตามที่มีการเชื่อมโยงตามธรรมชาติใน GLMs
Nick Cox

คำตอบ:


10

เป็นเรื่องธรรมดาที่จะประยุกต์ใช้การแปลงพลังงาน (Tukey, Box-Cox) ด้วยค่านิยมโดยพลการในการตอบสนอง จากมุมมองนั้นฉันไม่เห็นความกังวลใด ๆ เกี่ยวกับคุณค่าของคุณที่ 1/8 - หากการแปลงนั้นให้คุณมีส่วนที่เหลือดีไปเลย

แน่นอนว่าการเปลี่ยนแปลงใด ๆ จะเปลี่ยนความสัมพันธ์ในหน้าที่การใช้งานที่คุณเหมาะสมและอาจเป็นไปได้ว่า 1/8 ไม่ได้ทำให้เกิดความรู้สึกเชิงกลไก แต่นั่นก็ไม่น่าเป็นห่วงสำหรับฉันเมื่อวัตถุประสงค์ไม่ได้คาดการณ์หรือปรับพารามิเตอร์ของร่างกาย กฎหมาย แต่เพื่อให้ได้ค่า p ที่เหมาะสมบนสัญลักษณ์ของผลกระทบ (ฉันขอยืนยันว่าเป็นกรณีการใช้งานปกติในการถดถอย) สำหรับจุดประสงค์นั้นข้อกังวลเดียวของคุณคือฟังก์ชั่นนั้นเหมาะสมกับข้อมูลในโดเมนของค่าตัวทำนายของคุณ (wrt Mean และส่วนที่เหลือ) และที่ง่ายต่อการตรวจสอบ

หากคุณไม่แน่ใจเกี่ยวกับค่าที่ดีที่สุดสำหรับการแปลงพลังงานและต้องการเปรียบเทียบระหว่างตัวเลือกที่แตกต่างกันคุณไม่ควรเปรียบเทียบค่า AIC / โอกาสในการเปลี่ยนแปลงโดยตรงเนื่องจากการเปลี่ยนแปลงพลังงานเปลี่ยนระดับของการตอบสนอง โชคดีที่ปรากฎว่ามันค่อนข้างตรงไปตรงมาในการคำนวณการแก้ไขสำหรับการแปลงเช่นว่าการแปลงที่แตกต่างกันสามารถเปรียบเทียบได้ผ่านโอกาส (แก้ไข) ของพวกเขา (ดูเช่นที่นี่ )

ใน R สิ่งนี้ถูกนำไปใช้ใน MASS :: boxcox - นี่เป็นวิธีที่สะดวกในการเลือกค่าที่เหมาะสมสำหรับพลังงาน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.