การแปรรูปเปลี่ยนความเบ้โดยไม่กระทบต่อ kurtosis?


11

ฉันอยากรู้อยากเห็นหากมีการเปลี่ยนแปลงที่เปลี่ยนแปลงความลาดเอียงของตัวแปรสุ่มโดยไม่ส่งผลกระทบต่อ kurtosis นี่จะคล้ายกับวิธีการแปลงเลียนแบบของ RV ส่งผลต่อค่าเฉลี่ยและความแปรปรวน แต่ไม่ใช่ความเบ้และความโด่ง (ส่วนหนึ่งเป็นเพราะความเบ้และความโด่งนั้นถูกกำหนดให้เปลี่ยนแปลงอย่างต่อเนื่อง) นี่เป็นปัญหาที่ทราบหรือไม่?


คุณต้องการให้ส่วนเบี่ยงเบนมาตรฐานคงที่กับการแปลงนี้ด้วยหรือไม่?
russellpierce

ไม่ฉันคาดหวังว่ามันจะไม่ได้ แต่ความโด่งเกินควรจะคงที่ ฉันคาดหวังว่าการแปลงรูปจะเป็นแบบโมโนโทนิก
shabbychef

1
Yikes - ความฉิบหายแก่บุคคลที่ต้องการพิสูจน์ฟังก์ชั่นที่ไม่สามารถกำหนดค่าได้
russellpierce

หัวข้อนี้อาจเป็นที่สนใจของผู้อ่าน: การเปลี่ยนแปลงที่เพิ่มขึ้นและความโด่งของเบ้ RV
gung - Reinstate Monica

คำตอบ:


6

คำตอบของฉันคือการเริ่มต้นของการแฮ็คทั้งหมด แต่ฉันไม่ได้ตระหนักถึงวิธีการที่กำหนดไว้ในการทำสิ่งที่คุณถาม

ขั้นตอนแรกของฉันคือการจัดลำดับชุดข้อมูลของคุณคุณสามารถค้นหาตำแหน่งที่เป็นสัดส่วนในชุดข้อมูลของคุณจากนั้นแปลงเป็นชุดข้อมูลแบบธรรมดาวิธีนี้ใช้ใน Reynolds & Hewitt, 1996 ดูตัวอย่างรหัส R ด้านล่างใน PROCMiracle

เมื่อการกระจายเป็นปกติแล้วปัญหาได้ถูกเปิดบนหัวของมัน - เรื่องของการปรับ kurtosis แต่ไม่เอียง การค้นหา google แนะนำว่าเราสามารถทำตามขั้นตอนของ John & Draper, 1980 เพื่อปรับเปลี่ยนความหนา แต่ไม่ใช่ความเบ้ - แต่ฉันไม่สามารถทำซ้ำผลลัพธ์นั้นได้

ความพยายามของฉันในการพัฒนาฟังก์ชั่นการแพร่กระจาย / การ จำกัด น้ำมันดิบที่รับค่าอินพุต (ทำให้เป็นมาตรฐาน) และเพิ่มหรือลบค่าจากมันตามสัดส่วนกับตำแหน่งของตัวแปรในระดับปกติจะส่งผลให้มีการปรับแบบโมโนโทนิก แต่ในทางปฏิบัติ การกระจาย bimodal แม้ว่าจะมีค่าความเบ้และค่าเคิร์ตซีสที่ต้องการ

ฉันรู้ว่านี่ไม่ใช่คำตอบที่สมบูรณ์ แต่ฉันคิดว่ามันอาจให้ขั้นตอนในทิศทางที่ถูกต้อง

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

ฉันทำอะไรแบบนี้: อันดับแล้วใช้การแปลง g และ h เพื่อรับความคงที่และความเบ้ อย่างไรก็ตามเทคนิคนี้จะถือว่าที่จริงผมรู้ว่าโด่งประชากรซึ่งผมสามารถประมาณการ แต่ฉันสนใจ, ปรัชญา, หากมีการเปลี่ยนที่เก็บรักษาโด่งโดยไม่ต้องฉันต้องรู้ว่ามันคืออะไร ...
shabbychef

@shabbychef: โอ้ดีแล้วขอโทษที่ไม่เพิ่มอะไรใหม่ อย่างไรก็ตามคุณได้เพิ่มสิ่งใหม่ ๆ ฉันไม่เคยได้ยินสูตร g-and-h มาก่อน คุณมีการอ้างอิงที่เข้าถึงได้อย่างอิสระที่ให้มาหรือไม่ ฉันสะดุดกระดาษหนึ่งแผ่นที่สะกดออกมา ( fic.wharton.upenn.edu/fic/papers/02/02252pdf ) แต่ความคิดนั้นค่อนข้างแปลกสำหรับฉัน (โดยเฉพาะคือ e ^ Z ^ g หรืออย่างอื่น )? ฉันลองแบบนี้ ... แต่ผลลัพธ์ดูเหมือนแปลก ... a + b * (e ^ g ^ z-1) * (exp ((h * z ^ 2) / 2) / g)
russellpierce

1
@drnexus: ฉันไม่ต้องการมีอคติกับผลลัพธ์โดยกล่าวถึงเทคนิคของฉัน ฉันเรียนรู้เกี่ยวกับ g-and-h และการแจกแจง g-and-k จาก Haynes และ al, dx.doi.org/10.1016/S0378-3758(97)00050-5และ Fisher & Klein, econstor.eu/bitstream/10419/29578/1/614055873.pdf
shabbychef

1

nn-12บรรทัดฐานระหว่างสถิติตัวอย่างการสั่งซื้อและรุ่นที่ถูกแปลงภายใต้ข้อ จำกัด ที่กำหนด นี่เป็นวิธีที่แปลกประหลาด แต่ ในคำถามเดิมฉันกำลังมองหาสิ่งพื้นฐานและพื้นฐานมากกว่า ฉันเองก็กำลังมองหาเทคนิคที่สามารถนำไปใช้กับการสังเกตการณ์แต่ละอย่างโดยไม่ขึ้นกับการมีกลุ่มตัวอย่างทั้งหมด


0

ฉันอยากทำแบบจำลองชุดข้อมูลนี้โดยใช้การกระจาย leptokurtic แทนการใช้การแปลงข้อมูล ฉันชอบการกระจาย sinh-arcsinh จาก Jones และ Pewsey (2009), Biometrika

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.