ปรีชาสักครู่เกี่ยวกับความหมายของการแจกแจงหรือไม่?


14

ใครสามารถให้สัญชาตญาณว่าทำไมช่วงเวลาที่สูงขึ้นของการแจกแจงความน่าจะเป็นเช่นช่วงเวลาที่สามและสี่สอดคล้องกับความเบ้และความโด่งตามลำดับ? ทำไมค่าเบี่ยงเบนเกี่ยวกับค่าเฉลี่ยยกกำลังสามหรือสี่จึงแปลเป็นตัวชี้วัดความเบ้และความโด่ง มีวิธีที่เกี่ยวข้องกับสิ่งนี้กับอนุพันธ์อันดับสามหรือสี่ของฟังก์ชันหรือไม่?pX

พิจารณาคำจำกัดความของความเบ้และความโด่ง:

Skewness(X)=E[(XμX)3]/σ3,Kurtosis(X)=E[(XμX)4]/σ4.

ในสมการเหล่านี้เราเพิ่มค่าปกติเป็นพลังงานและนำค่าที่คาดไว้ ไม่ชัดเจนสำหรับฉันว่าทำไมการเพิ่มตัวแปรสุ่มให้เป็นกำลังสี่ให้ "ความแหลม" หรือทำไมการเพิ่มตัวแปรสุ่มให้เป็นกำลังสามควรให้ "ความเบ้" ดูเหมือนว่ามหัศจรรย์และลึกลับ!(Xμ)/σ


4
สัญชาตญาณในการเอียงของฉันคือการสังเกตว่าพลังที่สามรักษาเชิงลบ ดังนั้นถ้าคุณมีการเบี่ยงเบนเชิงลบที่ใหญ่กว่าจากค่าเฉลี่ยมากกว่าที่คุณคิดบวก (ใส่ได้ง่ายมาก) คุณก็จะได้การกระจายเชิงลบที่เบ้ สัญชาตญาณของฉันสำหรับ kurtosis คือพลังที่สี่ขยายส่วนเบี่ยงเบนใหญ่จากค่าเฉลี่ยมากกว่าพลังที่สอง นี่คือเหตุผลที่เราคิดว่า kurtosis เป็นเครื่องวัดปริมาณไขมันที่หางของการแจกแจง โปรดทราบว่าความเป็นไปได้ที่มากของ x จากค่าเฉลี่ยของ mu จะเพิ่มขึ้นเป็นกำลังสี่ซึ่งทำให้พวกมันขยายใหญ่ขึ้น แต่ไม่สนใจสัญญาณ
wolfsatthedoor


1
เนื่องจากพลังที่ 4 ได้รับผลกระทบจากค่าผิดปกติมากกว่าพลังอันดับที่ 1 ฉันคาดว่าคุณจะได้รับเพียงเล็กน้อยจากการดูช่วงเวลาที่สี่เกี่ยวกับค่ามัธยฐาน - อย่างน้อยถ้าความแข็งแกร่งเป็นเป้าหมาย
Glen_b -Reinstate Monica

1
ก่อนอื่นให้สังเกตว่าช่วงเวลาที่สูงขึ้นเหล่านี้ไม่จำเป็นต้องเป็นมาตรการที่ดี / น่าเชื่อถือสำหรับความไม่สมดุล / ความแหลม ที่กล่าวว่าผมคิดว่าคานให้สัญชาตญาณทางกายภาพที่ดีสำหรับสามช่วงเวลาแรกเช่นเฉลี่ย = คานทรงตัว / ขนาดแปรปรวน = เท้าแขนโค้งเบ้ = กระดานหก
GeoMatt22

1
คุณพูดถูกแล้วการตีความหมายของคำว่า "ความแหลม" นั้นช่างวิเศษและลึกลับ นั่นเป็นเพราะมันไม่เป็นความจริงเลย Kurtosis ไม่ได้บอกคุณเกี่ยวกับจุดสูงสุด มันวัดส่วนท้าย (ผิดปกติ) เท่านั้น เป็นการง่ายที่จะพิสูจน์ทางคณิตศาสตร์ว่าการสังเกตใกล้จุดสูงสุดนั้นมีส่วนช่วยในการวัดความโด่งโดยไม่คำนึงว่าจุดสูงสุดนั้นแบน, แหลม, bimodal, sinusoidal หรือรูประฆัง
Peter Westfall

คำตอบ:


8

มีเหตุผลที่ดีสำหรับคำจำกัดความเหล่านี้ซึ่งจะชัดเจนขึ้นเมื่อคุณดูรูปแบบทั่วไปสำหรับช่วงเวลาของตัวแปรสุ่มมาตรฐาน เพื่อตอบคำถามนี้ก่อนพิจารณารูปแบบทั่วไปของ TH มาตรฐานกลางช่วงเวลา :n

ϕn=E[(XE[X]S[X])n ].

ช่วงเวลากลางที่เป็นมาตรฐานสองช่วงแรกคือค่าและซึ่งมีไว้สำหรับการแจกแจงทั้งหมดที่มีการกำหนดปริมาณไว้ด้านบน ดังนั้นเราสามารถพิจารณาไม่น่ารำคาญช่วงเวลากลางมาตรฐานที่เกิดขึ้นสำหรับค่า3 เพื่อความสะดวกในการวิเคราะห์ของเราเรากำหนด:ϕ1=0ϕ2=1n3

ϕn+=E[|XE[X]S[X]|n |X>E[X]]P(X>E[X]),ϕn=E[|XE[X]S[X]|n |X<E[X]]P(X<E[X]).

เหล่านี้เป็นปริมาณที่ไม่ใช่เชิงลบที่ให้ TH แน่นอนอำนาจของเงื่อนไขตัวแปรสุ่มมาตรฐานบนมันจะสูงหรือต่ำกว่ามูลค่าที่คาดว่าจะ ตอนนี้เราจะสลายโมเมนต์ศูนย์กลางที่ได้มาตรฐานในส่วนเหล่านี้n


ค่าแปลก ๆ ของวัดความเบ้ที่หาง:nสำหรับค่าแปลก ๆ ของเรามีพลังแปลกในสมการโมเมนต์ดังนั้นเราจึงสามารถเขียนโมเมนต์ศูนย์กลางที่ได้มาตรฐานเป็น- จากแบบฟอร์มนี้เราจะเห็นว่าช่วงเวลากลางมาตรฐานทำให้เรามีความแตกต่างระหว่างพลังสัมบูรณ์ที่ของตัวแปรสุ่มมาตรฐานซึ่งมีเงื่อนไขว่าอยู่เหนือหรือต่ำกว่าค่าเฉลี่ยของมันตามลำดับn3ϕn=ϕn+ϕnn

ดังนั้นสำหรับพลังแปลก ๆเราจะได้รับการวัดที่ให้ค่าเป็นบวกหากพลังงานสัมบูรณ์ที่คาดหวังของตัวแปรสุ่มมาตรฐานสูงกว่าค่าที่สูงกว่าค่าเฉลี่ยต่ำกว่าค่าต่ำกว่าค่าเฉลี่ยและให้ค่าลบหากคาดว่า พลังงานสัมบูรณ์นั้นต่ำกว่าสำหรับค่าที่สูงกว่าค่าเฉลี่ยมากกว่าสำหรับค่าที่ต่ำกว่าค่าเฉลี่ย ปริมาณใด ๆ เหล่านี้อาจถูกพิจารณาอย่างสมเหตุสมผลว่าเป็นตัวชี้วัดประเภท "ความเบ้" ด้วยพลังที่สูงกว่าให้น้ำหนักสัมพัทธ์มากกว่าค่าที่อยู่ห่างจากค่าเฉลี่ยn3

เนื่องจากปรากฏการณ์นี้เกิดขึ้นกับพลังแปลก ๆ ทุกอย่างทางเลือกตามธรรมชาติสำหรับการวัดตามแบบฉบับของ "ความเบ้" คือการนิยามเป็นความเบ้ นี่คือช่วงเวลากลางมาตรฐานที่ต่ำกว่าพลังแปลก ๆ ที่สูงกว่าและเป็นเรื่องธรรมดาที่จะสำรวจช่วงเวลาที่มีลำดับต่ำกว่าก่อนที่จะพิจารณาช่วงเวลาที่สูงขึ้น ในสถิติเราได้นำการประชุมที่อ้างถึงช่วงเวลากลางที่เป็นมาตรฐานนี้มาเป็นความเบ้เนื่องจากเป็นช่วงเวลากลางที่มีมาตรฐานต่ำที่สุดที่ใช้วัดด้านนี้ของการกระจาย (พลังแปลก ๆ ที่สูงกว่านั้นก็วัดประเภทความเบ้ แต่ด้วยการเน้นค่าที่มากกว่าและไกลกว่าของค่าเฉลี่ย)n3ϕ3


ค่าแม้แต่วัดความอุดมสมบูรณ์ของหาง:nสำหรับค่าแม้ใด ๆ ของเรามีอำนาจแม้จะอยู่ในสมการในขณะนี้และเพื่อให้เราสามารถเขียนในขณะที่ภาคกลางมาตรฐานเป็น\ จากแบบฟอร์มนี้เราจะเห็นว่าช่วงเวลากลางที่เป็นมาตรฐานนั้นให้ผลรวมของกำลังสัมบูรณ์ที่ของตัวแปรสุ่มมาตรฐานซึ่งมีเงื่อนไขว่ามันอยู่เหนือหรือต่ำกว่าค่าเฉลี่ยของมันตามลำดับn3ϕn=ϕn++ϕnn

ดังนั้นสำหรับพลังงานใด ๆ แม้แต่เราจะได้รับการวัดที่ให้ค่าที่ไม่เป็นลบด้วยค่าที่สูงกว่าที่เกิดขึ้นหากส่วนท้ายของการแจกแจงของตัวแปรสุ่มมาตรฐานนั้นอ้วนขึ้น โปรดทราบว่านี่เป็นผลลัพธ์ที่เกี่ยวกับตัวแปรสุ่มมาตรฐานและดังนั้นการเปลี่ยนแปลงในระดับ (การเปลี่ยนแปลงความแปรปรวน) จึงไม่มีผลต่อการวัดนี้ มันเป็นเครื่องวัดความอ้วนของหางได้อย่างมีประสิทธิภาพหลังจากสร้างมาตรฐานสำหรับความแปรปรวนของการกระจาย ปริมาณใด ๆ เหล่านี้อาจถือได้ว่าเป็นตัวชี้วัดชนิดหนึ่งของ "kurtosis" ด้วยพลังที่สูงกว่าให้น้ำหนักสัมพัทธ์มากกว่าค่าที่อยู่ห่างจากค่าเฉลี่ยn3

เนื่องจากปรากฏการณ์นี้เกิดขึ้นสำหรับทุก ๆ แม้แต่ powerทางเลือกตามธรรมชาติสำหรับการวัดแบบดั้งเดิมของkurtosisคือการนิยามเป็น kurtosis นี่คือช่วงเวลากลางมาตรฐานที่ต่ำกว่าพลังที่สูงกว่าและเป็นธรรมดาที่จะสำรวจช่วงเวลาที่มีลำดับต่ำกว่าก่อนที่จะพิจารณาช่วงเวลาที่สูงขึ้น ในสถิติเราได้รับรองอนุสัญญาว่าด้วยช่วงเวลากลางที่เป็นมาตรฐานนี้ว่า "kurtosis" เนื่องจากเป็นช่วงเวลากลางที่มีมาตรฐานต่ำที่สุดที่ใช้วัดด้านนี้ของการกระจาย (ผู้มีอำนาจยิ่งใหญ่ยิ่งกว่านั้นยังสามารถวัดประเภทของความโด่งได้ แต่เน้นที่ค่านิยมที่มากกว่าและห่างไกลจากค่าเฉลี่ย)n3ϕ4


สมการนี้ถูกนิยามไว้อย่างดีสำหรับการแจกแจงใด ๆ ที่มีสองช่วงเวลาแรกและมีความแปรปรวนที่ไม่เป็นศูนย์ เราจะสมมติว่าการกระจายความสนใจตกอยู่ในคลาสนี้สำหรับการวิเคราะห์ที่เหลือ


2

คำถามที่คล้ายกัน'ช่วงเวลา' เกี่ยวกับ 'ช่วงเวลา' ของการแจกแจงความน่าจะเป็นอย่างไร ฉันให้คำตอบทางกายภาพกับสิ่งที่แก้ไขเวลา

"ความเร็วเชิงมุมเป็นอนุพันธ์ของความเร็วเชิงมุมซึ่งเป็นอนุพันธ์ของมุมเทียบกับเวลาคือ . พิจารณาว่าโมเมนต์ที่สองนั้นคล้ายกับแรงบิดที่ใช้กับการเคลื่อนที่แบบวงกลมหรือถ้าคุณจะทำการเร่งความเร็ว / ความเร่ง (เช่นอนุพันธ์อันดับสอง) ของการเคลื่อนที่แบบวงกลมนั้น (เช่นแองกูลาร์, ) ในทำนองเดียวกัน เป็นอัตราการเปลี่ยนแปลงของแรงบิดและอื่น ๆ สำหรับช่วงเวลาที่สูงขึ้นเพื่อให้อัตราการเปลี่ยนแปลงของอัตราการเปลี่ยนแปลงของอัตราการเปลี่ยนแปลงคืออนุพันธ์ตามลำดับของการเคลื่อนที่แบบวงกลม .... "dωdt=α,dθdt=ωθ

ดูลิงก์เนื่องจากอาจทำให้เห็นภาพตัวอย่างนี้ได้ง่ายขึ้น

ง่ายต่อการเข้าใจความเบ้ง่ายกว่าเคิร์ตซีส ลบความเบ้เป็นหางซ้ายที่หนักกว่า (หรือทิศทางลบด้านนอก) กว่าทางด้านขวาและความเบ้บวกในทางตรงกันข้าม

วิกิพีเดียอ้างอิง Westfall (2014) และบอกเป็นนัยว่า kurtosis สูงเกิดขึ้นสำหรับตัวแปรสุ่มที่มีค่าผิดปกติไกลหรือฟังก์ชันความหนาแน่นที่มีหางหนาหนึ่งหรือสองตัวในขณะที่อ้างว่าแนวโน้มของข้อมูลหรือความหนาแน่นส่วนกลางมีผลค่อนข้างน้อยต่อค่า kurtosis ค่า kurtosis ที่ต่ำจะบ่งบอกถึงความตรงกันข้ามนั่นคือการขาด -axis outliers และค่าความสว่างสัมพัทธ์ของหางทั้งสองx


เบ้เป็นจุดสมดุลของไฟล์ PDF ของและโด่งเป็นจุดสมดุลของไฟล์ PDF ของ 4 การเปลี่ยนแปลงทั้งสอง "ยืด" ก้อย kurtosis มากขึ้น หาก pdf ของตกลงไปทางด้านขวาเมื่อวางจุดศูนย์กลางที่ 0 แสดงว่ามีการเอียงเชิงบวกในการแจกแจงเริ่มต้น หาก pdf ของตกลงไปทางด้านขวาเมื่อวางศูนย์กลางไว้ที่ 3.0 แสดงว่าการกระจายแบบดั้งเดิมนั้นหนักกว่าการกระจายแบบปกติ ที่นี่ "ความหนักเบาของก้อย" หมายถึงการยกระดับความแม่นยำมากกว่ามวล การตีความของ Moors ไม่ถูกต้องนักทั้งสองกล่าวถึง "สมาธิ" Z3Z4Z3Z4
Peter Westfall

@PeterWestfall ฉันยอมรับว่าการตีความของ Moors นั้นไม่สมบูรณ์ ภาษาที่แม่นยำไม่สามารถทำได้อย่างง่ายดายโดยไม่สับสน ยกตัวอย่างเช่น "leverage" เลเวอเรจหมายถึงช่วงเวลาแรกและสิ่งหนึ่งจะต้องประดิษฐ์บางสิ่งเช่น "เลเวอเรจเลเวอเรจ" ในช่วงเวลาที่สองซึ่งอาจสร้างความสับสนมากกว่าการส่องสว่าง วิธีการของคุณดูเหมือนจะคิดค้นแนวคิดใหม่ ๆ เช่น "การใช้ประโยชน์จากการยืด" ซึ่งเป็นคำแนะนำในการแปลงรูปทรงเรขาคณิตซึ่งใครบางคนอาจอ้างว่ามีผู้สนับสนุนบางคนที่เห็นว่าตนเองมีความเสี่ยงต่อการถูกโต้เถียงและไม่ใช่ผู้อื่น .
Carl

"Leverage" หมายถึงช่วงเวลาแรกของตัวแปรที่ 4 มันไม่ใช่วิทยาศาสตร์จรวด UU=Z4
Peter Westfall

@PeterWestfall ไม่ให้ลงโทษเกินไป แต่คุณใช้ประโยชน์จากการยกระดับ แน่นอนว่าคุณยังคงสามารถใช้คำได้และถ้าไม่ใช่วัตถุมิติที่สี่เมื่อเปรียบเทียบกับระยะห่างหนึ่งมิติก็อาจเป็นประโยชน์ได้ บริบทที่นี่คือช่วงเวลาและการสร้างแบบจำลองทางกายภาพสำหรับช่วงเวลา มีหลายวิธีที่สามารถทำได้เช่นให้ดูคำตอบของฉันเกี่ยวกับที่นี่ กล่าวอีกนัยหนึ่งเพื่อให้ช่วงเวลาในบริบททางกายภาพใด ๆ เราต้องทำมากกว่าการโบกมือและขอร้องในมิติที่สี่ Z4Z
Carl

@PeterWestfall ในบริบทของการเคลื่อนที่แบบวงกลมเราจะเรียกแรงบิดช่วงเวลาที่สองและไม่ใช่การใช้ประโยชน์ของซึ่งต่อมาแม้ว่าจะไม่ถูกต้องก็ตาม Z2
Carl
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.