ข้อใดมีหางที่หนักกว่า lognormal หรือแกมม่า


41

(นี่เป็นคำถามที่เพิ่งมาหาฉันทางอีเมลฉันได้เพิ่มบริบทบางส่วนจากบทสนทนาสั้น ๆ ก่อนหน้านี้กับบุคคลเดียวกัน)

เมื่อปีที่แล้วมีคนบอกว่าการกระจายตัวของแกมม่านั้นหนักกว่า lognormal และตั้งแต่นั้นมาฉันก็บอกว่านั่นไม่ใช่กรณี

  • ซึ่งเป็นนกที่หนักกว่า?

  • ทรัพยากรบางอย่างที่ฉันสามารถใช้เพื่อสำรวจความสัมพันธ์มีอะไรบ้าง


3
สำหรับบุคคลที่เพิ่งถูกลดระดับลง: จะเป็นประโยชน์ในการทราบว่าปัญหาการรับรู้ของคำถามคืออะไร
Glen_b

1
ไม่ใช่ฉันฉันโหวตขึ้นนานแล้ว อย่างไรก็ตามฉันสงสัยว่ามันเกี่ยวกับการใช้ประโยชน์จากความหนักอึ้งเทียบกับความรุนแรงในบริบทของสมมติฐานการทดสอบ t ในการปรากฏตัวของค่าผิดปกติซึ่งไม่มีอะไรเกี่ยวข้องกับสิ่งที่คุณถาม downvoting คือ IMHO, ปัญหา
Carl

คำตอบ:


41

หาง (ขวา) ของการแจกแจงอธิบายพฤติกรรมของมันที่ค่าขนาดใหญ่ วัตถุที่ถูกต้องเพื่อการศึกษาไม่ได้เป็นความหนาแน่น - ซึ่งในกรณีปฏิบัติจำนวนมากไม่ได้อยู่ - แต่ฟังก์ชั่นการกระจายFFโดยเฉพาะอย่างยิ่งเนื่องจากFต้องเพิ่มขึ้น asymptotically เป็น1สำหรับการโต้แย้งขนาดใหญ่x (ตามกฎความน่าจะเป็นรวม) เราสนใจว่ามันเข้าใกล้เส้นกำกับอย่างรวดเร็วเพียงใด: เราต้องตรวจสอบพฤติกรรมของฟังก์ชันการอยู่รอดของ 1F(x)เป็นx

FXG FGx0x>x0

PrF(X>x)=1F(x)>1G(x)=PrG(X>x).

รูป

เส้นโค้งสีแดงในรูปนี้เป็นฟังก์ชั่นสำหรับการอยู่รอดปัวซองการจัดจำหน่าย เส้นโค้งสีน้ำเงินสำหรับการแจกแจงแกมม่าซึ่งมีความแปรปรวนเหมือนกัน ในที่สุดเส้นโค้งสีน้ำเงินมักจะเกินกว่าเส้นโค้งสีแดงแสดงว่าการกระจายแกมมานี้มีหางที่หนักกว่าการกระจายปัวซอง การกระจายเหล่านี้ไม่สามารถเปรียบเทียบได้อย่างง่ายดายโดยใช้ความหนาแน่นเนื่องจากการแจกแจงปัวซองนั้นไม่มีความหนาแน่น(3)(3)

มันเป็นความจริงที่ว่าเมื่อความหนาแน่น และที่มีอยู่และสำหรับแล้วจะหนักกว่านกGอย่างไรก็ตามการสนทนาเป็นเท็จ - และนี่คือเหตุผลที่น่าสนใจในการกำหนดนิยามของความหนักเบาของหางบนหน้าที่การอยู่รอดมากกว่าความหนาแน่นแม้ว่าบ่อยครั้งการวิเคราะห์หางอาจทำได้ง่ายขึ้นโดยใช้ความหนาแน่นfgf(x)>g(x)x>x0FG

ตัวอย่างเคาน์เตอร์สามารถสร้างขึ้นได้โดยการแจกแจงแบบไม่ต่อเนื่องของการสนับสนุนแบบไม่มีขอบเขตที่เป็นบวกซึ่งอย่างไรก็ตามจะไม่หนักกว่า (discretizingจะทำเคล็ดลับ) เปลี่ยนสิ่งนี้เป็นการกระจายอย่างต่อเนื่องโดยแทนที่ความน่าจะเป็นของที่แต่ละจุดสนับสนุน , เขียน , โดย (พูด) การกระจายเบต้าปรับขนาดด้วยการสนับสนุนในช่วงเวลาที่เหมาะสมและถ่วงน้ำหนักด้วย(k) ระบุจำนวนบวกเล็กน้อยเลือกHGGHkh(k)(2,2)[kε(k),k+ε(k)]h(k)δ,ε(k)ขนาดเล็กพอที่จะให้แน่ใจว่ามีความหนาแน่นสูงสุดของการกระจายนี้เบต้าปรับขนาดเกินfจากการก่อสร้างส่วนผสมคือการกระจายอย่างต่อเนื่องซึ่งหางของมันดูเหมือน (มันค่อนข้างสม่ำเสมอเล็กน้อยโดยมีจำนวน ) แต่มีหนามแหลม ความหนาแน่นในการสนับสนุนของและ spikes ทุกคนมีจุดที่พวกเขาเกินความหนาแน่นของฉดังนั้นมีน้ำหนักเบากว่านกแต่ไม่ว่าไกลออกไปในหางที่เราจะไปไม่ว่าจะมีจุดที่มีความหนาแน่นสูงกว่าของFf(k)/δδH+(1δ)GGGδHfGFF

รูป

เส้นโค้งสีแดงคือ PDF ของการแจกแจงแกมมา , เส้นโค้งสีทองเป็น PDF ของการแจกแจงแบบปกติ , และเส้นโค้งสีน้ำเงิน (พร้อมเดือย) คือ PDF ของการผสมสร้างขึ้นในตัวอย่าง (สังเกตความหนาแน่นแกนลอการิทึม) ฟังก์ชันการอยู่รอดของอยู่ใกล้กับการแจกแจงแกมม่า (ที่มีการสลายตัวของวิกอย่างรวดเร็ว): ในที่สุดมันจะเติบโตน้อยกว่าของถึงแม้ว่า PDF จะพุ่งขึ้นเหนือเสมอ ของไม่ว่าหางเราจะมองออกไปไกลแค่ไหนGFGGFF


อภิปรายผล

อนึ่งเราสามารถทำการวิเคราะห์นี้โดยตรงในฟังก์ชันการอยู่รอดของ lognormal และ Gamma distributions, ขยายพวกมันไปรอบ ๆเพื่อค้นหาพฤติกรรมเชิงซีโมติคและสรุปว่า lognormals ทั้งหมดมีหางที่หนักกว่า Gammas ทั้งหมด แต่เนื่องจากการแจกแจงเหล่านี้มีความหนาแน่น "ดี" การวิเคราะห์จึงทำได้ง่ายขึ้นโดยแสดงให้เห็นว่าสำหรับมีขนาดใหญ่เพียงพอความหนาแน่น lognormal เกินความหนาแน่นแกมมา อย่างไรก็ตามเราอย่าสับสนระหว่างความสะดวกในการวิเคราะห์กับความหมายของหางที่หนักx=x

ในทำนองเดียวกันแม้ว่าช่วงเวลาที่สูงขึ้นและสายพันธุ์ของพวกเขา (เช่นความเบ้และความโด่ง) พูดเพียงเล็กน้อยเกี่ยวกับหางพวกเขาไม่ได้ให้ข้อมูลที่เพียงพอ ตัวอย่างง่ายๆเราอาจตัดทอนการแจกแจงแบบปกติใด ๆ ที่มีค่ามากจนช่วงเวลาใดก็ตามที่กำหนดจะเปลี่ยนแปลงแทบจะไม่ - แต่การทำเช่นนี้เราจะเอาหางของมันออกทั้งหมดทำให้มันเบากว่าการกระจายใด ๆ การสนับสนุน (เช่น Gamma)

การคัดค้านอย่างยุติธรรมต่อการคำนวณทางคณิตศาสตร์เหล่านี้จะชี้ให้เห็นว่าพฤติกรรมที่อยู่ในหางไม่มีการใช้งานจริงเพราะไม่มีใครเคยเชื่อว่าแบบจำลองการกระจายใด ๆ จะใช้ได้จริงในค่าสุดขีด อย่างไรก็ตามนั่นแสดงให้เห็นว่าในแอปพลิเคชั่นเราควรระมัดระวังในการระบุส่วนหางที่เกี่ยวข้องและวิเคราะห์ตามนั้น (ตัวอย่างเช่นเวลาการเกิดซ้ำของน้ำท่วมสามารถเข้าใจได้ในกรณีนี้: น้ำท่วม 10 ปีน้ำท่วม 100 ปีและ 1,000 ปีน้ำท่วมลักษณะส่วนเฉพาะของหางของการกระจายน้ำท่วม) หลักการเดียวกันนำไปใช้แม้ว่า: วัตถุพื้นฐานของการวิเคราะห์ที่นี่คือฟังก์ชั่นการกระจายและไม่ใช่ความหนาแน่น


6
+1 การอภิปรายที่ยอดเยี่ยมว่าทำไมจึงควรขึ้นอยู่กับฟังก์ชั่นผู้รอดชีวิต ฉันได้แนะนำแหล่งที่มาดั้งเดิมของคำถามว่าควรดูคำตอบของคุณ
Glen_b

1
(+1) สำหรับการสนทนาความน่าจะเป็นที่ดีของวิธีการตีความฟังก์ชันการอยู่รอด

คำจำกัดความของ tails หนักนี้ใช้ได้เหมือนหนึ่งนิยาม แต่มันก็มีปัญหาร้ายแรง โดยเฉพาะอย่างยิ่งมีการแจกแจงแบบ จำกัด ที่มีเนื้อหาที่มีหางหนาเช่น. 9999 * U (-1,1) + .0001 * U (-1000,1000) การกระจาย โดยการกำหนด "คำจำกัดความ" การแจกแจง N (0,1) มีหางที่หนักกว่าการแจกแจง. 9999 * U (-1,1) + .0001 * U (-1000,1000) เห็นได้ชัดว่าโง่ ลองหน้ากันเถอะ: มีหลายวิธีในการวัดความหางของการแจกแจง
Peter Westfall

1
@Peter "ความโง่เขลา" เกิดขึ้นเพราะคุณดูเหมือนจะได้รับความคิดย้อนหลัง ตัวอย่างของคุณไม่มีหาง "หนัก" ในแง่ใดเพราะมันถูก จำกัด ทั้งสองฟังก์ชั่นการเอาชีวิตรอดในที่สุดนั้นเป็นศูนย์อย่างแน่นอน
whuber

1
@PeterWestfall คุณได้เปรียบเทียบหางที่มีขอบเขตการสนับสนุนกับผู้ที่มีการสนับสนุนที่ไม่มีที่สิ้นสุดราวกับว่ามันมีความหมาย บริบทจำนวนมากมีอยู่ซึ่งจะไม่จำเป็นโง่แม้กระทั่ง ในบริบทเหล่านั้นที่หนึ่งจะเปรียบเทียบพวกเขาอัตราส่วนความแตกต่าง quantile อาจเหมาะสม มีบริบทไม่มากไปกว่านั้นและถ้าคุณนึกถึงได้
Carl

30

แกมม่าและ lognormal มีทั้งการแจกแจงความเบ้ขวาสัมประสิทธิ์คงที่ของการเปลี่ยนแปลงในและพวกเขามักจะเป็นพื้นฐานของแบบจำลอง "การแข่งขัน" สำหรับปรากฏการณ์บางชนิด(0,)

มีหลายวิธีในการกำหนดความหนักเบาของหาง แต่ในกรณีนี้ฉันคิดว่าคนปกติทุกคนแสดงว่า lognormal หนักกว่า (สิ่งที่คนแรกอาจพูดถึงคือสิ่งที่เกิดขึ้นไม่ได้อยู่ในหางไกล แต่ทางด้านขวาของโหมด (พูดราว ๆ 75 เปอร์เซ็นไทล์บนพล็อตแรกด้านล่างซึ่งสำหรับ lognormal อยู่ต่ำกว่า 5 และแกมม่าที่สูงกว่า 5. )

อย่างไรก็ตามเรามาสำรวจคำถามด้วยวิธีง่าย ๆ ในการเริ่มต้น

ด้านล่างคือความหนาแน่นแกมมาและ lognormal ที่มีค่าเฉลี่ย 4 และความแปรปรวน 4 (พล็อตด้านบน - แกมม่าเป็นสีเขียวเข้ม, lognormal เป็นสีน้ำเงิน) จากนั้นบันทึกของความหนาแน่น (ด้านล่าง) เพื่อให้คุณสามารถเปรียบเทียบแนวโน้มในก้อย:

ป้อนคำอธิบายรูปภาพที่นี่

เป็นการยากที่จะเห็นรายละเอียดมากมายในพล็อตด้านบนเนื่องจากการกระทำทั้งหมดอยู่ทางขวาของ 10 แต่มันค่อนข้างชัดเจนในพล็อตที่สองที่แกมม่ามุ่งหน้าลงอย่างรวดเร็วมากกว่า lognormal

วิธีการสำรวจความสัมพันธ์ก็คือการมองไปที่ความหนาแน่นของการบันทึกเช่นเดียวกับในคำตอบที่นี่ ; เราเห็นว่าความหนาแน่นของท่อนซุงสำหรับ lognormal นั้นสมมาตร (มันเป็นเรื่องปกติ!) และสำหรับแกมม่านั้นเอียงซ้ายโดยมีหางแสงอยู่ทางขวา

เราสามารถทำพีชคณิตได้โดยที่เราสามารถดูอัตราส่วนของความหนาแน่นเป็น (หรือบันทึกของอัตราส่วน) ให้เป็นความหนาแน่นแกมมาและ lognormal:xgf

log(g(x)/f(x))=log(g(x))log(f(x))

=log(1Γ(α)βαxα1ex/β)log(12πσxe(log(x)μ)22σ2)

=k1(α1)log(x)x/β(k2log(x)(log(x)μ)22σ2)

=[c(α2)log(x)+(log(x)μ)22σ2]x/β

ระยะใน [] เป็นกำลังสองในในขณะที่ระยะเวลาที่เหลือจะลดลงเป็นเส้นตรงในxไม่ว่าอะไรก็ตามในที่สุดจะลดลงเร็วกว่ากำลังสองเพิ่มขึ้นโดยไม่คำนึงว่าค่าพารามิเตอร์คืออะไร ในขอบเขตที่อัตราส่วนของความหนาแน่นลดลงต่อซึ่งหมายความว่าแกมม่า pdf ในที่สุดก็เล็กกว่า lognormal pdf และมันก็ลดลงค่อนข้าง หากคุณเลือกอัตราส่วนด้วยวิธีอื่น (โดยมี lognormal อยู่ด้านบน) ในที่สุดอัตราส่วนดังกล่าวจะต้องเพิ่มขึ้นเกินขอบเขตที่กำหนดlog(x)xx/βx

นั่นคือ lognormal ใดก็ตามในที่สุดก็หนักเทลด์กว่าใด ๆแกมมา


คำจำกัดความอื่น ๆ ของความหนักเบา:

บางคนมีความสนใจเรื่องความเบ้หรือความโด่งเพื่อวัดความหนักเบาของหางขวา ที่ค่าสัมประสิทธิ์ที่กำหนดของความแปรปรวนlognormalทั้งเอียงมากขึ้นและมี kurtosis สูงกว่าแกมมา **

ตัวอย่างเช่นกับเบ้แกมมามีความเบ้ของ 2CV ขณะ lognormal เป็น 3CV + CV 33

มีคำจำกัดความทางเทคนิคของมาตรการต่าง ๆ ว่าหางอยู่ที่นี่อย่างไร คุณอาจต้องการลองบางตัวที่มีการแจกแจงสองแบบนี้ lognormal เป็นกรณีพิเศษที่น่าสนใจในนิยามแรก - ทุกช่วงเวลามีอยู่ แต่ MGF ของมันไม่ได้บรรจบกันมากกว่า 0 ในขณะที่ MGF สำหรับ Gamma จะรวมตัวกันในละแวกใกล้เคียงศูนย์

-

** ตามที่ Nick Cox กล่าวไว้ด้านล่างการเปลี่ยนแปลงตามปกติเพื่อประมาณค่าปกติสำหรับแกมม่าการแปลงแบบ Wilson-Hilferty นั้นอ่อนแอกว่าบันทึก - มันเป็นการแปลงรูทแบบลูกบาศก์ ที่ค่าขนาดเล็กของพารามิเตอร์รูปร่างรูตที่สี่ถูกกล่าวถึงแทนดูการอภิปรายในคำตอบนี้แต่ในกรณีใดกรณีหนึ่งเป็นการเปลี่ยนแปลงที่อ่อนแอกว่าเพื่อให้ได้ใกล้เคียงกับมาตรฐาน

การเปรียบเทียบความเบ้ (หรือ kurtosis) ไม่แนะนำความสัมพันธ์ที่จำเป็นในหางที่รุนแรง - มันบอกเราบางอย่างเกี่ยวกับพฤติกรรมโดยเฉลี่ย แต่มันอาจจะทำงานได้ดีกว่าถ้าจุดเดิมไม่ได้ถูกสร้างขึ้นมาจากหางที่รุนแรง


ทรัพยากร : มันง่ายที่จะใช้โปรแกรมเช่น R หรือ Minitab หรือ Matlab หรือ Excel หรืออะไรก็ตามที่คุณชอบที่จะวาดความหนาแน่นและความหนาแน่นของบันทึกและบันทึกอัตราส่วนความหนาแน่น ... และอื่น ๆ เพื่อดูว่ามีอะไรเกิดขึ้นบ้างในบางกรณี นั่นคือสิ่งที่ฉันขอแนะนำให้เริ่มต้นด้วย


4
อันที่จริงมันแนะนำว่า, แต่ไม่มีความสัมพันธ์ที่จำเป็นระหว่างความแหลม, หนักหางและความโด่ง; มีตัวอย่างการตอบสนองต่อความคาดหวังดังกล่าวดังนั้นเราจึงต้องระวัง พล็อตที่สองยืนยันความสงสัยว่า
Glen_b

5
นี่คือหนึ่งซับ มันเป็นคำจำกัดความที่จำเป็นต้องมีการแปลงบันทึกเพื่อสร้างบันทึกปกติ มันเป็นการประมาณที่ดีที่คิวบ์รูททำให้แกมมาเป็นปกติ (Wilson-Hilferty เป็นคำสองคำที่ชาญฉลาด) การกระจายที่ต้องการการเปลี่ยนแปลงที่แข็งแกร่งยิ่งขึ้นคือ "ไกลออกไป" จากปกติหรือเกาส์เซียน
นิคค็อกซ์

2
@Glen_b ฉันแค่เพิ่มการตกแต่งเล็กน้อยให้กับเค้กที่ดูดีมาก ๆ ของคุณ
Nick Cox

2
@Nick Cox ฉันไม่เห็นด้วยกับข้อความที่เกี่ยวกับการเปลี่ยนแปลง ส่วนที่ผิดกฏหมายทางคณิตศาสตร์คือข้อสรุปที่คุณพยายามจะวาด: จากข้อเท็จจริงที่ว่าลอการิทึมทำให้ lognormal เป็นปกติและรูตคิวบ์ทำให้แกมม่าประมาณปกติคุณไม่สามารถวาดข้อสรุปใด ๆเกี่ยวกับก้อยของทั้งคู่
whuber

2
ขอบคุณ; ประเด็นของคุณชัดเจนสำหรับฉัน แต่ฉันใช้ถ้อยคำ "กฎของหัวแม่มือ" ของฉันและเรียกใช้ประสบการณ์ด้วย เห็นได้ชัดว่าฉันไม่มีทฤษฎีบท
Nick Cox

7

แม้ว่า kurtosis จะสัมพันธ์กับความหนักของหาง แต่มันก็มีส่วนช่วยให้เกิดความคิดเกี่ยวกับการกระจายตัวของไขมันที่หางและค่อนข้างที่จะลดความหนักของหางตามที่แสดงในตัวอย่าง ที่นี่ตอนนี้ฉันสำรอกสิ่งที่ฉันได้เรียนรู้ในโพสต์ด้านบนและด้านล่างซึ่งเป็นความคิดเห็นที่ยอดเยี่ยมจริงๆ ครั้งแรกที่บริเวณหางด้านขวาเป็นพื้นที่จาก x เพื่อของฟังก์ชั่นความหนาแน่น AKA ฟังก์ชั่นการอยู่รอด(t) สำหรับการแจกแจงแบบปกติและการแจกแจงแกมม่าf(x)1F(t)e(log(x)μ)22σ22πσx;x0βαxα1eβxΓ(α);x0ให้เราเปรียบเทียบฟังก์ชั่นการเอาชีวิตรอดของพวกเขาและแบบกราฟิก ในการทำเช่นนี้ฉันได้ตั้งค่าความแปรปรวนตามลำดับและเช่นเดียวกับ kurtoses ส่วนเกินของพวกเขาและเท่ากับโดยเลือกและแก้ไขสำหรับ0.335421 การแสดงนี้12erfc(log(x)μ2σ)Q(α,βx)=Γ(α,βx)Γ(α)(eσ21)e2μ+σ2αβ23e2σ2+2e3σ2+e4σ266αμ=0,σ=0.8α0.19128,β0.3354211-F (x) สำหรับ LND เป็นสีน้ำเงินและ GD เป็นสีส้ม

ฟังก์ชั่นการอยู่รอดสำหรับการกระจาย lognormal (LND) ในสีฟ้าและแกมมาการกระจาย (GD) ในสีส้ม สิ่งนี้นำเราไปสู่การเตือนครั้งแรกของเรา นั่นคือถ้าพล็อตนี้เป็นสิ่งที่เราต้องตรวจสอบเราอาจสรุปได้ว่าหางของ GD นั้นหนักกว่า LND นั่นไม่ใช่กรณีนี้แสดงโดยการขยายค่าแกน x ของพล็อตดังนั้น 1-F (x) สำหรับกราฟอีกต่อไป LND และ GD

พล็อตนี้แสดงให้เห็นว่า 1) แม้จะมีเคิร์ตที่เท่ากัน แต่พื้นที่หางด้านขวาของ LND และ GD สามารถแตกต่างกันได้ 2) การตีความกราฟิกเพียงอย่างเดียวมีอันตรายเนื่องจากสามารถแสดงผลลัพธ์สำหรับค่าพารามิเตอร์คงที่ในช่วงที่ จำกัด เท่านั้น ดังนั้นจึงมีความจำเป็นที่จะต้องค้นหานิพจน์ทั่วไปเพื่อ จำกัด ฟังก์ชันอัตราการรอดชีวิตของx)} ฉันไม่สามารถทำสิ่งนี้ได้ด้วยการขยายซีรี่ส์ไม่ จำกัด อย่างไรก็ตามฉันสามารถทำสิ่งนี้ได้โดยใช้ตัวกลางของฟังก์ชันเทอร์มินัลหรือซีมโทติคซึ่งไม่ใช่ฟังก์ชั่นที่ไม่ซ้ำกันและที่ที่มือขวาก้มแล้วเพียงพอสำหรับและlimxS(LND,x)S(GD,x)limxF(x)G(x)=1F(x)G(x)ที่จะเป็นซีมโทติคร่วมกัน ด้วยความระมัดระวังอย่างเหมาะสมในการค้นหาฟังก์ชันเหล่านี้จึงมีศักยภาพในการระบุชุดย่อยของฟังก์ชันที่ง่ายกว่าฟังก์ชั่นการเอาชีวิตรอดซึ่งสามารถใช้ร่วมกันหรือจัดขึ้นร่วมกันกับฟังก์ชั่นความหนาแน่นมากกว่าหนึ่งตัวอย่างเช่น หางชี้แจงที่ จำกัด ในรุ่นก่อนหน้าของโพสต์นี้นี่คือสิ่งที่ฉันหมายถึงว่า "เพิ่มความซับซ้อนของการเปรียบเทียบฟังก์ชั่นการอยู่รอด" โปรดทราบว่าและ (บังเอิญและไม่จำเป็นต้องและlimuerfc(u)eu2πu=1limuΓ(α,u)euuα1=1erfc(u)<eu2πuΓ(α,u)<euuα1-1} นั่นคือไม่จำเป็นต้องเลือกขอบเขตบนเป็นเพียงฟังก์ชัน asymptotic) ที่นี่เราเขียนและโดยที่อัตราส่วนของคำศัพท์ด้านขวามือมีขีด จำกัด เท่ากับเป็นเงื่อนไขด้านซ้าย ลดความซับซ้อนของอัตราส่วนการ จำกัด ของคำศัพท์ด้านขวา12erfc(log(x)μ2σ)<e(log(x)μ2σ)22(π(log(x)μ))2σΓ(α,βx)Γ(α)<eβx(βx)α1Γ(α)xlimxσΓ(α)(βx)1αeβx(μlog(x))22σ22π(log(x)μ)=หมายความว่าสำหรับ x ใหญ่เพียงพอพื้นที่หาง LND คือ มีขนาดใหญ่เท่าที่เราต้องการเปรียบเทียบกับพื้นที่หาง GD โดยไม่คำนึงว่าค่าพารามิเตอร์คืออะไร ที่ทำให้เกิดปัญหาอื่นเราไม่ได้มีวิธีแก้ปัญหาที่เป็นจริงสำหรับค่าพารามิเตอร์ทั้งหมดดังนั้นการใช้ภาพประกอบกราฟิกเพียงอย่างเดียวอาจทำให้เข้าใจผิด ยกตัวอย่างเช่นการกระจายแกมมาบริเวณหางด้านขวาเป็นมากกว่าพื้นที่หางกระจายชี้แจงเมื่อน้อยกว่าชี้แจงเมื่อและ GD เป็นว่าการกระจายชี้แจงเมื่อ 1α<1α>1α=1

อะไรคือการใช้ลอการิทึมของอัตราส่วนของฟังก์ชันการเอาชีวิตรอดเนื่องจากเราไม่จำเป็นต้องใช้ลอการิทึมเพื่อหาอัตราส่วน จำกัด ? ฟังก์ชั่นการแจกแจงจำนวนมากมีคำอธิบายแบบเอ็กซ์โปเนนเชียลที่ดูง่ายขึ้นเมื่อนำลอการิทึมมาใช้และหากอัตราส่วนไปถึงค่าอนันต์ในขีด จำกัด เมื่อ x เพิ่มขึ้นค่าลอการิทึมก็จะทำได้เช่นกัน ในกรณีของเรานั่นจะทำให้เราสามารถตรวจสอบซึ่งบางคนอาจดูง่ายกว่า สุดท้ายถ้าอัตราส่วนของฟังก์ชั่นการเอาชีวิตรอดเป็นศูนย์แล้วลอการิทึมของอัตราส่วนนั้นจะไปที่limx(log(σΓ(α)(βx)1α2π(log(x)μ))+βx(μlog(x))22σ2)=และในทุกกรณีหลังจากหาขีด จำกัด ของลอการิทึมของอัตราส่วนเราต้องใช้ antilogarithm ของค่านั้นเพื่อทำความเข้าใจความสัมพันธ์กับค่า จำกัด ของอัตราส่วนทั่วไปของฟังก์ชันการอยู่รอด


2
ในกรณีนี้ (และบ่อยครั้งในกรณีที่มีความสนใจ) สูงกว่า kurtosis สอดคล้องกับหางที่หนักกว่า แต่เป็นข้อเสนอทั่วไปนี้ไม่ได้เป็นกรณี - counterexamples ง่ายต่อการสร้าง
Glen_b

1
1. ฉันไม่รู้วิธีทั่วไปที่เปรียบเทียบกับก้อยโดยตรง 2. อะไรคือสิ่งที่ซับซ้อนกว่านี้? คำตอบของ whuber แสดงให้เราเห็นว่าทำไมมีปัญหากับการมองอะไร แต่ฟังก์ชั่นผู้รอดชีวิต (สำหรับหางขวา); เขาอธิบายถึงสาเหตุที่คุณไม่สามารถเปรียบเทียบไฟล์ PDF ในรายละเอียดได้ นอกจากนี้การเปรียบเทียบมักจะมีความซับซ้อนน้อยกว่าการเปรียบเทียบ kurtosis เช่นกัน (ในหางด้านซ้ายคุณจะต้องเปรียบเทียบโดยตรง แต่นั่นไม่ใช่ปัญหาสำหรับคำถามนี้)S(x)=1F(x)F(x)
Glen_b

2
ฉันยังทราบด้วยว่าคุณพูดว่า "นี่เกี่ยวข้องกับทฤษฎีบทชั่วครู่ที่บอกว่าถ้า (ทั้งหมดหรือไม่) ช่วงเวลาของการแจกแจงสองครั้งนั้นเท่ากันแล้วการแจกแจงก็เหมือนกัน" - แม้ว่าทุกช่วงเวลาของการแจกแจงสองครั้งเท่ากันการแจกแจงนั้นไม่จำเป็นต้องเหมือนกัน ตัวอย่างมีการหารือกันในคำตอบของคำถามมากมายที่นี่ในประวัติย่อ คุณต้องการมากกว่าช่วงเวลาที่เท่ากันทั้งหมด - คุณต้องมี MGF อยู่ในละแวกที่ 0
Glen_b

1
@PeterWestfall การสนับสนุนแบบกึ่งไม่มีที่สิ้นสุดมักถูกสมมติเช่นสำหรับความเข้มข้นของยาในพลาสมาในเลือด ในกรณีดังกล่าวความหนักหางจะตัดสินว่าเวลาที่อยู่อาศัยเฉลี่ยของยาเสพติดในร่างกายวัดสิ่งใด (เช่นการแจกแจงแบบเอ็กซ์โปเนนเชียล) หรือไม่ (เช่นการแจกแจงแบบพาเรโต) 0t<
Carl

1
ฉัน @PeterWestfall จะได้รับจุดของคุณคล้ายกับnma.berkeley.edu/ark:/28722/bk000471p7j มันเป็นหน้าที่ที่จะต้องจำไว้ว่าการกระจายทุกครั้งแสดงถึงมาตรการที่แตกต่างกันสำหรับสิ่งที่แตกต่าง ตัวอย่างเช่นค่าสุดขีดเฉลี่ยคือ MVUE สำหรับที่ตั้งของการแจกแจงแบบสม่ำเสมอไม่ใช่ค่าเฉลี่ยและไม่ใช่ค่ามัธยฐาน ระหว่างค่าสุดขีดเหล่านั้นก้อยนั้นหนัก แต่ข้างนอกนั้นก้อยนั้นมีซิป สิ่งที่เกี่ยวข้องกับช่วงเวลาที่สูงขึ้นเช่นความโด่งเมื่อช่วงเวลาแรกไม่ใช่ MVUE ฉันไม่อยากเดา บางสิ่งบางอย่างอาจ แต่อะไร
Carl
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.