ทำไมการแจกแจงโคชีจึงไม่มีความหมาย?


109

จากฟังก์ชันความหนาแน่นของการกระจายเราสามารถระบุค่าเฉลี่ย (= 0) สำหรับการแจกแจงโคชีเช่นเดียวกับกราฟด้านล่างที่แสดง แต่ทำไมเราถึงบอกว่าการกระจาย Cauchy นั้นไม่มีความหมายเลย?

ป้อนคำอธิบายรูปภาพที่นี่


2
ฉันแนะนำอ้างอิง Cabeza G. , UA (2013) La Media de la Distribución de Cauchy ในบล็อกApoyo en Matemáticasเกี่ยวกับค่าเฉลี่ยของการแจกแจงโคชี

ตอบคำถามของฉันได้ที่นี่: stats.stackexchange.com/questions/94402/…
kjetil b halvorsen

คำตอบ:


99

คุณสามารถตรวจสอบได้โดยอัตโนมัติว่าไม่มีค่าที่คาดหวัง แต่ควรจะเข้าใจได้ง่ายทางร่างกายอย่างน้อยถ้าคุณยอมรับหลักการของ Huygensและกฎหมายจำนวนมาก บทสรุปของกฎจำนวนมากล้มเหลวในการกระจาย Cauchy ดังนั้นจึงไม่มีค่าเฉลี่ย หากคุณเฉลี่ยอิสระตัวแปรสุ่ม Cauchy ผลที่ไม่ได้มาบรรจบกันเพื่อเป็นกับความน่าจะเป็นที่ 1มันยังคงมีการกระจาย Cauchy ขนาดเดียวกัน นี่เป็นสิ่งสำคัญในทัศนศาสตร์nn 10n1

การกระจาย Cauchy คือความเข้มแสงปกติบนเส้นจากแหล่งกำเนิด หลักการของ Huygens กล่าวว่าคุณสามารถกำหนดความเข้มได้โดยสมมติว่าแสงถูกปล่อยออกมาจากเส้นใด ๆ ระหว่างแหล่งกำเนิดและเป้าหมาย ดังนั้นความเข้มของแสงบนเส้นที่อยู่ห่างออกไปเมตรจึงสามารถกำหนดได้โดยสมมติว่าแสงกระทบกับเส้นที่ห่างออกไปเมตรแรกและจะถูกปล่อยออกมาอีกครั้งที่มุมไปข้างหน้า ความเข้มของแสงบนเส้นเมตรสามารถแสดงเป็นบิดเท่าของการกระจายของแสงบนเส้นเมตร นั่นคือผลรวมของกระจาย Cauchy อิสระเป็น Cauchy กระจายโดยปัจจัยลดขนาดของn1 n n 1 n n21nn1nn

ถ้า Cauchy กระจายมีค่าเฉลี่ยแล้วเปอร์เซ็นต์ TH ของบิดพับหารด้วยจะต้องมาบรรจบกันเพื่อโดยกฎหมายจำนวนมาก แต่มันคงที่ หากคุณทำเครื่องหมายเปอร์เซนต์ไทล์ที่บนเส้น (โปร่งใส) ห่างเมตร, ห่างออกไปเมตร ฯลฯ จากนั้นจุดเหล่านี้จะเป็นเส้นตรงที่องศา พวกเขาไม่โค้งงอไปทาง0n n 0 25 1 2 45 025nn02512450

สิ่งนี้บอกคุณเกี่ยวกับการแจกแจงของ Cauchy โดยเฉพาะ แต่คุณควรรู้การทดสอบครบถ้วนเพราะมีการแจกแจงอื่น ๆ ที่ไม่มีค่าเฉลี่ยซึ่งไม่มีการตีความทางกายภาพที่ชัดเจน


39
+1 ตอนนี้มีคำตอบที่ให้แสงสว่าง :-) (ขออภัย) โดยหลักการแล้วมีชื่อสำหรับ Christiaan Huygens ไม่ใช่ Huygen Huygens เป็นคนแรกที่ชื่นชมการพัฒนาใหม่ในความน่าจะเป็นที่เผยแพร่ใน 1650 โดย Pascal (ตามตัวอักษรของเขากับแฟร์มาต์): มันเป็นบัญชี Huygens 'ของความคิดเหล่านี้ (1657) รวมถึงความคาดหวังซึ่งเดิมมีทฤษฎีความน่าจะเป็นคณิตศาสตร์ ฐานรากและปูทางไปสู่บทความเกี่ยวกับน้ำเชื้อ (มรณกรรม) ของจาคอบเบอร์นูลลี ( Ars Conjectandi , 1713)
whuber

4
แอมพลิจูดถูกเผยแพร่ไม่ใช่ความหนาแน่น
Doru Constantin

2
นี่เป็นคำตอบที่ดี แต่ฉันคิดว่าท้ายที่สุดจะทำให้สับสน: "... ทำเครื่องหมายเปอร์เซนต์ไทล์ที่ 25 บน ... เป็นเส้นตรงที่ 45 องศาพวกมันไม่งอต่อ 0" คำแถลงนั้นเป็นจริง (อันเป็นผลมาจากหลักการ Huygens - Fresnel) แต่นั่นคือก่อน "หารด้วย " เมื่อหารด้วย 2 ที่ 2 เมตรหารด้วย 3 ที่ 3 เมตร ... จากนั้นเส้นโปร่งใสจะเป็นแนวตั้ง (ตั้งฉากกับหน้าจอที่จับแสง) เส้นควอนไทล์ 45 องศาเป็นผลรวมของ Cauchy และไม่ได้ช่วยในการโต้แย้ง (ยัง) n
Lee David Chung Lin

40

คำตอบที่เพิ่มเข้ามาเพื่อตอบสนองต่อความคิดเห็นของ @ whuber เกี่ยวกับคำตอบของ Michael Chernicks (และเขียนใหม่ทั้งหมดเพื่อลบข้อผิดพลาดที่ชี้โดย whuber)

มูลค่าของอินทิกรัลสำหรับค่าที่คาดหวังของตัวแปรสุ่ม Cauchy ถูกกล่าวว่าไม่ได้กำหนดเนื่องจากค่าสามารถ "ทำ" เพื่อเป็นสิ่งที่คนชอบ อินทิกรัล (ตีความในความหมายของรีมันน์ครบถ้วน) คือสิ่งที่เรียกกันทั่วไปว่า อินทิกรัลไม่ถูกต้องและค่าจะต้องคำนวณเป็นค่า จำกัด : หรือ

xπ(1+x2)dx
xπ(1+x2)dx=limT1limT2+T1T2xπ(1+x2)dx
xπ(1+x2)dx=limT2+limT1T1T2xπ(1+x2)dx
และหรือการประเมินผลทั้งสองควรให้ค่าที่แน่นอนเดียวกัน ถ้าไม่อินทิกรัลบอกว่าจะไม่ได้กำหนด สิ่งนี้แสดงให้เห็นทันทีว่าทำไมค่าเฉลี่ยของตัวแปรสุ่ม Cauchy ถูกกล่าวถึงไม่ได้กำหนด: ค่า จำกัด ใน diverges ขีด จำกัด ด้านใน

ได้รับค่าเงินต้น Cauchy เป็นข้อ จำกัด เดียว: แทนที่จะเป็นขีด จำกัด สองด้านบน มูลค่าหลักของหนึ่งคาดหวังจะเห็นได้ง่ายที่จะเป็นตั้งแต่ limitand มีค่าสำหรับทุกTแต่นี้ไม่สามารถนำมาใช้เพื่อบอกว่าค่าเฉลี่ยของตัวแปรสุ่ม Cauchy เป็น0นั่นคือค่าเฉลี่ยถูกกำหนดเป็นค่าของอินทิกรัลในความหมายปกติและไม่ได้อยู่ในความหมายตามตัวอักษร

limTTTxπ(1+x2)dx
00T0

สำหรับให้พิจารณาแทนอินทิกรัล ซึ่งเข้าใกล้ค่า จำกัด ของ เป็น Tเมื่อเราจะได้รับค่าต้นกล่าวถึงข้างต้น ดังนั้นเราไม่สามารถกำหนดความหมายที่ชัดเจนให้กับการแสดงออกα>0

TαTxπ(1+x2)dx=TTxπ(1+x2)dx+TαTxπ(1+x2)dx=0+ln(1+x2)2π|TαT=12πln(1+α2T21+T2)=12πln(α2+T21+T2)
ln(α)πTα=10
xπ(1+x2)dx
โดยไม่ได้ระบุว่าทั้งสอง infinities เข้าหาและไม่สนใจประเด็นนี้นำไปสู่การทั้งหมด การเรียงลำดับของภาวะแทรกซ้อนและผลลัพธ์ที่ไม่ถูกต้องเพราะสิ่งต่าง ๆ ไม่ได้เป็นอย่างที่พวกเขาทำเมื่อนมที่มีค่าตัวปลอมเป็นเหมือนครีมที่มีคุณค่า นี่คือเหตุผลที่ค่าเฉลี่ยของตัวแปรแบบสุ่มของ Cauchy ถูกกล่าวว่าไม่ได้นิยามแทนที่จะมีค่าซึ่งเป็นค่าหลักของอินทิกรัล0

หากมีใครใช้วิธีวัดความเป็นไปได้ทางทฤษฎีและความน่าจะเป็นและค่าอินทิกรัลตามที่คาดหวังถูกกำหนดไว้ในความหมายของอินทิกรัลของ Lebesgue ปัญหานี้จะง่ายกว่า มีอยู่เมื่อ มีค่า จำกัด ดังนั้นจึงไม่ได้ถูกกำหนดสำหรับตัวแปรสุ่ม Cauchyเนื่องจากไม่แน่นอนg|g|E[X]XE[|X|]


9
การประเมินอินทิกรัลกึ่งกลางไม่ถูกต้อง: มันเป็นศูนย์ไม่ใช่ลอการิทึม ปัญหาอยู่ที่การประเมินขีด จำกัด ทั้งสองโดยปริยายในอินทิกรัลไม่สิ้นสุด
whuber

@whuber ขอบคุณสำหรับการชี้ให้เห็นข้อผิดพลาด ฉันได้เขียนคำตอบของฉันอีกครั้งอย่างสมบูรณ์และความคิดเห็นของคุณจะไม่ถูกใช้อีกต่อไป
Dilip Sarwate

ฉันไม่เข้าใจว่าทำไมความคาดหวังของอัตราส่วนจึงไม่มีอยู่ ถ้าและกระจายกันตามปกติโดยมีค่าเฉลี่ยแตกต่างจากศูนย์ดังนั้นค่าเฉลี่ยของจะได้รับโดยฉันหายไปไหน XYZ=XYxyp(x,y)dxdy
Royi

@Drazick ฉันไม่ได้กล่าวถึงอัตราส่วนของตัวแปรสุ่มสองตัวแบบสุ่มที่ใดก็ได้ในคำตอบของฉัน โปรดถามใครบางคนที่แจ้งปัญหานี้เกี่ยวกับตัวแปรสุ่มของ Cauchy
Dilip Sarwate

2
@Drazick พิจารณาว่าส่วนประกอบของคุณมีอยู่จริงหรือไม่ โดยทั่วไปแล้วหากความหนาแน่นของนั้นต่อเนื่องในละแวก , E [X ^ {- 1}] $ ไม่มีอยู่ X0
Dilip Sarwate

33

ในขณะที่คำตอบข้างต้นเป็นคำอธิบายที่ถูกต้องว่าทำไมการแจกแจงของ Cauchy ไม่มีความคาดหวัง แต่ฉันพบความจริงที่ว่าอัตราส่วนของสองค่าปกติอิสระตัวแปรคือ Cauchy มี และความคาดหวังที่สองคือ+X1/X2N(0,1)

E[|X1||X2|]=E[|X1|]×E[1|X2|]
+

1
Isตัวแปรสุ่ม 'พับ' Cauchy เมื่อฉันรู้ว่า Cauchy มาตรฐานคืออะไร? เราจะพบการกระจายของ? |X1X2|X1X2|X1X2|
StubbornAtom

1
ใช่นี่คือค่าสัมบูรณ์ของตัวแปร Cauchy ซึ่งมีความหนาแน่นมากกว่าจำนวนจริงที่เป็นบวก f(x)+f(x)
ซีอาน

ถ้าคุณพับการแจกแจงแบบปกติแล้วไม่ได้ไม่มีที่สิ้นสุด? E1/|X2|
อัลเบิร์ตเฉิ

มันไม่มีที่สิ้นสุด
ซีอาน

22

Cauchy ไม่มีค่าเฉลี่ยเนื่องจากจุดที่คุณเลือก (0) ไม่ใช่ค่าเฉลี่ย มันเป็นค่ามัธยฐานและโหมด ค่าเฉลี่ยสำหรับการแจกแจงแบบต่อเนื่องถูกกำหนดเป็นโดยที่คือฟังก์ชันความหนาแน่นและอินทิกรัลถูกยึดครองโดเมนของ (ซึ่งคือถึงในกรณีของ Cauchy) สำหรับความหนาแน่นของ Cauchy อินทิกรัลนี้ไม่ จำกัด (ครึ่งจากถึงคือและครึ่งจากถึงคือ )xf(x)dxff00


9
ฉันไม่ได้วิจารณ์คุณ @Dilip: ฉันจะเพิ่มการสังเกตของคุณ สิ่งที่น่าสนใจมากคือการดำรงอยู่ของค่าเงินต้นเป็นศูนย์อาจล่อลวงเราให้นิยามค่าเฉลี่ยของการแจกแจงโคชี (หรือค่าเฉลี่ยของ RV ใด ๆ ) เป็นค่าหลักของค่าอินทิกรัล โพรบนี้มีความลึกมากขึ้นในลักษณะของคำถามนี้ซึ่งถูกขัดเกลาโดยการประกาศว่าอินทิกรัลนั้นไม่มีที่สิ้นสุดหรือไม่ได้กำหนด: กล่าวคือเหตุใดคุณค่าหลักจึงไม่ทำงาน เหตุใดจึงไม่ถูกต้องตามกฎหมายที่จะใช้สิ่งนั้นเป็นค่าเฉลี่ย
whuber

5
@whuber ยังเป็นที่น่าสนใจว่าถ้าคุณตัดอินทิกรัลที่ -a และ + a สำหรับ a> 0 คุณจะได้ 0 ดังนั้นการ จำกัด เป็นวิธีการ∞ของอินทิกรัลสมมาตรให้ 0 อีกเหตุผลที่ถามว่าทำไมไม่ 0 ค่าเฉลี่ย
Michael Chernick

10
@whuber: ฉันใช้คำถามสุดท้ายของคุณในคำพูดสุดท้ายของคุณให้เป็นวาทศิลป์; เราต้องการการบรรจบกันอย่างสมบูรณ์และเหตุผล "ใน" ความคิดของฉันคือเราต้องการให้สิ่งต่าง ๆ ทำตัวเหมือนพื้นที่ โดยเฉพาะอย่างยิ่งเราต้องสามารถสับสิ่งต่าง ๆ (ฟังก์ชั่น) เป็นชิ้น ๆ และจัดเรียงใหม่ตามความประสงค์โดยไม่รบกวนคำตอบที่เราได้รับ เราไม่สามารถทำการสับและจัดเรียงใหม่สำหรับฟังก์ชันเชิงเส้นโดยการกระจาย Cauchy ดังนั้นเราต้องยืนยันว่าไม่มีค่าเฉลี่ย
พระคาร์ดินัล

9
นั่นคือ @ cardinal เป็นคำตอบที่ดี! ฉันไม่ได้เป็นเพียงแค่วาทศิลป์เพราะคำถามถามตัวเองว่า "ทำไมเราถึงพูดว่า [การ] การแจกจ่าย Cauchy ไม่ได้หมายความว่าอย่างไร" การยืนยันความคาดหวังนั้นไม่ได้กำหนดไว้อาจตอบสนองความไม่เป็นจริง แต่ความเป็นไปได้ที่คำนิยามทางเลือกที่สมเหตุสมผลของอินทิกรัลอาจมีอยู่ - และให้คำตอบที่ถูกต้องอย่างสังหรณ์! - ควรสร้างปัญหาให้กับผู้คน คำตอบของคุณอยู่ใกล้กับสิ่งที่ฉันมีในใจ แต่ก็ยังไม่สมบูรณ์ ฉันคิดว่าคำตอบที่น่าพอใจจะระบุทฤษฎีบทสำคัญของทฤษฎีทางสถิติที่ล้มเหลวเมื่อเราทำงานกับอินทิกรัลคอนเวอร์เจนต์แบบมีเงื่อนไข
whuber

7
@Dilip ฉันก็คิดเช่นนั้น แต่เมื่อไตร่ตรองพบว่านี่เป็นเรื่องที่ท้าทายกว่าที่คุณแนะนำ ตัวอย่างเช่นไม่มีปัญหากับทฤษฎีขีด จำกัด กลาง: การกำหนดความแปรปรวนจะรับประกันความคาดหวังโดยอัตโนมัติ และทฤษฎีจำนวนมากได้รับการพิสูจน์โดยใช้อสมการของ Chebyshev ที่ซึ่งเรารับประกันว่าจะมีค่าเฉลี่ยอีกครั้ง ดังนั้นฉันจึงอยากรู้อยากเห็นจริง ๆ : อะไรคือทฤษฎีบทขนาดใหญ่ที่ใช้ในการฝึกสถิติที่เราต้องรู้ถึงปัญหาที่เกิดจากการลู่เข้าแบบมีเงื่อนไข
whuber

16

การกระจาย Cauchy เป็นความคิดที่ดีที่สุดของการกระจายตัวที่สม่ำเสมอในวงกลมหน่วยดังนั้นมันจะน่าแปลกใจถ้าค่าเฉลี่ยทำให้รู้สึก สมมติว่าเป็น "ฟังก์ชันเฉลี่ย" บางชนิด นั่นคือสมมติว่าสำหรับแต่ละเซตย่อยที่ จำกัดของวงกลมหน่วยคือจุดหนึ่งของวงกลมหน่วย เห็นได้ชัดว่าต้องเป็น "ผิดธรรมชาติ" แม่นยำมากขึ้นไม่สามารถเทียบเคียงกับการหมุน หากต้องการได้รับการแจกแจงโคชีในรูปแบบปกติ แต่เปิดเผยน้อยกว่าให้ฉายวงกลมหน่วยลงบนแกน x จาก (0,1) และใช้เส้นโครงนี้เพื่อถ่ายโอนการกระจายแบบสม่ำเสมอบนวงกลมไปยังแกน xfXf(X)ff

เพื่อให้เข้าใจว่าทำไมค่าเฉลี่ยจึงไม่มีอยู่ให้คิดว่า x เป็นฟังก์ชันในวงกลมหน่วย มันค่อนข้างง่ายที่จะพบจำนวนอาร์กที่แยกไม่ออกบนวงหน่วยเช่นถ้าส่วนใดส่วนหนึ่งมีความยาว d ดังนั้น x> 1 / 4d บนส่วนโค้งนั้น ดังนั้นส่วนโค้งที่แยกจากกันเหล่านี้มีส่วนร่วมมากกว่า 1/4 ถึงค่าเฉลี่ยและผลรวมทั้งหมดจากส่วนโค้งเหล่านี้จึงไม่มีที่สิ้นสุด เราสามารถทำสิ่งเดียวกันนี้อีกครั้ง แต่ด้วย x <-1 / 4d โดยมีส่วนร่วมทั้งหมดลบด้วยอนันต์ ช่วงเวลาเหล่านี้สามารถแสดงด้วยไดอะแกรม แต่สามารถสร้างไดอะแกรมสำหรับการตรวจสอบไขว้ได้หรือไม่


1
ยินดีต้อนรับสู่เว็บไซต์ @DavidEpstein คุณสามารถสร้างภาพด้วยซอฟต์แวร์ที่คุณต้องการและอัปโหลดไปยังคำตอบของคุณโดยคลิกที่ไอคอนรูปภาพขนาดเล็ก (เพื่อเปิดตัวช่วยสร้าง) เหนือช่องคำตอบ อย่างไรก็ตามคุณต้อง> = 10 ตัวแทนเพื่อทำเช่นนั้น ฉันแน่ใจว่าคุณจะมีเร็วพอ ในระหว่างนี้หากคุณสามารถโพสต์ภาพที่ใดก็ได้บนอินเทอร์เน็ตและโพสต์ลิงก์ไปยังรูปภาพนั้นในคำตอบของคุณผู้ใช้ตัวแทนที่สูงกว่าสามารถดึงและโพสต์รูปภาพให้คุณได้
gung

3
ฉันไม่รู้ว่า Cauchy ถูกตีความว่าเป็นเครื่องแบบบนวงกลม แต่มันสมเหตุสมผลดี อาร์กิวเมนต์ทอพอโลยีแสดงให้เห็นว่าไม่มีฟังก์ชันต่อเนื่องในวงกลมที่มีคุณสมบัติของฟังก์ชันหาค่าเฉลี่ย
johnny

@DavidEpstein ฉันยังอ่านคำตอบของคุณในการโพสต์อื่นการฉายภาพสามมิตินั้นดีจริงๆ ในการเปรียบเทียบคุณสามารถแสดงความคิดเห็นได้หรือไม่ว่าทำไมการฉายรัศมีที่ถูกต้องเท่ากันของครึ่งวงกลมนั้นไม่ได้หมายความว่าจะต้องมีความหมายที่ชัดเจน กล่าวคือจากนั้นเป็นมาตรฐาน Cauchy เรขาคณิตนี่เป็นข้อเท็จจริงพื้นฐานที่มุมที่ถูกจารึกไว้นั้นเป็นครึ่งหนึ่งของมุมศูนย์กลางที่สอดคล้องกันเสมอ UUnif[0,1]Xtan(π(U12))
Lee David Chung Lin

ที่จริงแล้วในแง่ของแบบจำลองทางกายภาพของแหล่งกำเนิดแสงภาพครึ่งวงกลมนั้นมีความเหมาะสมมากกว่าเนื่องจากยังไม่ชัดเจนในทันทีว่าทำไมหลักการของ Huygens จึงให้การฉายภาพสามมิติ
Lee David Chung Lin

10

ค่าเฉลี่ยหรือค่าคาดหวังของตัวแปรสุ่มบางตัวคืออินทิกรัลของ Lebesgue ที่กำหนดเหนือการวัดความน่าจะเป็นบาง : XP

EX=XdP

การไม่มีอยู่ของค่าเฉลี่ยของตัวแปรสุ่ม Cauchy เพียงหมายความว่าไม่มีส่วนประกอบของ Cauchy rv นี่เป็นเพราะหางของการกระจาย Cauchy เป็นหางที่หนัก (เทียบกับหางของการกระจายแบบปกติ) อย่างไรก็ตามไม่มีการดำรงอยู่ของค่าที่คาดว่าจะไม่ห้ามการดำรงอยู่ของฟังก์ชั่นอื่น ๆ ของตัวแปรสุ่ม Cauchy


5
หางเป็น "หนัก" ในแง่ที่ว่ามันไม่สลายตัวเร็วพอในทิศทางใดทิศทางหนึ่งเพื่อทำให้อินทิกรัลรวมกัน แนวคิดนี้ไม่มีส่วนเกี่ยวข้องกับการแจกแจงแบบปกติ (หรือการแจกแจงอ้างอิงใด ๆ )
whuber

4
ใช่ขอบคุณสำหรับการแก้ไขนี้ ฉันไม่ได้ตั้งใจจะบ่งบอกถึงการเชื่อมต่อที่เข้มงวดระหว่างก้อยหนักและการกระจายแบบปกติ อย่างไรก็ตามฉันคิดว่าการเปรียบเทียบการแจกแจงแบบปกติ (กับหางแสง) และการแจกแจงแบบเทลด์อย่างหนักทำให้มองเห็น (ไม่เสมอไป) ง่ายขึ้นเล็กน้อยในการเข้าใจแนวคิดของหาง "หนัก"
Tomas

5

นี่คือคำอธิบายภาพเพิ่มเติม (สำหรับพวกเราที่มีปัญหาด้านคณิตศาสตร์) ใช้ตัวสร้างตัวเลขสุ่มกระจาย cauchy และลองหาค่าเฉลี่ยของผลลัพธ์ นี่คือหน้าที่ดีของฟังก์ชันนี้ https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable คุณจะพบว่า "ความแหลม" ของค่าสุ่มทำให้มันใหญ่ขึ้นเมื่อคุณไปแทนที่จะเล็กกว่า . ดังนั้นมันจึงไม่มีความหมาย


4

เพื่อเพิ่มคำตอบที่ยอดเยี่ยมฉันจะแสดงความคิดเห็นเกี่ยวกับสาเหตุที่การไม่รวมตัวของอินทิกรัลนั้นเกี่ยวข้องกับการปฏิบัติทางสถิติ ดังที่คนอื่น ๆ ได้กล่าวไว้ถ้าเราอนุญาตให้ค่าที่สำคัญเป็น "หมายถึง" ดังนั้น slln จะไม่ถูกต้องอีกต่อไป! นอกเหนือจากนี้ให้คิดเกี่ยวกับนัยของความจริงที่ว่าในทางปฏิบัติแล้วตัวแบบทั้งหมดนั้นเป็นค่าประมาณ โดยเฉพาะการกระจาย Cauchy เป็นแบบจำลองสำหรับตัวแปรสุ่มที่ไม่มีขอบเขต ในทางปฏิบัติตัวแปรสุ่มถูก จำกัด ขอบเขต แต่มักจะคลุมเครือและไม่แน่นอน การใช้โมเดลที่ไม่มีขอบเขตเป็นวิธีที่จะช่วยบรรเทาได้ทำให้ไม่จำเป็นต้องมีการแนะนำขอบเขตที่ไม่แน่นอน (และมักผิดธรรมชาติ) ในโมเดล แต่การทำเช่นนี้จะทำให้ความรู้สึกแง่มุมที่สำคัญของปัญหาไม่ควรได้รับผลกระทบ นั่นหมายความว่าถ้าเราจะแนะนำขอบเขต ที่ไม่ควรเปลี่ยนแปลงในรูปแบบที่สำคัญ แต่เมื่ออินทิกรัลไม่แปรปรวนที่ไม่เกิดขึ้น! แบบจำลองนั้นไม่เสถียรในแง่ที่ความคาดหวังของ RV จะขึ้นอยู่กับขอบเขตส่วนใหญ่โดยพลการ (ในแอปพลิเคชันไม่จำเป็นต้องมีเหตุผลใด ๆ ในการทำให้สมมาตรเกินขอบเขต!)

ด้วยเหตุนี้จึงเป็นการดีกว่าถ้าจะบอกว่าอินทิกรัลนั้นแตกต่างจากการบอกว่ามันเป็น "อนันต์" คนสุดท้ายที่เข้าใกล้จะบ่งบอกถึงคุณค่าที่แน่นอนเมื่อไม่มี! การอภิปรายอย่างละเอียดมากขึ้นคือที่นี่


-4

ฉันต้องการที่จะจู้จี้จุกจิกเล็กน้อยสำหรับที่สอง กราฟิกที่ด้านบนผิด แกน x อยู่ในส่วนเบี่ยงเบนมาตรฐานสิ่งที่ไม่มีอยู่สำหรับการแจกแจงโคชี ฉันเป็นคนพิถีพิถันเพราะฉันใช้การแจกจ่าย Cauchy ทุกวันในชีวิตของฉันในการทำงานของฉัน มีกรณีปฏิบัติที่ความสับสนอาจทำให้เกิดข้อผิดพลาดเชิงประจักษ์ การแจกแจงค่า t ของนักเรียนที่มีอิสระ 1 องศาเป็นมาตรฐาน Cauchy มันมักจะแสดงรายการซิกมาสที่จำเป็นสำหรับความสำคัญ sigmas เหล่านี้ไม่ใช่ส่วนเบี่ยงเบนมาตรฐานพวกเขาเป็นข้อผิดพลาดที่น่าจะเป็นและ mu เป็นโหมด

หากคุณต้องการทำกราฟิกข้างต้นอย่างถูกต้องทั้งแกน x เป็นข้อมูลดิบหรือถ้าคุณต้องการให้พวกเขามีข้อผิดพลาดที่เทียบเท่าขนาดแล้วคุณจะให้ข้อผิดพลาดน่าจะเท่ากัน ข้อผิดพลาดที่น่าจะเป็นไปได้ประการหนึ่งคือ. 67 ส่วนเบี่ยงเบนมาตรฐานในการแจกแจงแบบปกติ ในทั้งสองกรณีมันเป็นช่วงกึ่ง interquartile

ตอนนี้คำตอบสำหรับคำถามของคุณทุกสิ่งที่ทุกคนเขียนไว้ข้างต้นนั้นถูกต้องและเป็นเหตุผลทางคณิตศาสตร์สำหรับสิ่งนี้ อย่างไรก็ตามฉันสงสัยว่าคุณเป็นนักเรียนและเป็นคนใหม่ในหัวข้อและดังนั้นวิธีแก้ปัญหาทางคณิตศาสตร์ที่ใช้งานง่ายเพื่อตอบสนองต่อการมองเห็นอาจไม่เป็นจริง

ฉันมีตัวอย่างโลกแห่งความจริงสองตัวที่เหมือนกันเกือบทั้งหมดซึ่งมาจากการแจกแจงของ Cauchy ทั้งสองมีโหมดเดียวกันและข้อผิดพลาดที่อาจเกิดขึ้น หนึ่งมีค่าเฉลี่ย 1.27 และหนึ่งมีค่าเฉลี่ยของ 1.33 คนที่มีค่าเฉลี่ย 1.27 มีค่าเบี่ยงเบนมาตรฐาน 400, คนที่มีค่าเฉลี่ย 1.33 มีค่าเบี่ยงเบนมาตรฐานเท่ากับ 5.15 ข้อผิดพลาดที่เป็นไปได้สำหรับทั้งคู่คือ. 32 และโหมดคือ 1 ซึ่งหมายความว่าสำหรับข้อมูลแบบสมมาตรค่าเฉลี่ยไม่ได้อยู่ในส่วนกลาง 50% ใช้การสังเกตเพิ่มเติมเพียงครั้งเดียวเพื่อผลักดันค่าเฉลี่ยและ / หรือความแปรปรวนภายนอกที่สำคัญสำหรับการทดสอบใด ๆ เหตุผลก็คือค่าเฉลี่ยและความแปรปรวนไม่ใช่พารามิเตอร์และค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างเป็นตัวเลขสุ่มด้วยตนเอง

คำตอบที่ง่ายที่สุดคือพารามิเตอร์ของการแจกแจง Cauchy ไม่รวมค่าเฉลี่ยและดังนั้นจึงไม่มีความแปรปรวนเกี่ยวกับค่าเฉลี่ย

อาจเป็นไปได้ว่าในการเรียนการสอนที่ผ่านมาความสำคัญของค่าเฉลี่ยคือว่ามันมักจะเป็นสถิติที่เพียงพอ ในสถิติตามความถี่ในระยะยาวการกระจาย Cauchy มีสถิติไม่เพียงพอ มันเป็นความจริงที่ค่ามัธยฐานตัวอย่างสำหรับการกระจาย Cauchy ด้วยการสนับสนุนทั่วทั้ง reals เป็นสถิติที่เพียงพอ แต่นั่นเป็นเพราะมันสืบทอดมาจากการเป็นสถิติการสั่งซื้อ มันเป็นเรื่องบังเอิญพอเพียงไม่มีวิธีคิดที่ง่าย ตอนนี้ในสถิติแบบเบย์มีสถิติเพียงพอสำหรับพารามิเตอร์ของการแจกแจงโคชีและถ้าคุณใช้เครื่องแบบก่อนหน้านั้นมันก็ไม่เอนเอียง ฉันนำสิ่งนี้มาใช้เพราะถ้าคุณต้องใช้มันเป็นประจำทุกวันคุณได้เรียนรู้เกี่ยวกับวิธีที่พวกเขาทำการประเมิน

ไม่มีสถิติการสั่งซื้อที่ถูกต้องที่สามารถใช้เป็นตัวประมาณสำหรับการแจกแจงแบบ Cauchy ที่ถูกตัดทอนซึ่งเป็นสิ่งที่คุณมีแนวโน้มที่จะพบเจอในโลกแห่งความเป็นจริงและดังนั้นจึงไม่มีสถิติเพียงพอในวิธีการอิงความถี่สำหรับโปรแกรมส่วนใหญ่ .

สิ่งที่ฉันแนะนำคือการหลีกหนีจากค่าเฉลี่ยจิตใจเป็นสิ่งที่เป็นจริง มันเป็นเครื่องมือเช่นค้อนที่มีประโยชน์ในวงกว้างและมักจะสามารถใช้งานได้ บางครั้งเครื่องมือนั้นไม่ทำงาน

บันทึกทางคณิตศาสตร์เกี่ยวกับการแจกแจงแบบปกติและแบบโคชี เมื่อได้รับข้อมูลเป็นอนุกรมเวลาการแจกแจงแบบปกติจะเกิดขึ้นก็ต่อเมื่อข้อผิดพลาดมารวมเป็นศูนย์เมื่อ t ไปที่อนันต์ เมื่อได้รับข้อมูลเป็นอนุกรมเวลาการกระจาย Cauchy จะเกิดขึ้นเมื่อข้อผิดพลาดเบี่ยงเบนไปเป็นอนันต์ หนึ่งเกิดจากชุดบรรจบ, อื่น ๆ เนื่องจากชุดแตกต่าง Cauchy ดิสทริบิวชั่นไม่เคยไปถึงจุดที่กำหนดพวกเขาแกว่งไปมาข้ามจุดคงที่เพื่อให้ห้าสิบเปอร์เซ็นต์ของเวลาที่พวกเขาอยู่ข้างหนึ่งและอีกห้าสิบเปอร์เซ็นต์ของเวลา ไม่มีการพลิกกลับค่ามัธยฐาน


9
มีความสับสนในการตอบสนองนี้! ยกตัวอย่างเช่นมันบอกว่า "ตอนนี้ในสถิติแบบเบย์มีสถิติเพียงพอสำหรับพารามิเตอร์ของการแจกแจงโคชีและถ้าคุณใช้เครื่องแบบก่อนหน้านั้นมันก็ไม่เอนเอียง" มันยากที่จะทำความเข้าใจกับสิ่งนี้! อย่างแรกแนวคิดเกี่ยวกับความพอเพียงของบ่อย ๆ และ Bayesian นั้นอยู่ใกล้มาก (และฉันเชื่อว่าสามารถแตกต่างกันได้ในพื้นที่ตัวอย่างที่แปลกและไม่มีที่สิ้นสุดบางแห่งดังนั้นสำหรับสายที่แท้จริงจะเหมือนกัน) ไม่มีสถิติเพียงพอสำหรับโมเดล Cauchy ของมิติคงที่! เพียง (ข้อมูลที่ครบถ้วนสมบูรณ์เพียงพอ)
kjetil b halvorsen

-6

เพื่อให้ง่ายขึ้นพื้นที่ใต้เส้นโค้งจะเข้าใกล้อนันต์เมื่อคุณซูมออก หากคุณสุ่มตัวอย่างขอบเขต จำกัด คุณสามารถค้นหาค่าเฉลี่ยสำหรับภูมิภาคนั้น อย่างไรก็ตามไม่มีค่าเฉลี่ยสำหรับอินฟินิตี้


8
พื้นที่ใต้ PDF เท่ากับตามคำจำกัดความดังนั้นคุณต้องหมายอย่างอื่นโดยใช้ "เส้นโค้ง" มันคืออะไร? 1
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.