การแจกจ่ายของ Cauchy เป็นการกระจายที่“ คาดเดาไม่ได้” อย่างใดหรือไม่?


14

การแจกจ่าย Cauchy เป็นอย่างใดอย่างหนึ่งการกระจาย "ไม่แน่นอน"?

ฉันพยายามทำ

cs <- function(n) {
  return(rcauchy(n,0,1))
}

ใน R สำหรับค่า n จำนวนมากและสังเกตว่าพวกเขาสร้างค่าที่ไม่แน่นอนค่อนข้างเป็นครั้งคราว

เปรียบเทียบกับ

as <- function(n) {
  return(rnorm(n,0,1))
}

ซึ่งมักจะให้คะแนนแบบ "กะทัดรัด"

โดยรูปนี้มันควรมีลักษณะการกระจายตัวแบบปกติหรือไม่ แต่มันอาจจะเป็นเพียงส่วนหนึ่งของค่า หรืออาจเป็นกลอุบายก็คือการเบี่ยงเบนมาตรฐานของ Cauchy (ในรูปด้านล่าง) มาบรรจบกันช้ากว่ามาก (ไปทางซ้ายและขวา) และทำให้มีค่าผิดปกติที่รุนแรงมากขึ้นแม้ว่าจะมีความน่าจะเป็นต่ำ?

https://i.stack.imgur.com/zGTLU.png

นี่คือ rvs ปกติและ cs คือ Cauchy rvs

ป้อนคำอธิบายรูปภาพที่นี่

แต่ด้วยปลายสุดของค่าผิดปกติเป็นไปได้ไหมที่ส่วนท้ายของ Cauchy pdf ไม่เคยมาบรรจบกัน?


9
1. คำถามของคุณไม่ชัดเจน / ไม่ชัดเจนดังนั้นจึงยากที่จะตอบ เช่น "คาดเดาไม่ได้" หมายถึงอะไรในคำถามของคุณ คุณหมายถึงอะไรโดย "การเบี่ยงเบนมาตรฐานของ Cauchy" และการบรรจบกันใกล้จะจบ คุณดูเหมือนจะไม่คำนวณค่าเบี่ยงเบนมาตรฐานที่ใดก็ได้ ค่าเบี่ยงเบนมาตรฐานของอะไรกันแน่ 2. โพสต์มากมายบนไซต์พูดคุยคุณสมบัติของ Cauchy ซึ่งอาจช่วยให้คุณมุ่งเน้นคำถามของคุณ มันอาจคุ้มค่าที่จะตรวจสอบ Wikipedia 3. ฉันขอแนะนำให้หลีกเลี่ยงคำว่า "รูประฆัง"; ความหนาแน่นทั้งสองดูเหมือนจะมีรูปร่างคล้ายกระดิ่ง เพียงแค่เรียกพวกเขาด้วยชื่อของพวกเขา
Glen_b -Reinstate Monica

4
แน่นอน Cauchy เป็นเทลด์ที่หนักมาก
Glen_b -Reinstate Monica

1
ฉันโพสต์ข้อเท็จจริงบางอย่าง; หวังว่าสิ่งเหล่านี้จะช่วยคุณค้นหาสิ่งที่คุณอยากรู้เพื่อที่คุณจะได้ปรับแต่งคำถามของคุณ
Glen_b -Reinstate Monica

1
ดูที่การแก้ไขของคุณฉันไม่แน่ใจว่าคุณหมายถึงอะไรเมื่อคุณพูดว่า "เป็นไปได้หรือไม่ที่ส่วนท้ายของ Cauchy pdf ไม่เคยมาบรรจบกัน" แน่นอนความหนาแน่นไป 0 เป็นและฟังก์ชั่นการอยู่รอดยังไปถึง 0 เป็นxคุณช่วยอธิบายสิ่งที่คุณหมายถึงอะไร? |x|x
Glen_b -Reinstate Monica

2
ค่าผิดปกติที่มีขนาดใหญ่เป็นไปได้ด้วยปกติ แต่พวกเขากำลังหายากอย่างไม่น่าเชื่อ ความหนาแน่น (และที่หางส่วนบนโดยเฉพาะอย่างยิ่งความเกี่ยวข้องกับค่าผิดปกติอย่างน้อยขนาดที่กำหนด, ฟังก์ชันการอยู่รอด) สำหรับหัวปกติไปทาง 0 เร็วกว่า Cauchy มาก - แต่อย่างไรก็ตามความหนาแน่นทั้งสอง (และหน้าที่ความอยู่รอดทั้งสอง) เข้าหา 0 และไม่เคยไปถึงมัน
Glen_b -Reinstate Monica

คำตอบ:


39

ในขณะที่มีการโพสต์บนเว็บไซต์จำนวนหนึ่งกล่าวถึงคุณสมบัติที่หลากหลายของ Cauchy แต่ฉันไม่สามารถหาตำแหน่งที่วางไว้ด้วยกันได้ หวังว่านี่อาจเป็นสถานที่ที่ดีในการรวบรวม ฉันอาจขยายสิ่งนี้

หางหนา

ในขณะที่ Cauchy เป็นรูประฆังที่สมมาตรและเกะกะค่อนข้างคล้ายกับการแจกแจงแบบปกติ แต่ก็มีหางที่หนักกว่ามาก ตัวอย่างเช่นมีความเป็นไปได้น้อย แต่ชัดเจนว่าตัวแปรสุ่ม Cauchy จะวางช่วง interquartile มากกว่า 1,000 ช่วงจากค่ามัธยฐาน - ประมาณของคำสั่งเดียวกับตัวแปรสุ่มปกติที่มีช่วงอย่างน้อย 2.67 ช่วงค่าเฉลี่ยจากค่ามัธยฐาน

ความแปรปรวน

ความแปรปรวนของ Cauchy นั้นไม่มีที่สิ้นสุด

แก้ไข: JG พูดในความคิดเห็นว่าไม่ได้กำหนดไว้ หากเรานำความแปรปรวนเป็นค่าเฉลี่ยของครึ่งระยะห่างกำลังสองระหว่างคู่ของค่า - ซึ่งเท่ากับความแปรปรวนเมื่อทั้งคู่มีอยู่แล้วมันจะไม่มีที่สิ้นสุด อย่างไรก็ตามโดยนิยาม JG ปกติถูกต้อง [อย่างไรก็ตามโดยทางตรงข้ามกับค่าเฉลี่ยตัวอย่างซึ่งไม่ได้รวมกันกับสิ่งใดเลยเมื่อ n กลายเป็นใหญ่การกระจายของความแปรปรวนตัวอย่างจะเพิ่มขึ้นเรื่อย ๆ ตามขนาดตัวอย่างที่เพิ่มขึ้น มาตราส่วนจะเพิ่มขึ้นตามสัดส่วนเป็น n หรือการกระจายความแปรปรวนของบันทึกเท่ากันจะเพิ่มขึ้นตามขนาดตัวอย่าง ดูเหมือนว่ามีประสิทธิผลที่จะพิจารณาความแปรปรวนเวอร์ชันนั้นซึ่งให้ผลอนันต์บอกเราบางอย่าง]

ตัวอย่างเบี่ยงเบนมาตรฐานอยู่แน่นอน แต่ตัวอย่างที่ใหญ่กว่าพวกเขามีแนวโน้มที่จะใหญ่ขึ้น (เช่นค่าเบี่ยงเบนมาตรฐานตัวอย่างเฉลี่ยที่ n = 10 อยู่ในบริเวณใกล้เคียง 3.67 เท่าของพารามิเตอร์มาตราส่วน (ครึ่ง IQR) แต่ที่ n = 100 มันคือ 11.9)

Mean

การกระจาย Cauchy ไม่ได้มีค่าเฉลี่ยแน่นอน; อินทิกรัลสำหรับค่าเฉลี่ยไม่ได้มาบรรจบกัน เป็นผลให้แม้แต่กฎของคนจำนวนมากก็ยังใช้ไม่ได้ - เมื่อโตขึ้นตัวอย่างก็หมายความว่าอย่ามารวมกันในปริมาณที่แน่นอน (แน่นอนไม่มีอะไรให้พวกเขามาบรรจบกัน)

อันที่จริงแล้วการกระจายตัวของค่าเฉลี่ยตัวอย่างจากการแจกแจงโคชีนั้นเหมือนกับการกระจายตัวของการสังเกตเพียงครั้งเดียว (!) ส่วนท้ายนั้นหนักมากที่การเพิ่มค่าเข้าไปในผลรวมนั้นมีค่ามากที่สุดเท่าที่จะทำได้เพื่อชดเชยการหารโดยตัวส่วนที่ใหญ่กว่าเมื่อทำการหาค่าเฉลี่ย

การคาดการณ์

คุณสามารถสร้างช่วงการทำนายที่สมเหตุสมผลอย่างสมบูรณ์แบบสำหรับการสังเกตจากการแจกแจงโคชี มีตัวประมาณค่าที่เรียบง่ายและมีประสิทธิภาพพอใช้ที่ทำงานได้ดีสำหรับการประมาณตำแหน่งและสเกลและช่วงเวลาการคาดการณ์โดยประมาณสามารถสร้างได้ อย่างไรก็ตามหางขยายไปไกลมากดังนั้นหากคุณต้องการช่วงเวลาที่มีความน่าจะเป็นสูงมันอาจจะค่อนข้างกว้าง

หากคุณกำลังพยายามทำนายจุดศูนย์กลางของการแจกแจง (เช่นในแบบจำลองการถดถอย) ซึ่งในบางแง่ก็อาจจะค่อนข้างง่ายต่อการทำนาย Cauchy ค่อนข้างแหลม (มีการกระจายจำนวนมาก "ปิด" ไปยังศูนย์กลางสำหรับมาตรวัดทั่วไป) ดังนั้นศูนย์กลางสามารถประเมินได้ค่อนข้างดีหากคุณมีตัวประมาณที่เหมาะสม

นี่คือตัวอย่าง:

ฉันสร้างข้อมูลจากความสัมพันธ์เชิงเส้นกับข้อผิดพลาด Cauchy มาตรฐาน (การสังเกต 100 ครั้ง, การสกัด = 3, ความชัน = 1.5), และการประมาณเส้นถดถอยโดยวิธีการสามวิธีที่มีความเสถียรต่อ y-outliers: Tukey 3 กลุ่มเส้น (สีแดง) (สีเขียวเข้ม) และ L1- การถดถอย (สีน้ำเงิน) ไม่มีใครมีประสิทธิภาพเป็นพิเศษที่ Cauchy - แม้ว่าพวกเขาจะสร้างจุดเริ่มต้นที่ยอดเยี่ยมสำหรับวิธีการที่มีประสิทธิภาพมากขึ้น

อย่างไรก็ตามทั้งสามคนนั้นเกือบจะบังเอิญเมื่อเปรียบเทียบกับความว่องไวของข้อมูลและอยู่ใกล้กับศูนย์กลางของที่ที่ข้อมูลทำงาน ในแง่นั้น Cauchy ชัดเจน "คาดการณ์ได้"

ค่ามัธยฐานของค่าตกค้างสัมบูรณ์นั้นมีขนาดใหญ่กว่า 1 เล็กน้อยสำหรับทุก ๆ เส้น (ข้อมูลส่วนใหญ่อยู่ใกล้กับเส้นที่ประมาณไว้); ในแง่นี้ Cauchy ก็คือ "คาดการณ์ได้"

ความสัมพันธ์เชิงเส้นกับข้อผิดพลาด Cauchy และสามเส้นถดถอยที่เหมาะสม

สำหรับพล็อตด้านซ้ายจะมีค่าผิดปกติจำนวนมาก เพื่อที่จะดูข้อมูลที่ดีกว่าฉัน จำกัด ขนาดของแกน y ลงบนด้านขวา


1
หางหนาและความแปรปรวนที่แปรปรวนนั้นสัมพันธ์กันใช่ไหม?
mavavilj

อย่างแน่นอน ค่าเฉลี่ยที่ไม่ได้กำหนดนั้นสัมพันธ์กับหางหนัก
Glen_b -Reinstate Monica

“ มีตัวประมาณที่เรียบง่ายและมีประสิทธิภาพพอสมควรที่ทำงานได้ดีสำหรับการประมาณตำแหน่งและสเกลและช่วงเวลาการคาดการณ์โดยประมาณสามารถสร้างได้” - คุณสามารถให้การอ้างอิงได้หรือไม่?
Carlos Cinelli

ความคิดเห็นไม่ได้มีไว้สำหรับการอภิปรายเพิ่มเติม การสนทนานี้ได้รับการย้ายไปแชท
gung - Reinstate Monica

@Carlos มีสองประเด็นที่แตกต่างกัน - (i) ตัวประมาณค่าที่เรียบง่ายและมีประสิทธิภาพพอสมควรสำหรับสถานที่ (เช่นค่าเฉลี่ยที่ถูกตัดอย่างเหมาะสม) และสเกลใน Cauchy และ (ii) วิธีการสร้างช่วงเวลาการทำนายที่จะใช้กับ Cauchy ฉันคิดว่าตอนแรกได้รับการคุ้มครองในเว็บไซต์แล้วและที่สองจะได้รับคำถามของตัวเอง
Glen_b -Reinstate Monica

1

μσnμ±σμ±636.62σ

σ

การกระจายของ Cauchy นั้นดูค่อนข้างเป็นธรรมชาติโดยเฉพาะอย่างยิ่งเมื่อคุณมีรูปแบบการเติบโต นอกจากนี้ยังปรากฏว่าสิ่งที่หมุนเช่นหินกลิ้งลงเนิน คุณจะพบว่ามันคือการกระจายหลักของส่วนผสมที่น่าเกลียดของผลตอบแทนในตลาดหุ้น แต่ไม่ใช่ในสิ่งตอบแทนเช่นของเก่าที่ขายในการประมูล ผลตอบแทนจากวัตถุโบราณยังเป็นของการแจกแจงแบบไม่มีค่าเฉลี่ยหรือความแปรปรวน แต่ไม่ใช่การแจกแจงของ Cauchy ความแตกต่างถูกสร้างขึ้นโดยความแตกต่างในกฎของการประมูล หากคุณเปลี่ยนกฎของ NYSE การกระจาย Cauchy จะหายไปและกฎอื่นจะปรากฏขึ้น

เพื่อให้เข้าใจว่าเหตุใดจึงมีอยู่จริงลองจินตนาการว่าคุณเป็นผู้ประมูลในชุดประมูลขนาดใหญ่และผู้ประมูลที่มีศักยภาพ เนื่องจากหุ้นถูกขายในการประมูลสองครั้งคำสาปของผู้ชนะจึงไม่สามารถใช้ได้ ในความสมดุลพฤติกรรมที่มีเหตุผลคือการเสนอราคาที่คุณคาดหวัง ความคาดหวังเป็นรูปแบบของค่าเฉลี่ย การกระจายตัวของค่าประมาณค่าเฉลี่ยจะมาบรรจบกันตามปกติเมื่อขนาดตัวอย่างไปถึงอนันต์

Rเสื้อ=พีเสื้อ+1พีเสื้อ

สิ่งนี้ทำให้ตลาดหุ้นมีความผันผวนมากหากใครคิดว่าตลาดหุ้นควรมีการกระจายแบบปกติหรือ log-ปกติ แต่จะไม่ผันผวนอย่างคาดไม่ถึงหากคุณคาดว่าหางที่หนัก

ฉันได้สร้างทั้งการแจกแจงแบบเบย์และความถี่แบบกระจายสำหรับการแจกแจงโคชีและให้สมมติฐานของพวกเขาทำงานได้ดี การทำนายแบบเบย์ช่วยลดความแตกต่างของ Kullback-Leibler ซึ่งหมายความว่ามันใกล้เคียงที่สุดเท่าที่คุณสามารถเข้าถึงธรรมชาติในการทำนายสำหรับชุดข้อมูลที่กำหนด การพยากรณ์เป็นประจำจะลดการเบี่ยงเบน Kullback-Leibler โดยเฉลี่ยให้น้อยกว่าการคาดการณ์อิสระมากมายจากตัวอย่างอิสระจำนวนมาก ไม่จำเป็นว่าจะทำงานได้ดี แต่สำหรับตัวอย่างใดก็ตามที่คาดว่าจะมีความครอบคลุมโดยเฉลี่ย หางลู่เข้าหากัน แต่พวกมันมาบรรจบกันอย่างช้าๆ

Cauchy หลายตัวแปรมีคุณสมบัติที่ทำให้เสียยิ่งขึ้น ตัวอย่างเช่นในขณะที่มันไม่สามารถโควารีได้อย่างชัดเจนเนื่องจากไม่มีค่าเฉลี่ย แต่ก็ไม่มีอะไรคล้ายกับเมทริกซ์ความแปรปรวนร่วม ข้อผิดพลาด Cauchy มักจะเป็นทรงกลมหากไม่มีสิ่งใดเกิดขึ้นในระบบ นอกจากนี้ในขณะที่ไม่มีโควารีไม่มีอะไรที่เป็นอิสระเช่นกัน เพื่อให้เข้าใจถึงความสำคัญในการใช้งานจริงลองนึกภาพสองประเทศที่เติบโตและค้าขายกัน ข้อผิดพลาดในหนึ่งไม่เป็นอิสระจากข้อผิดพลาดในอื่น ๆ ความผิดพลาดของฉันมีอิทธิพลต่อความผิดพลาดของคุณ หากประเทศใดประเทศหนึ่งถูกครอบครองโดยคนบ้าความผิดพลาดของคนบ้านั้นจะเกิดขึ้นทุกหนทุกแห่ง ในทางตรงกันข้ามเนื่องจากผลกระทบไม่เชิงเส้นอย่างที่คาดหวังกับเมทริกซ์ความแปรปรวนร่วมประเทศอื่น ๆ สามารถตัดความสัมพันธ์เพื่อลดผลกระทบ

นี่คือสิ่งที่ทำให้สงครามการค้าของทรัมป์เป็นอันตรายเช่นกัน เศรษฐกิจใหญ่เป็นอันดับสองของโลกหลังจากที่สหภาพยุโรปประกาศสงครามเศรษฐกิจผ่านทางการค้ากับเศรษฐกิจอื่น ๆ และกำลังหาเงินทุนในการทำสงครามโดยการกู้ยืมเงินเพื่อต่อสู้กับประเทศที่ประกาศสงคราม หากการพึ่งพาเหล่านั้นถูกบังคับให้คลายมันจะน่าเกลียดในแบบที่ไม่มีใครมีความทรงจำอยู่ เราไม่ได้มีปัญหาที่คล้ายกันตั้งแต่การบริหารแจ็คสันเมื่อธนาคารแห่งประเทศอังกฤษห้ามการค้าแอตแลนติก

การกระจาย Cauchy นั้นน่าสนใจเพราะมันปรากฏในระบบเลขชี้กำลังและเอ็กซ์โพเนนเชียล พวกเขาสับสนคนเพราะชีวิตประจำวันของพวกเขาเต็มไปด้วยความหนาแน่นที่มีค่าเฉลี่ยและมักจะมีความแปรปรวน มันทำให้การตัดสินใจยากมากเพราะเรียนรู้บทเรียนที่ผิด


ฉันชอบวิธีที่กล้าหาญซึ่งคุณสมบัติทางคณิตศาสตร์ถูกแมปกับพฤติกรรมจริงในคำตอบนี้ แต่คุณไม่ควรพูดถึงว่า Cauchy ที่ถูกตัดทอนทั้งสองฝั่งมีช่วงเวลาที่แน่นอนทั้งหมดหรือไม่?
Alecos Papadopoulos

มันถูกตัดทอนทางด้านซ้ายเท่านั้น ข้อ จำกัด ด้านงบประมาณของดาวเคราะห์เล็กน้อยอยู่ทางด้านขวาและเนื่องจากระบบการเงินไม่ได้อนุรักษ์ระบบพวกเขาจึงไม่มีที่สิ้นสุดทางด้านขวา
Dave Harris
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.