PDF จำนวนมากมีตั้งแต่ลบไปจนถึงอินฟินิตี้เป็นบวก แต่มีวิธีการบางอย่างที่กำหนดและบางไฟล์ไม่ใช่ ลักษณะทั่วไปอะไรทำให้มีการคำนวณบ้าง
PDF จำนวนมากมีตั้งแต่ลบไปจนถึงอินฟินิตี้เป็นบวก แต่มีวิธีการบางอย่างที่กำหนดและบางไฟล์ไม่ใช่ ลักษณะทั่วไปอะไรทำให้มีการคำนวณบ้าง
คำตอบ:
ค่าเฉลี่ยของการแจกแจงนั้นถูกนิยามในรูปของอินทิกรัล (ผมจะเขียนมันเหมือนว่าสำหรับการแจกแจงแบบต่อเนื่อง - ในฐานะอินทิกรัลรีมันน์พูด - แต่ปัญหานี้ใช้กันโดยทั่วๆไปเราสามารถดำเนินการ สิ่งเหล่านี้ถูกต้องและพร้อมกัน):
แต่นั่นหมายความว่าอย่างไร มันเป็นชวเลขอย่างมีประสิทธิภาพ
หรือ
(แม้ว่าคุณสามารถทำลายมันได้ทุกที่ไม่ใช่แค่ที่ 0)
ปัญหาเกิดขึ้นเมื่อข้อ จำกัด ของอินทิกรัลเหล่านั้นไม่ จำกัด
ยกตัวอย่างเช่นลองพิจารณาความหนาแน่น Cauchy มาตรฐานซึ่งเป็นสัดส่วนกับ ... ทราบว่า
ให้ดังนั้น d u = 2 x
ซึ่งไม่ จำกัด ขีด จำกัด ในครึ่งล่างยังไม่แน่นอน ความคาดหวังจึงไม่ได้กำหนด
หรือถ้าเรามีตัวแปรสุ่มของเราเป็นค่าสัมบูรณ์ของ Cauchy มาตรฐานความคาดหวังทั้งหมดของมันจะเป็นสัดส่วนกับขีด จำกัด นั้นที่เราเพิ่งดู (เช่น )
ในทางกลับกันความหนาแน่นอื่น ๆ บางอย่างยังคงดำเนินต่อไป "ไม่มีที่สิ้นสุด" แต่อินทิกรัลของพวกมันมีขีด จำกัด
คำตอบอื่น ๆ เป็นสิ่งที่ดี แต่อาจไม่โน้มน้าวใจทุกคนโดยเฉพาะอย่างยิ่งคนที่มองการ แจกจ่าย Cauchy (ที่มี ) และบอกว่ามันยังคงชัดเจนว่าค่าเฉลี่ยควรเป็นศูนย์
เหตุผลที่ใช้งานง่ายคำตอบไม่ถูกต้องจากมุมมองทางคณิตศาสตร์คือสาเหตุที่Riemann สายใยทฤษฎีบท (วิดีโอ)
อย่างมีประสิทธิภาพสิ่งที่คุณทำเมื่อคุณดู Cauchy และบอกว่า "ควรจะเป็นศูนย์" หมายความว่าคุณกำลังแยก "ศูนย์" ที่ศูนย์และจากนั้นอ้างช่วงเวลาของความสมดุลสองขนาด หรือกล่าวอีกนัยหนึ่งว่าคุณกำลังทำผลรวมอนันต์ด้วย "ครึ่ง" ของคำศัพท์เชิงบวก (ช่วงเวลาที่แต่ละจุดไปทางขวา) และ "ครึ่ง" ข้อกำหนดเชิงลบ (ช่วงเวลาที่แต่ละจุดไปทางซ้าย) และอ้างสิทธิ์ ผลรวมเป็นศูนย์ (สำหรับความคิดทางเทคนิค: )
ทฤษฎีการจัดเรียง Riemann กล่าวว่าผลรวมอนันต์ประเภทนี้ (หนึ่งที่มีทั้งคำบวกและลบ) จะสอดคล้องกันก็ต่อเมื่อทั้งสองซีรีส์ (เงื่อนไขเชิงบวกเท่านั้นและเงื่อนไขเชิงลบเท่านั้น) จะมาบรรจบกันเมื่อถ่ายอย่างอิสระ หากทั้งสองข้าง (บวกและลบ) มีความแตกต่างของตัวเองแล้วคุณสามารถมากับคำสั่งของผลรวมของข้อตกลงดังกล่าวว่าสรุปการใด ๆจำนวน (วิดีโอด้านบนเริ่มต้นที่ 6:50)
ดังนั้นใช่ถ้าคุณทำการสรุปในลักษณะที่สมดุลจาก 0 out ช่วงเวลาแรกจากการแจกแจง Cauchy จะถูกยกเลิก อย่างไรก็ตามคำจำกัดความของมาตรฐาน (มาตรฐาน) ไม่ได้บังคับใช้คำสั่งของการรวมนี้ คุณควรจะสามารถสรุปช่วงเวลาในลำดับใดก็ได้และมีความถูกต้องเท่ากัน ดังนั้นความหมายของการกระจาย Cauchy จึงไม่ได้ถูกกำหนด - โดยการเลือกอย่างรอบคอบว่าคุณรวมช่วงเวลาอย่างไรคุณสามารถทำให้พวกเขา "สมดุล" (หรือไม่) ในทางใดทางหนึ่ง
ดังนั้นเพื่อให้ค่าเฉลี่ยของการกระจายที่กำหนดไว้ทั้งสองปริพันธ์ช่วงเวลาที่ต้องการให้แต่ละเป็นอิสระมาบรรจบกัน ( จำกัด ) รอบที่เสนอค่าเฉลี่ย (ซึ่งเมื่อคุณทำคณิตศาสตร์เป็นจริงเพียงวิธีที่บอกอีกว่าหนึ่งเล่ม ( ) จะต้องมีการรวมกัน) หากก้อยเป็น "อ้วน" มากพอที่จะทำให้ช่วงเวลาที่ไม่มีที่สิ้นสุดด้านใดด้านหนึ่งแสดงว่าคุณทำเสร็จแล้ว คุณไม่สามารถสร้างความสมดุลกับช่วงเวลาที่ไม่มีที่สิ้นสุดในอีกด้านหนึ่ง
ฉันควรพูดถึงว่าพฤติกรรม "ต่อต้านสัญชาตญาณ" ของสิ่งต่าง ๆ เช่นการแจกจ่าย Cauchy นั้นเกิดจากปัญหาเมื่อคิดถึงเรื่องอนันต์ ใช้การกระจาย Cauchy และตัดหาง - แม้โดยพลการไกลออกไปเช่นที่บวก / ลบหมายเลข xkcd - และ (เมื่อปรับมาตรฐานอีกครั้ง) คุณจะได้รับสิ่งที่ประพฤติดีและมีค่าเฉลี่ยที่กำหนดไว้ ไม่ใช่หางไขมันที่มีปัญหาในตัวของมันเองและเป็นหางที่มีพฤติกรรมเมื่อคุณเข้าใกล้อนันต์
Abrial ทั่วไปและ Glen_b มีคำตอบที่สมบูรณ์แบบ ฉันต้องการเพิ่มการสาธิตขนาดเล็กเพื่อแสดงให้คุณเห็นค่าเฉลี่ยของการกระจาย Cauchy ไม่มีอยู่ / ไม่มาบรรจบกัน
ในการทดสอบต่อไปนี้คุณจะเห็นแม้ว่าคุณจะได้รับตัวอย่างจำนวนมากและทำการคำนวณค่าเฉลี่ยเชิงประจักษ์จากตัวอย่าง แต่ตัวเลขนั้นค่อนข้างแตกต่างจากการทดสอบไปจนถึงการทดสอบ
set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))
คุณสามารถสังเกตได้ว่าเรามีการทดลองครั้งและในแต่ละการทดลองเราสุ่มตัวอย่าง1 × 10 5คะแนนจากการแจกแจงสองครั้งด้วยขนาดตัวอย่างขนาดใหญ่ค่าเฉลี่ยเชิงประจักษ์ในการทดลองที่แตกต่างกันควรใกล้เคียงกับค่าเฉลี่ยจริง ผลลัพธ์แสดงการกระจาย Cauchy ไม่มีค่าเฉลี่ยการรวมตัว แต่การกระจายปกติมี
แก้ไข:
ตามที่ @ mark999 ที่กล่าวถึงในการแชทเราควรโต้แย้งว่าการแจกแจงสองแบบที่ใช้ในการทดสอบมี "ความแปรปรวน" ที่คล้ายกัน (เหตุผลที่ฉันใช้เครื่องหมายคำพูดคือ นี่คือเหตุผล: PDF ของพวกเขาคล้ายกัน
โปรดสังเกตว่าโดยการดู PDF ของการแจกแจง Cauchy เราจะเดาว่าเป็นแต่จากการทดลองที่เราเห็นมันไม่มีอยู่จริง นั่นคือประเด็นของการสาธิต
curve(dnorm, -8,8)
curve(dcauchy, -8,8)
ตามคำนิยามของ Lebesgue-Stieltjes อินทิกรัลค่าเฉลี่ยจะอยู่ถ้า:
https://en.wikipedia.org/wiki/Moment_(mathematics)#Significance_of_the_moments
เนื่องจากการกระจายบนวงกลมนั้นสมมาตรแบบหมุนจึงไม่สามารถมีค่าเฉลี่ยมัธยฐานหรือโหมดบนวงกลมได้ ในทำนองเดียวกันช่วงเวลาที่สูงขึ้นเช่นความแปรปรวนไม่สามารถเข้าใจได้ การกระจายนี้เกิดขึ้นตามธรรมชาติในหลายบริบท ตัวอย่างเช่นโครงการปัจจุบันของฉันเกี่ยวข้องกับภาพกล้องจุลทรรศน์ของเนื้อเยื่อมะเร็ง วัตถุจำนวนมากในภาพไม่สมมาตรและ "ทิศทาง" สามารถกำหนดให้กับแต่ละวัตถุได้ สมมติฐานว่างเปล่าที่ชัดเจนคือทิศทางเหล่านี้มีการกระจายอย่างสม่ำเสมอ