จะค้นหาระยะทางที่คาดหวังระหว่างจุดที่กระจายอย่างสม่ำเสมอสองจุดอย่างไร


9

หากฉันต้องกำหนดพิกัดและโดยที่(X1,Y1)(X2,Y2)

X1,X2Unif(0,30) and Y1,Y2Unif(0,40).

ฉันจะหาค่าที่คาดหวังของระยะทางระหว่างพวกเขาได้อย่างไร

ฉันคิดว่าเนื่องจากระยะทางคำนวณโดยค่าที่คาดหวัง เพิ่งจะเป็น ?(X1X2)2+(Y1Y2)2)(1/30+1/30)2+(1/40+1/40)2


รหัส LaTeX ของคุณแสดงผลไม่ถูกต้อง ฉันหวังว่าการแก้ไขของฉันคือสิ่งที่คุณตั้งใจไว้
Peter Flom

เกือบแล้ว แต่มันก็ช่วยพาฉันไปที่นั่นในตอนท้ายขอบคุณมาก
Mathlete

2
คำถามที่เทียบเท่าในเว็บไซต์คณิตศาสตร์: ระยะทางเฉลี่ยระหว่างจุดสุ่มในสี่เหลี่ยมผืนผ้า คำถามที่เกี่ยวข้อง: ความน่าจะเป็นที่จุดสุ่มสม่ำเสมอในรูปสี่เหลี่ยมผืนผ้ามีระยะทางยุคลิดน้อยกว่าเกณฑ์ที่กำหนด ( แต่น่าเสียดายที่ฉันไม่เคยได้รอบเพื่อการขึ้น @whuber คำแนะนำของเขามีผมจะพยายามหาเวลาที่จะทำ..)
พระคาร์ดินัล

1
ขอบคุณสำหรับลิงก์เหล่านั้น @cardinal แม้ว่ารุ่นคณิตศาสตร์จะไม่อธิบายคำตอบ - เพียงแค่แสดงมัน - มันมีลิงก์ไปยังแหล่งที่มาหนึ่งซึ่งมีค่าการตรวจสอบ
whuber

คำตอบ:


2
##problem
x <- runif(1000000,0,30)
y <- runif(1000000,0,40)
Uniform <- as.data.frame(cbind(x,y))
n <- nrow(Uniform)
catch <- rep(NA,n)
for (i in 2:n) {
      catch[i] <-((x[i+1]-x[i])^2 + (y[i+1]-y[i])^2)^.5
}
mean(catch, na.rm=TRUE)
18.35855

ถ้าฉันเข้าใจสิ่งที่คุณต้องการอย่างถูกต้องอาจช่วยได้ คุณกำลังพยายามหาระยะทางระหว่างจุดสุ่มที่มีค่า X ที่สร้างจาก unif (0,30) และค่า Y ถูกสร้างจาก unif (0,40) ฉันเพิ่งสร้าง RV หนึ่งล้านตัวจากแต่ละตัวไปยังการแจกแจงแล้วผูก x กับ y เพื่อสร้างจุดสำหรับแต่ละอัน จากนั้นฉันคำนวณระยะทางระหว่างจุดที่ 2 ถึง 1 จนถึงระยะทางระหว่างจุด 1,000,000 ถึง 999,999 ระยะทางเฉลี่ยคือ 18.35855 แจ้งให้เราทราบหากนี่ไม่ใช่สิ่งที่คุณต้องการ


ใช้เสรีภาพในการแก้ไขสำหรับการจัดรูปแบบ
อยากรู้อยากเห็น _cat

2
คุณเข้ามาใกล้พอสมควร - โดยบังเอิญ คำตอบที่แท้จริงคือ = 18.345919รหัสของคุณมีปัญหาสองประการ: (1) การวนซ้ำไม่เป็นอิสระต่อกัน และ (2) เพื่อให้ได้ความแม่นยำที่สมเหตุสมผลจึงควรเขียนโค้ดให้เร็วขึ้น ทำไมไม่ทำแบบจำลองโดยตรงในขณะที่ ที่คุณจะได้รับประมาณสี่ตัวเลขที่สำคัญ (ในเวลาที่น้อยกว่า) ที่คุณสามารถตรวจสอบได้โดยการคำนวณผิดพลาดมาตรฐาน 1108(871+960log(2)+405log(3))18.345919n <- 10^7; distance <- sqrt((runif(n,0,30)-runif(n,0,30))^2 + (runif(n,0,40)-runif(n,0,40))^2)sd(distance) / sqrt(n)
whuber

@whuber: คุณสามารถอธิบาย # 1 ของคุณได้หรือไม่ เช่นพูด (กรณี -I) ฉันดึงตัวเลขสุ่มคู่จากการแจกแจงใด ๆ และความแตกต่างจากการคำนวณและหาค่าเฉลี่ย เมื่อเทียบกับ (Case-II) ฉันยังคงวาดหมายเลขหนึ่งครั้งและยังคงคำนวณความแตกต่างในการทำงานเกี่ยวกับการจับหมายเลขล่าสุดแล้วเฉลี่ย ค่าเฉลี่ยที่รายงานโดย Case-I และ Case-II จะแตกต่างกันอย่างเป็นระบบหรือไม่
อยากรู้อยากเห็น _cat

1
@curious_cat ไม่ค่าเฉลี่ยจะใกล้เคียงกัน แต่การคำนวณข้อผิดพลาดมาตรฐานจะแตกต่างกัน เราต้องการการคำนวณเพื่อประเมินว่าค่าเฉลี่ยน่าจะใกล้เคียงกับมูลค่าที่แท้จริงมากเพียงใด แทนที่จะคำนวณการคำนวณ SE ที่ซับซ้อนมากขึ้นมันง่ายกว่าเพียงแค่สร้างจุดคู่ที่เป็นอิสระจากกันอย่างสมบูรณ์ตามที่ระบุไว้ในคำถาม (มีหลายวิธีที่การจำลองสามารถผิดพลาดได้ - ฉันรู้จากประสบการณ์! - เป็นการฉลาดที่จะทำให้การจำลองเลียนแบบความจริงให้ใกล้เคียงที่สุด)
whuber

@whuber: ขอบคุณสำหรับการชี้แจง ดังนั้นถ้าคลาร์กรันโค้ดของเขานานกว่านี้เขาอาจได้ตำแหน่งทศนิยมมากขึ้นใช่มั้ย
อยากรู้อยากเห็น _cat

16

เป็นธรรมดาจากการดูคำถามทางเรขาคณิตว่าระยะทางที่คาดหวังระหว่างจุดอิสระสองจุดที่เหมือนกันและเป็นแบบสุ่มภายในเซตนูนนั้นจะมีเส้นผ่านศูนย์กลางน้อยกว่าครึ่งหนึ่งเล็กน้อย (ควรจะน้อยกว่าเพราะมันค่อนข้างหายากสำหรับจุดสองจุดที่จะอยู่ในพื้นที่ที่รุนแรงเช่นมุมและบ่อยครั้งที่พวกเขาจะอยู่ใกล้กับศูนย์กลางที่พวกเขาอยู่ใกล้) เนื่องจากเส้นผ่าศูนย์กลางของสี่เหลี่ยมผืนผ้านี้คือโดยสิ่งนี้ ด้วยเหตุผลเพียงอย่างเดียวเราคาดว่าคำตอบจะน้อยกว่าเล็กน้อย5025

คำตอบที่แน่นอนได้มาจากคำนิยามของความคาดหวังเป็นค่าน้ำหนักความน่าจะเป็นของระยะทาง โดยทั่วไปพิจารณาสี่เหลี่ยมผืนผ้าด้านและ ; เราจะขยายมันให้มีขนาดที่ถูกต้องหลังจากนั้น (โดยการตั้งค่าและทวีคูณความคาดหวัง ) สำหรับรูปสี่เหลี่ยมผืนผ้านี้โดยใช้พิกัดความหนาแน่นเครื่องแบบน่าจะเป็นDY ระยะทางเฉลี่ยภายในสี่เหลี่ยมผืนผ้านี้จะถูกกำหนดโดย1λλ=40/3030(x,y)1λdxdy

0λ010λ01(x1x2)2+(y1y2)21λdx1dy11λdx2dy2.

การใช้วิธีการบูรณาการเบื้องต้นนี้เป็นสิ่งที่ตรงไปตรงมา ฉันใช้ระบบพีชคณิตคอมพิวเตอร์ ( Mathematica ) เพื่อรับคำตอบ

[2+2λ521+λ2+6λ21+λ22λ41+λ2+5λArcSinh(λ)+5λ4log(1+1+λ2λ)]/(30λ2).

การปรากฏตัวของในหลาย ๆ เงื่อนไขเหล่านี้ไม่น่าแปลกใจ: มันคือเส้นผ่านศูนย์กลางของสี่เหลี่ยมผืนผ้า (ระยะทางสูงสุดที่เป็นไปได้ระหว่างจุดสองจุดใด ๆ ภายใน) การปรากฏตัวของลอการิทึม (ซึ่งรวมถึงอาร์กซิงห์) นั้นไม่น่าแปลกใจหากคุณเคยตรวจสอบระยะทางเฉลี่ยภายในตัวเลขระนาบแบบง่าย ๆ : มันจะปรากฏขึ้นเสมอ (คำใบ้ของสิ่งนี้จะปรากฏในส่วนของฟังก์ชันเซแคนท์) อนึ่งการมีอยู่ในส่วนไม่มีส่วนเกี่ยวข้องกับปัญหาเฉพาะที่เกี่ยวข้องกับสี่เหลี่ยมด้านและ : เป็นค่าคงที่สากล)1+λ2303040

ด้วยและปรับขึ้นจากปัจจัยของประเมินนี้เพื่อ18.345919λ=4/3301108(871+960log(2)+405log(3))18.345919


วิธีหนึ่งที่จะเข้าใจสถานการณ์อย่างลึกซึ้งยิ่งขึ้นคือการพล็อตระยะทางเฉลี่ยญาติเส้นผ่าศูนย์กลางของสำหรับค่าที่แตกต่างกัน\สำหรับค่าสุดขีด (ใกล้หรือมากกว่า ) สี่เหลี่ยมผืนผ้าจะกลายเป็นมิติเดียวและการรวมกลุ่มระดับประถมศึกษามากขึ้นบ่งชี้ว่าระยะทางเฉลี่ยควรลดลงหนึ่งในสามของเส้นผ่าศูนย์กลาง นอกจากนี้เนื่องจากรูปทรงสี่เหลี่ยมกับและเหมือนกันมันเป็นธรรมชาติที่จะพล็อตผลในลอการิทึมขนาดของที่มันจะต้องเป็นแบบสมมาตรเกี่ยวกับ (ตาราง) นี่มันคือ:1+λ2λ01λ1/λλλ=1

พล็อต

ด้วยสิ่งนี้เราเรียนรู้กฎของหัวแม่มือ : ระยะทางเฉลี่ยในสี่เหลี่ยมผืนผ้าอยู่ระหว่างและ (ประมาณ)ของเส้นผ่านศูนย์กลางของมันด้วยค่าที่ใหญ่กว่าที่เกี่ยวข้องกับสี่เหลี่ยมมุมฉากและค่าที่เล็กลงซึ่งเกี่ยวข้องกับผอมยาว (เส้นตรง) ) สี่เหลี่ยมผืนผ้า จุดกึ่งกลางระหว่างขั้วเหล่านี้จะประสบความสำเร็จประมาณสำหรับรูปสี่เหลี่ยมที่มีอัตราส่วนของ 1 ด้วยกฎนี้คุณสามารถมองไปที่สี่เหลี่ยมผืนผ้าและประมาณระยะทางเฉลี่ยของมันเป็นตัวเลขสองตัวที่สำคัญ1/30.330.373:1


ควรเป็น "ทแยงมุม" แทนที่จะเป็น "เส้นผ่าศูนย์กลาง" หรือไม่? ขออภัยถ้าฉันกำลัง nitpicking
อยากรู้อยากเห็น _cat

@curious_cat ตามคำนิยามเส้นผ่านศูนย์กลางของชุดของจุด (ในพื้นที่ตัวชี้วัดใด ๆ ) คือระยะห่างสูงสุดระหว่างจุดสองจุดใด ๆ สำหรับสี่เหลี่ยมผืนผ้ามันคือ (ชัด) ความยาวของเส้นทแยงมุม
whuber

ขอบคุณ! ฉันไม่ได้ตระหนักว่า ฉันใช้แนวคิดไร้เดียงสาของเส้นผ่านศูนย์กลาง
อยากรู้อยากเห็น _cat

ในฐานะที่เป็นกัน: สำหรับทุกสี่เหลี่ยมของพื้นที่ที่กำหนดจะลดระยะห่างเฉลี่ยสำหรับสี่เหลี่ยม?
อยากรู้อยากเห็น _cat

2
ด้วยจิตวิญญาณของสิ่งนี้ฉันหวังว่าคุณจะได้เริ่มต้นคำตอบนี้ด้วย "มันเป็นเครื่องบิน ... " (+1)
cardinal
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.