วิธีตัวอย่างจากการกระจายคันทอร์?


19

อะไรจะเป็นวิธีที่ดีที่สุดในการสุ่มตัวอย่างจากการกระจายคันทอร์ ? มันมี cdf เท่านั้นและเราไม่สามารถกลับด้านได้


4
อันที่จริงมีคนถามเรื่องคณิตศาสตร์: math.stackexchange.com/questions/1115907/ …
RUser4512

นี่คือคำถามติดตามที่น่าสนใจ: ค่าเบี่ยงเบนมาตรฐานคืออะไร? ฟังก์ชันสร้างโมเมนต์คืออะไร? พวกเขาเปรียบเทียบกับคู่หูของพวกเขาสำหรับการแจกแจงUniform อย่างไร :-)(0,1)
whuber

5
ฉันชอบวงวนไม่สิ้นสุดที่พวกคุณสร้างขึ้นโดยอ้างอิงโพสต์ math.stackexchange ซึ่งลิงก์กลับมาที่นี่: p
Tasos Papastylianou

คำตอบ:


23

ง่าย ๆ : ตัวอย่างจากการแจกแจงเครื่องแบบและบันทึกจากไบนารีเป็นสามส่วนตีความแต่ละ "1" เป็น "2" (นี่คือวิธีการแปลงความน่าจะเป็นแบบผกผัน: มันจะกลับ CDF!)(0,1)

รูป

นี่คือRการนำไปใช้งานซึ่งเขียนขึ้นในลักษณะที่ควรปรับพอร์ตให้พร้อมกับสภาพแวดล้อมการประมวลผลเกือบทุกชนิด

binary.to.ternary <- function(x) {
  y <- 0
  x <- round(2^52 * x)
  for (i in 1:52) {
    y <- y + 2*(x %% 2)
    y <- y/3
    x <- floor(x/2)
  }
  y
}

n <- 1000
x <- runif(n)
y <- binary.to.ternary(x)
plot(ecdf(y), pch=".")

3
ปีก่อนหน้านี้ผมเริ่มการดำเนินงานฟูลเลอร์เล็กน้อยgithub.com/Henrygb/CantorDist.Rกับฟังก์ชั่นrCantor(), qCantor(), pCantor()และมีความหมายน้อยdCantor()
เฮนรี่

1
@Henry สิ่งที่จะdcantorนำไปใช้? ในฐานะที่เป็นบันทึกของทิมการกระจายนี้ไม่มีความหนาแน่น มันไม่มีอะตอมที่ไม่ต่อเนื่องเช่นกัน มันเป็นตัวอย่างตามแบบฉบับของการกระจายอย่างต่อเนื่อง แต่ไม่ต่อเนื่องอย่างแน่นอน (ฉันชอบการนำไปใช้งานของqcantorBTW - มันน่าจะเร็วโดยอาศัยการใช้ประโยชน์จากการคูณเมทริกซ์)
whuber

1
เราต้องจำไว้ว่าเรากำลังเผชิญกับการประมาณอัน จำกัด ต่อการกระจายตัวจริงเท่านั้น สมมติว่าเรามีตัวเลขที่มีความแม่นยำ 10 หลัก (ในทางปฏิบัติพวกเขาจะใช้เวลานานกว่า) และเราสร้าง 0.0222020002 เพื่อ "แสดง" ตัวแปรซึ่งตัวเลขนั้นขยายออกไปอีก ในขณะที่ความคิดเห็นเดียวกันใช้กับ rv มูลค่าจริงใด ๆ ที่มี rv อย่างต่อเนื่องทุกค่า "แทน" ทั้งหมดการประมาณความยาวแน่นอนสามารถยืนได้ก็คือ "ในชุด" ในการแจกแจงคันทอร์ที่แท้จริง "การสืบเนื่อง" เกือบทั้งหมดของลำดับสิบหลักนั้นไม่ได้อยู่ในชุด ... ctd
Glen_b -Reinstate Monica

1
@ คนที่ฉันยอมรับอย่างชัดเจนว่าทุกวิธีในการสร้างตัวเลขสุ่มมีความแม่นยำแน่นอนในประโยคที่สองของฉัน ที่คุณเลือกที่จะทำซ้ำและเน้นที่คุณให้มันแสดงให้เห็นว่าคุณพลาดจุดที่แท้จริงของฉันที่นั่น; เมื่อฉันเป็นตัวแทนของความแปรปรวนอย่างต่อเนื่องเพื่อความแม่นยำ จำกัด ค่าจริงที่การประมาณแบบ จำกัดสามารถแทนได้คือ "ในเซต" ที่เราต้องการสร้างขึ้น เมื่อฉันเป็นตัวแทนของตัวแปรเช่นนี้เพื่อความแม่นยำแน่นอนค่าจริงเช่นการประมาณแบบ จำกัด สามารถแทนได้เกือบทั้งหมดไม่ได้อยู่ในชุด มันค่อนข้างแตกต่างกัน ... ctd
Glen_b -Reinstate Monica

1
ctd ... ไม่มีการวิจารณ์โพสต์ของคุณ มันเป็นประเด็นที่ผู้อ่านอาจมองข้ามและอาจต้องการพิจารณาโดยเฉพาะอย่างยิ่งหากพวกเขาพยายามที่จะอนุมานคุณสมบัติของคันทอร์ที่กำหนดโดยการจำลองจากมัน
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.