ฉันจะสร้างตัวเลขตามการแจกแจงโซลิตันได้อย่างไร


10

การแจกแจงโซลิตันเป็นการแจกแจงความน่าจะเป็นแบบแยกส่วนเหนือชุด{1,...,ยังไม่มีข้อความ}ด้วยฟังก์ชันมวลความน่าจะเป็น

พี(1)=1ยังไม่มีข้อความ,พี(k)=1k(k-1)สำหรับ k{2,...,ยังไม่มีข้อความ}

ฉันต้องการใช้มันเป็นส่วนหนึ่งของการใช้งานรหัส LTโดยเฉพาะอย่างยิ่งใน Python ที่มีตัวสร้างตัวเลขสุ่มแบบสม่ำเสมอให้บริการ

คำตอบ:


9

ถ้าเราเริ่มต้นที่k=2ผลรวมของกล้องโทรทรรศน์จะให้1-1/kสำหรับ (แก้ไข) CDF อินเวอร์เตอร์นี้และดูแลกรณีพิเศษk=1ให้อัลกอริทึมต่อไปนี้ (เขียนRเป็นฉันกลัว แต่คุณสามารถใช้มันเป็นรหัสเทียมสำหรับการดำเนินการหลาม):

rsoliton <- function(n.values, n=2) {
  x <- runif(n.values)         # Uniform values in [0,1)
  i <- ceiling(1/x)            # Modified soliton distribution
  i[i > n] <- 1                # Convert extreme values to 1
  i
}

เป็นตัวอย่างของการใช้ (และการทดสอบ) ลองวาดค่าสำหรับN = 10 :105ยังไม่มีข้อความ=10

n.trials <- 10^5
i <- rsoliton(n.trials, n=10)
freq <- table(i) / n.trials  # Tabulate frequencies
plot(freq, type="h", lwd=6)

การแจกแจงความถี่


1
สำหรับการแจกแจงโซลิตัน "ที่มีประสิทธิภาพ" ที่เกี่ยวข้องคุณอาจต้องชำระเงินสำหรับโซลูชันที่มีประสิทธิภาพน้อยกว่าเล็กน้อย (ขึ้นอยู่กับการค้นหาแบบไบนารี่หรือเทียบเท่า)
whuber

คุณคิดอย่างนั้นได้อย่างไร
Alex Chamberlain

2
@ Alex Chamberlain เพราะเขาดี: D
gui11aume

7

Python (ดัดแปลงมาจากโซลูชัน R ของ @ whuber's )

from __future__ import print_function, division                                           
import random                                                                   
from math import ceil                                                           

def soliton(N, seed):                                                           
  prng = random.Random()                                                        
  prng.seed(seed)                                                                  
  while 1:                                                                         
    x = random.random() # Uniform values in [0, 1)                                 
    i = int(ceil(1/x))       # Modified soliton distribution                            
    yield i if i <= N else 1 # Correct extreme values to 1                         

if __name__ == '__main__':                                                         
  N = 10                                                                           
  T = 10 ** 5 # Number of trials                                                   
  s = soliton(N, s = soliton(N, random.randint(0, 2 ** 32 - 1)) # soliton generator                   
  f = [0]*N                       # frequency counter                              
  for j in range(T):                                                               
    i = next(s)                                                                    
    f[i-1] += 1                                                                    

  print("k\tFreq.\tExpected Prob\tObserved Prob\n");                               

  print("{:d}\t{:d}\t{:f}\t{:f}".format(1, f[0], 1/N, f[0]/T))                     
  for k in range(2, N+1):                                                          
    print("{:d}\t{:d}\t{:f}\t{:f}".format(k, f[k-1], 1/(k*(k-1)), f[k-1]/T))

ตัวอย่างผลลัพธ์

k   Freq.   Expected Prob   Observed Prob

1   9965    0.100000    0.099650
2   49901   0.500000    0.499010
3   16709   0.166667    0.167090
4   8382    0.083333    0.083820
5   4971    0.050000    0.049710
6   3354    0.033333    0.033540
7   2462    0.023810    0.024620
8   1755    0.017857    0.017550
9   1363    0.013889    0.013630
10  1138    0.011111    0.011380

ความต้องการ

รหัสควรทำงานใน Python 2 หรือ 3


+1 ขอบคุณที่แบ่งปันการแปล Python ยินดีต้อนรับสู่เว็บไซต์ของเรา!
whuber

ไม่ต้องห่วง. หากฉันได้รับรหัส LT ทำงานได้พวกเขาจะอยู่ใน GitHub
Alex Chamberlain

1
การดำเนินงาน @whuber LT ในขณะนี้บนGitHub ไม่สมบูรณ์แบบ แต่เป็นการเริ่มต้น
อเล็กซ์แชมเบอร์เลน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.