การสร้าง rv แบบแยกซึ่งมีส่วนสนับสนุน rationals ทั้งหมดใน


19

นี่คือภาคต่อของคอนสตรัคติวิสต์ของคำถามนี้

หากเราไม่สามารถมีตัวแปรสุ่มแบบไม่ต่อเนื่องที่สนับสนุนการปันส่วนทั้งหมดในช่วงดังนั้นสิ่งที่ดีที่สุดถัดไปคือ: [0,1]

สร้างตัวแปรสุ่มที่มีการสนับสนุนนี้และมันตามการแจกแจงบางอย่าง และช่างในตัวฉันต้องการให้ตัวแปรแบบสุ่มนี้สร้างขึ้นจากการแจกแจงที่มีอยู่แทนที่จะสร้างขึ้นโดยการกำหนดสิ่งที่เราต้องการได้อย่างเป็นนามธรรมQQQ[0,1]

ดังนั้นฉันจึงคิดสิ่งต่อไปนี้:

ให้เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องหลังจากการกระจายทางเรขาคณิต - ตัวแปร II ที่มีพารามิเตอร์คือX0<p<1

X{0,1,2,...},P(X=k)=(1p)kp,FX(X)=1(1p)k+1

ปล่อยให้เป็นตัวแปรสุ่มแบบไม่ต่อเนื่องหลังจากการแจกแจงเชิงเรขาคณิต - ตัวแปร I ที่มีพารามิเตอร์เหมือนกันคือYp

Y{1,2,...},P(Y=k)=(1p)k1p,FY(Y)=1(1p)k

Xและเป็นอิสระ กำหนดตัวแปรสุ่มในขณะนี้Y

Q=XY

และพิจารณาการแจกแจงแบบมีเงื่อนไข

P(Qq{XY})

ในคำหลวม "เงื่อนไขคืออัตราส่วนของมากกว่าเงื่อนไขเมื่อมีขนาดเล็กกว่าหรือเท่ากับ " การสนับสนุนการแจกแจงแบบมีเงื่อนไขนี้คือ[0,1]X Y X Y { 0 , 1 , 1 / 2 , 1 / 3 , . . , 1 / k , 1 / ( k + 1 ) , . . , 2 / 3 , 2 / 4 , . . } = Q[ 0 , 1 ]QXYXY{0,1,1/2,1/3,...,1/k,1/(k+1),...,2/3,2/4,...}=Q[0,1]

"คำถาม" คือ: ใครบางคนสามารถให้ฟังก์ชั่นมวลน่าจะเป็นเงื่อนไขที่เกี่ยวข้อง?

ความคิดเห็นถามว่า "ควรเป็นแบบปิด" หรือไม่? เนื่องจากสิ่งที่ถือว่าเป็นรูปแบบปิดในปัจจุบันไม่ชัดเจนดังนั้นให้ฉันเอาแบบนี้: เรากำลังค้นหารูปแบบการทำงานที่เราสามารถป้อนจำนวนตรรกยะจากและรับความน่าจะเป็น (สำหรับบางคน ค่าที่ระบุของพารามิเตอร์แน่นอน) ซึ่งนำไปสู่กราฟบ่งชี้ของ pmf จากนั้นให้แตกต่างกันเพื่อดูว่ากราฟเปลี่ยนแปลงไปอย่างไรหน้า[0,1]pp

ถ้าช่วยแล้วเราสามารถทำให้หนึ่งหรือทั้งสองเปิดขอบเขตของการสนับสนุนแม้ว่าสายพันธุ์เหล่านี้จะกีดกันเราจากความสามารถในการสร้างกราฟแน่นอนค่าบนและ / หรือล่างของPMF นอกจากนี้ถ้าเราทำให้เปิดผูกไว้บนแล้วเราควรพิจารณาเครื่องเหตุการณ์\}{X<Y}

อีกวิธีหนึ่งคือผมยินดีต้อนรับยัง RV ของอื่น ๆ ที่มีการสนับสนุนนี้ (s), ตราบเท่าที่พวกเขามาพร้อมกับ PMF

ฉันใช้การกระจายแบบเรขาคณิตเพราะมันมีสองตัวแปรพร้อมที่ไม่รวมศูนย์ในการสนับสนุน (เพื่อหลีกเลี่ยงการหารด้วยศูนย์) เห็นได้ชัดว่าเราสามารถใช้ rv แยกอื่น ๆ โดยใช้การตัดทอน

แน่นอนที่สุดฉันจะให้ความสำคัญกับคำถามนี้ แต่ระบบไม่อนุญาตทันที


1
คุณหมายถึง ? (การกำหนดตัวแปรแบบสุ่มตามเงื่อนไขกับบางสิ่งที่ไม่สมเหตุสมผลคุณสามารถกำหนดการกระจายด้วยวิธีนี้เท่านั้น)Q=XY1{XY}
Stéphane Laurent

1
Q ของคุณนับได้: คุณรู้ว่ามีการโต้ตอบ 1-1 ระหว่าง N = {1, 2, ... } และ Q. หากคุณสามารถหาจดหมายโต้ตอบดังกล่าวได้โซลูชันจะเลือกการกระจายใด ๆ เหนือ N และใช้งาน เพื่อเลือกองค์ประกอบที่เกี่ยวข้องของ Q.
Adrian

อย่างไรก็ตามคุณต้องคำนวณสำหรับทุกส่วนที่ลดลงและนี่คือldots) p / q Pr ( X = p , X = 2 p , ) × Pr ( Y = q , Y = 2 q , )Pr(X/Y=p/q)p/qPr(X=p,X=2p,)×Pr(Y=q,Y=2q,)
Stéphane Laurent

1
ข้อกำหนดในการจัดหา PMF นั้นหมายความว่าจำเป็นต้องมีแบบฟอร์มปิดหรือไม่? หรือว่าเป็นผลรวมอนันต์ของ @ StéphaneLaurentเพียงพอที่จะทำตามเงื่อนไขได้หรือไม่
Juho Kokkala

1
ให้และ Y RV ในโพสต์ของคุณ P r [ Q = q ] = P r [ Y = f - 1 ( q ) ]f:NQ[0,1]Pr[Q=q]=Pr[Y=f1(q)]
Adrian

คำตอบ:


19

พิจารณาการกระจายแบบไม่ต่อเนื่องพร้อมการสนับสนุนในเซตพร้อมความน่าจะเป็นจำนวนมาก{ ( p , q )F{(p,q)|qp1}N2

F(p,q)=321+p+q.

นี่คือผลรวมอย่างง่าย (ชุดทั้งหมดที่เกี่ยวข้องกับเรขาคณิต) เพื่อแสดงให้เห็นว่ามันคือการกระจาย (ความน่าจะเป็นรวมเป็นเอกภาพ)

สำหรับจำนวนจริงใด ๆ ที่ไม่ใช่ศูนย์ให้เป็นตัวแทนในข้อตกลงต่ำสุดนั่นคือและ 1a / b = x b > 0 gcd ( a , b ) = 1xa/b=xb>0gcd(a,b)=1

G [ 0 , 1 ] QFทำให้เกิดการแจกแจงแบบแยกส่วนในผ่านกฎG[0,1]Q

G(x)=G(ab)=n=1F(an,bn)=321+a+b2.

(และ ) ทุกจำนวนจริงในมีความน่าจะเป็นศูนย์ (ถ้าคุณต้องมี.หมู่ค่ากับความน่าจะเป็นในเชิงบวกเพียงแค่ใช้เวลาบางส่วนของความน่าจะอยู่ห่างจากหมายเลขอื่นที่ชอบ - --and กำหนดให้ .)( 0G(0)=00 1 0(0,1]010

เพื่อให้เข้าใจถึงสิ่งก่อสร้างนี้ดูภาพนี้ของ :F

[รูปของ F]

p , q F p / q p q 0 1Fให้มวลความน่าจะเป็นที่จุดพร้อมพิกัดอินทิกรัลบวก Values ​​ofแสดงด้วยพื้นที่สีของสัญลักษณ์วงกลม เส้นมีความลาดชันสำหรับการรวมกันของพิกัดและเป็นไปได้ทั้งหมดในพล็อต พวกเขามีสีในลักษณะเดียวกันสัญลักษณ์วงกลมคือ: ตามความลาดชันของพวกเขา ดังนั้นความชัน (ซึ่งมีช่วงตั้งแต่ถึงอย่างชัดเจน) และสีตรงกับอาร์กิวเมนต์ของและค่าจะได้มาจากการรวมพื้นที่ของวงกลมทั้งหมดที่อยู่ในแต่ละบรรทัด เช่นp,qFp/qpq01G G ( 1 ) 1 F ( 1 , 1 ) + F ( 2 , 2 ) + F ( 3 , 3 ) + 3 / 8 + 3 / 32 +GGG(1)ได้มาจากการรวมพื้นที่ของวงกลมทั้งหมด (สีแดง) ตามแนวทแยงมุมหลักของความชันซึ่งกำหนดโดย =1/21F(1,1)+F(2,2)+F(3,3)+3/8+3/32+3/128+=1/2

รูป

ตัวเลขนี้แสดงให้เห็นว่าการประมาณเพื่อประสบความสำเร็จโดยการ จำกัด : มันแปลงค่าที่สรุปตัวเลขตั้งแต่ผ่าน1ความน่าจะเป็นที่มากที่สุดคือ\q 100 3044Gq10030441 11/100112,314,110,362,362,142,

นี่คือ CDF แบบเต็มของ (แม่นยำกับความละเอียดของภาพ) ตัวเลขหกตัวที่อยู่ในรายการนั้นมีขนาดของการกระโดดที่มองเห็นได้ แต่ทุกส่วนของ CDFประกอบด้วยการกระโดดโดยไม่มีข้อยกเว้น:G

รูปที่ 2


1
ขอบคุณ! ฉันอยู่ในกระบวนการทำความเข้าใจการก่อสร้าง เพียงสองคำถาม: a)เป็น bivariate แต่ในการเชื่อมโยงไปยังนั้นจะปรากฏเป็น univariate ฉันพลาดอะไรไปรึเปล่า? และ b) เนื่องจากคงที่ฉันเดาว่าจุดทั้งหมดในกราฟแรกที่ดูน่าประทับใจแสดงถึงค่าที่แตกต่างกันในแกนนอน G GFGG
Alecos Papadopoulos

ฉันเพิ่งกรอกตัวเลขที่อาจกล่าวถึงความคิดเห็นของคุณ Alecos และได้เพิ่มไว้ในคำตอบ โปรดทราบว่าฉันสามารถเริ่มต้นด้วยการแจกแจงแบบไม่ต่อเนื่องและสร้างในวิธีเดียวกัน การกระจายแบบพิเศษนี้ถูกเลือกเพื่อให้การคำนวณง่ายขึ้น GFG
whuber

ดีขึ้นและดีขึ้นสำหรับคำถามแรกของฉันในความคิดเห็นก่อนหน้านี้ควรเป็นแทนหรือไม่ นั่นคือและ ? F(ab,n)p=a/bq=nF(abn)p=a/bq=n
Alecos Papadopoulos

นี่เป็นคำตอบที่ดีกว่าของฉัน! ฉันสังเกตเห็นสองสิ่งเล็กน้อย: ฉันคิดว่าผลรวมของคุณ (p, q) ถึง 4 ตามที่เขียนไว้ นอกจากนี้ในสมการด้านล่าง "F ทำให้เกิดการกระจายแบบไม่ต่อเนื่อง G" คุณควรมี F (na, nb) ไม่?
Adrian

@ เอเดรียน Alecos ขอบคุณสำหรับการจับความผิดพลาดเหล่านั้น:ควรเป็นและสัญกรณ์สำหรับเห็นได้ชัดว่าไม่ถูกต้อง ฉันจะแก้ไขพวกเขาทันที - 1 F11F
whuber

8

ฉันจะใส่ความคิดเห็นของฉันเข้าด้วยกันและโพสต์ไว้เป็นคำตอบเพื่อความชัดเจน ฉันคาดหวังว่าคุณจะไม่พอใจอย่างมากอย่างไรก็ตามสิ่งที่ฉันทำคือลดปัญหาของคุณให้เป็นปัญหาอื่น

สัญกรณ์ของฉัน:

Qเป็น RV ที่มีการสนับสนุนเป็น - ฉันคือไม่ได้เช่นเดียวกับโครงสร้าง OP จากเขา{Y} เราจะนิยามนี้โดยใช้และซึ่งฉันแนะนำด้านล่าง QQ[0,1]QXQ QYfXYQYf

Yคือ RV ที่มีการสนับสนุน -ที่ OP ที่ให้ไว้จะทำงานได้ YN{1,2,}Y

คือการติดต่อแบบหนึ่งต่อหนึ่ง f : NQ[ 0 , 1 ]และ f - 1เป็นสิ่งที่ตรงกันข้าม เรารู้ว่าสิ่งเหล่านี้มีอยู่จริงff:NQ[0,1]f1

ตอนนี้ฉันอ้างว่าฉันสามารถลดปัญหาของคุณเพียงแค่หาและf - 1 :ff1

เพียงแค่ให้เสร็จแล้ว PMF ของQคือPr [ Q = q ] = Pr [ YQ=f(Y)QPr[Q=q]=Pr[Y=f1(q)]

แก้ไข:

fแม้ว่าจะไม่ใช่การติดต่อแบบตัวต่อตัว (เพราะซ้ำซ้อน):

g <- function(y) {
    y <- as.integer(y)
    stopifnot(y >= 1)
    b <- 0
    a <- 0
    for (unused_index in seq(1, y)) {
        if (a >= b) {
            b <- b+1
            a <- 0
        } else {
            a <- a+1
        }
    }
    return(sprintf("q = %s / %s", a, b))
    ## return(a / b)
}

N{1,2,}ff1
Alecos Papadopoulos

f1

ในลิงค์ที่คุณให้ไว้มันบอกว่าในบางจุด: "โปรดจำไว้ว่ามันไม่จำเป็นที่จะต้องหาสูตรสำหรับการโต้ตอบ แต่สิ่งที่จำเป็นคือความมั่นใจว่าการโต้ตอบนั้นมีอยู่จริงมีอินสแตนซ์อื่น ๆ อีกมากมายในคณิตศาสตร์เช่นนี้ - ทุกที่ที่แสดงให้เห็นว่ามีอะไรบางอย่างเกิดขึ้นหรือมีอะไรบางอย่างมากกว่าจะแสดงสูตรจริง " ประเด็นในคำถามของฉันคือการแสดงสูตรจริง : ฉันเรียกคำถามนี้ว่า "คอนตรัคติวิสต์" ด้วยเหตุผล
Alecos Papadopoulos

1
ฉันคิดว่าฉันสามารถให้อัลกอริทึมที่ใช้งานได้ - ฉันจะลองคิดดูอีกสักหน่อย
เอเดรียน

ฉันโพสต์บางอย่าง - ให้คุณจำลอง Q แต่ไม่สามารถแก้ปัญหา PMF ได้
Adrian
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.