อะไรคือความหมายที่เข้าใจง่ายที่อยู่เบื้องหลังการเสียบตัวแปรสุ่มเข้ากับ pdf หรือ cdf ของมันเอง


9

โดยทั่วไปแล้วไฟล์ PDF จะเขียนเป็นโดยที่ตัวพิมพ์เล็กนั้นถือว่าเป็นการรับรู้หรือผลลัพธ์ของตัวแปรสุ่มซึ่งมี pdf นั้น ในทำนองเดียวกัน CDF เขียนเป็นซึ่งมีความหมาย<x) อย่างไรก็ตามในบางสถานการณ์เช่นคำจำกัดความของฟังก์ชั่นการให้คะแนนและการได้มาซึ่ง cdf นั้นมีการกระจายอย่างสม่ำเสมอปรากฏว่าตัวแปรสุ่มถูกเสียบเข้ากับ pdf / cdf ของตัวเอง เราจะได้ตัวแปรสุ่มใหม่หรือf(x|θ)xXFX(x)P(X<x)X Y=f(X|θ)Z=FX(X). ฉันไม่คิดว่าเราจะเรียกไฟล์นี้ว่า pdf หรือ cdf ได้อีกต่อไปเพราะตอนนี้มันเป็นตัวแปรสุ่มและในกรณีหลัง "การตีความ"ดูเหมือนไร้สาระสำหรับฉันFX(X)=P(X<X)

นอกจากนี้ในกรณีหลังข้างต้นฉันไม่แน่ใจว่าฉันเข้าใจคำแถลงว่า "cdf ของตัวแปรสุ่มตามการแจกแจงแบบเดียวกัน" cdf เป็นฟังก์ชั่นไม่ใช่ตัวแปรสุ่มดังนั้นจึงไม่มีการแจกแจง แต่สิ่งที่มีการแจกแจงแบบสม่ำเสมอคือตัวแปรสุ่มที่แปลงโดยใช้ฟังก์ชันที่แสดงถึง cdf ของตัวเอง แต่ฉันไม่เห็นว่าทำไมการแปลงนี้จึงมีความหมาย เช่นเดียวกันกับฟังก์ชันคะแนนซึ่งเราเสียบตัวแปรสุ่มเข้ากับฟังก์ชันที่แสดงถึงโอกาสในการบันทึกของมันเอง

ฉันพยายามทำลายสมองของฉันเป็นเวลาหลายสัปดาห์เพื่อพยายามหาความหมายที่เข้าใจง่ายเบื้องหลังการเปลี่ยนแปลงเหล่านี้ แต่ฉันติดอยู่ ความเข้าใจใด ๆ จะได้รับการชื่นชมอย่างมาก!


4
สัญกรณ์อาจทำให้คุณสับสน เช่นเป็นสิ่งที่มีความหมายเป็นใช้ใด ๆฟังก์ชั่นที่วัดเพื่อจะเป็น สำหรับความหมายที่ถูกต้องคุณจะต้องมีความชัดเจนมากเกี่ยวกับสิ่งที่ตัวแปรสุ่มคือ สำหรับตัวแปรสุ่มฟังก์ชันสำหรับชัดเจนเป็นตัวแปรสุ่มดังนั้นจึงมีการกระจาย(สังเกตความหมายที่แตกต่างกันสองประการของสัญลักษณ์ " " ใน " ")มีความเหมือนกันหากมีการกระจายอย่างต่อเนื่อง FX(X)XX:ΩR,
Y:ωFX(X(ω))
ωΩFY.XFX(X)FYX
whuber

1
นี่ไม่ใช่ปัญหาเชิงทฤษฎี: เพื่อให้เข้าใจคุณอาจเพิกเฉยต่อการอ้างอิงทั้งหมดที่เกี่ยวข้องกับ "การวัดได้" คุณอาจได้รับประโยชน์จากการศึกษาทฤษฎีเซตเล็ก ๆ ในช่วงต้นของการเรียนระดับบัณฑิตศึกษา: นั่นเป็นที่ที่คนส่วนใหญ่เรียนรู้ว่าคำศัพท์ทางคณิตศาสตร์พื้นฐาน (และที่แพร่หลาย) และสัญกรณ์จริงๆหมายถึงอะไรดังนั้นจึงเป็นการดีที่สุดที่จะไม่หยุดเรียน
whuber

บางทีคำว่าทำไมเราควรทำสิ่งที่บ้าคลั่งเช่นนี้: ใส่ RV เข้าไปในความหนาแน่นของตัวเอง !!?! ตัวอย่างหนึ่ง: บอกว่าคุณต้องการประมาณความหนาแน่นของ X จากนั้นคุณสามารถวัดว่าคุณเก่งแค่ไหนโดยการรวมกับแต่นี่คือ "ไม่ยุติธรรม": คุณจะไม่ได้รับการประเมินที่ดีเมื่อคุณไม่มี ตัวอย่างข้อมูลจำนวนมาก (เช่นความหนาแน่นที่แท้จริงมีขนาดเล็ก) ดังนั้นการประเมินผลที่ "ยุติธรรม" จะเป็นการเพิ่มน้ำหนักคำโดยความหนาแน่นที่แท้จริง นี่คือผลของการแทรก RV เข้าไปในความหนาแน่นของตัวเองมากขึ้นหรือน้อยลง ...f(x)fX(x)
Fabian Werner

คำตอบ:


8

เช่นเดียวกับที่คุณพูดฟังก์ชั่นใด ๆ (วัดได้) ของตัวแปรสุ่มนั้นเป็นตัวแปรสุ่ม ง่ายกว่าที่จะคิดว่าและเป็น "ฟังก์ชั่นเก่า ๆ " พวกเขาเพิ่งจะมีคุณสมบัติที่ดี ตัวอย่างเช่นถ้าเป็น RV ชี้แจงมาตรฐานแล้วมีอะไรแปลก ๆ โดยเฉพาะอย่างยิ่งเกี่ยวกับตัวแปรสุ่มเป็น มันเกิดขึ้นเพียงเพื่อที่(X) ความจริงที่ว่ามีการกระจายชุด (ให้ที่เป็น RV ต่อเนื่อง) สามารถมองเห็นได้กรณีทั่วไปโดย deriving CDF ของYf(x)F(x)X

Y=1eX
Y=FX(X)YXY

FY(y)=P(Yy)=P(FX(X)y)=P(XFX1(y))=FX(FX1(y))=y

ซึ่งชัดเจนว่า CDF ของตัวแปรสุ่มหมายเหตุ: การพิสูจน์รุ่นนี้ถือว่าเพิ่มขึ้นอย่างต่อเนื่องและต่อเนื่อง แต่ก็ไม่ยากที่จะแสดงเวอร์ชันทั่วไปมากขึ้นU(0,1)FX(x)


1
ข้อสรุปของคุณไม่ถูกต้องสำหรับการเพิ่มขึ้นอย่างเข้มงวดที่สุดของ : คุณถือว่าเป็นตัวตน - แต่นั่นไม่ใช่กรณี FXFXFX1
whuber

ใช่ขอบคุณ. ตัวแปรสุ่มชัดเจนต้องต่อเนื่อง ตอนนี้ฉันขาดอะไรไปหรือเปล่า? X
knrumsey

1
FXไม่จำเป็นต้องมี bijective ยกตัวอย่างเช่นกรณีที่เองมีการแจกแจงแบบเดียวกัน! การปิดภาพของจะต้องเป็นช่วงเวลาทั้งหมด นั่นคือนิยามของการกระจายอย่างต่อเนื่อง XFX[0,1].
whuber

11

การแปลงของตัวแปรสุ่มโดยฟังก์ชันที่วัดได้เป็นตัวแปรสุ่มอีกซึ่งการแจกแจงจะได้รับจากการแปลงความน่าจะเป็นผกผัน สำหรับทุกชุดดังกล่าวว่าคือที่วัดได้อยู่ภายใต้การกระจายของxXT:XYY=T(X)

P(YA)=P(X{x;T(x)A})=defP(XT1(A))
A{x;T(x)A}X

คุณสมบัตินี้ใช้กับกรณีพิเศษเมื่อเป็น cdf ของตัวแปรสุ่ม :เป็นตัวแปรสุ่มใหม่ที่รับรู้ใน . เมื่อมันเกิดขึ้นจะถูกกระจายเป็นเครื่องแบบเมื่อต่อเนื่อง (ถ้าไม่ต่อเนื่องช่วงของจะไม่อีกต่อไปสิ่งที่เป็นกรณีคือเมื่อคือ Uniformจากนั้นมีการแจกแจงแบบเดียวกับโดยที่FX:X[0,1]XY=FX(X)[0,1]YU([0,1])FXFXY=FX(X)[0,1]UU([0,1])FX(U)XFXซึกผกผันทั่วไปของF_Xซึ่งเป็นวิธีที่เป็นทางการในการ (a) เข้าใจตัวแปรสุ่มในขณะที่การแปลงที่วัดได้ของตั้งแต่เป็นตัวแปรสุ่มที่มี cdfและ (b ) สร้างตัวแปรสุ่มจากการแจกแจงด้วย cdf )FXωΩX(ω)=FX(ω)FXFX

เพื่อให้เข้าใจถึงความขัดแย้งของให้เป็นตัวแทน ถ้าเป็นมาตรการที่ใช้ควบคุมและความหนาแน่นที่สอดคล้องกัน จากนั้น เป็นตัวแปรสุ่มตั้งแต่ขอบเขตบนของ อินทิกรัลเป็นแบบสุ่ม (นี่เป็นเพียงส่วนหนึ่งของการแสดงออก) ความขัดแย้งที่เห็นได้ชัดในเกิดจากความสับสนในสัญกรณ์ หากต้องการกำหนดอย่างเหมาะสมหนึ่งต้องการสองตัวแปรอิสระ ,และP(XX)

FX(x)=P(Xx)=0xdFX(x)=0xfX(x)dλ(x)
dλfX
FX(X)=0XdFX(x)=0XfX(x)dλ(x)
P(XX)XX1X2ซึ่งในกรณีที่ตัวแปรสุ่มจะถูกกำหนดโดยน่าจะถูกคำนวณสำหรับการกระจายของX_2FX(X1)
FX(X1)=PX2(X2X1)
X2

คำพูดเดียวกันนี้ใช้กับการแปลงโดยความหนาแน่น (pdf),ซึ่งเป็นตัวแปรสุ่มใหม่ยกเว้นว่ามันไม่มีการแจกแจงคงที่เมื่อเปลี่ยนแปลง อย่างไรก็ตามยังมีประโยชน์สำหรับวัตถุประสงค์ทางสถิติเมื่อพิจารณาตัวอย่างเช่นอัตราส่วนความน่าจะเป็นซึ่ง 2 x ลอการิทึมประมาณตัวแปรสุ่มใต้ เงื่อนไขบางประการfX(X)fXfX(X|θ^(X))/fX(X|θ0)χ2

และเช่นเดียวกันกับฟังก์ชันคะแนนซึ่งเป็นตัวแปรสุ่มที่คาดหวังว่ามันจะเป็นศูนย์เมื่อถ่ายที่ค่าจริงของพารามิเตอร์นั่นคือ

logfX(X|θ)θ
θ
Eθ0[logfX(X|θ0)θ]=logfX(x|θ0)θfX(x|θ0)dλ(x)=0

[คำตอบที่พิมพ์ขณะที่ @whuber และ @knrumsey กำลังพิมพ์คำตอบนั้น ๆ !]


คุณสามารถอธิบายในคำพูดสิ่งที่เป็นความหมาย / ความหมายของคำสั่ง ? สำหรับฉันแล้วดูเหมือนว่าการพูดว่า "cdf ของ rv มีการแจกแจงแบบเดียวกัน" ไม่สมเหตุสมผลเลย FX(X1)=P(X2X1)
mai

CDF ของ RVไม่ได้เป็นสิ่งเดียวกับการแปลงของ RVโดย CDF ของ RV นี้คือ(X) FXXFX(X)
ซีอาน

ใช่ฉันยอมรับว่าพวกเขาไม่เหมือนกัน ในอินสแตนซ์แรกมันไม่ใช่ rv ในขณะที่ในกรณีที่สองมันเป็น rv ฉันถูกต้องไหม?
mai

ใช่ซึ่งเกี่ยวข้องกับความหมายที่แตกต่างของในXFX(X)
ซีอาน

คุณสามารถอธิบายสิ่งที่คุณหมายถึงโดย "การคาดหวังเป็นศูนย์เมื่อนำมาที่ค่าที่แท้จริงของพารามิเตอร์ หรือไม่ดูเหมือนว่ากำลังถูกใช้เป็นตัวแปรที่นี่การเปลี่ยนแปลงอะไรถ้าไม่ได้อยู่ที่" ค่าจริง "θθθ
mai
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.