เราสามารถใช้วิธีการต่าง ๆ ในการนี้สิ่งใด ๆ ที่อาจดูเหมือนเป็นเรื่องง่ายสำหรับบางคน คำตอบนี้ได้ทำการสำรวจแนวทางหลายอย่างซึ่งครอบคลุมส่วนสำคัญของความคิดทางคณิตศาสตร์ - การวิเคราะห์ (ที่ไม่มีที่สิ้นสุดและน้อยที่สุด) เรขาคณิต / โทโพโลยี (ความสัมพันธ์เชิงพื้นที่) และพีชคณิต (รูปแบบทางการของการจัดการสัญลักษณ์) - เช่นเดียวกับความน่าจะเป็น มันถึงจุดสูงสุดในการสังเกตที่รวมทั้งสี่แนวทางแสดงให้เห็นว่ามีคำถามของแท้ที่จะตอบที่นี่และแสดงให้เห็นว่าปัญหาคืออะไร แต่ละวิธีจะให้ข้อมูลเชิงลึกเกี่ยวกับธรรมชาติของรูปร่างของฟังก์ชันการแจกแจงความน่าจะเป็นของผลรวมของตัวแปรเครื่องแบบอิสระ
พื้นหลัง
การกระจายUniform[0,1]มีคำอธิบายพื้นฐานหลายประการ เมื่อมีการแจกแจงเช่นนั้นX
โอกาสที่อยู่ในเซตวัดได้เป็นเพียงการวัด (ความยาว) ของ , เขียน.A A ∩ [ 0 , 1 ] | A ∩ [ 0 , 1 ] |XAA∩[0,1]|A∩[0,1]|
จากนี้เป็นทันทีที่ฟังก์ชันการแจกแจงสะสม (CDF) คือ
FX(x)=Pr(X≤x)=|(−∞,x]∩[0,1]|=|[0,min(x,1)]|=⎧⎩⎨⎪⎪0x1x<00≤x≤1x>1.
ฟังก์ชั่นความหนาแน่นของความน่าจะเป็น (PDF) ซึ่งเป็นที่มาของ CDF เป็นสำหรับและมิฉะนั้น (ไม่ได้กำหนดไว้ที่และ )fX(x)=10≤x≤1fX(x)=001
ปรีชาจากฟังก์ชั่นลักษณะ (การวิเคราะห์)
ลักษณะการทำงาน (CF) ของตัวแปรสุ่มเป็นความหวังของคน (ที่เป็นหน่วยจินตภาพ ) การใช้ PDF ของชุดการกระจายเราสามารถคำนวณได้Xi i 2 = - 1exp(itX)ii2=−1
ϕX(t)=∫∞−∞exp(itx)fX(x)dx=∫10exp(itx)dx=exp(itx)it∣∣∣x=1x=0=exp(it)−1it.
CF เป็น (รุ่น) ฟูเรียร์ของไฟล์ PDF,(t) ทฤษฎีพื้นฐานเกี่ยวกับการแปลงฟูริเยร์คือ:ϕ(t)=f^(t)
f(x)=ϕˇ(x)=12π∫∞−∞exp(−ixt)ϕ(t)dt.
เมื่อสามารถหาอนุพันธ์ได้อนุพันธ์ของมันสามารถคำนวณได้ภายใต้เครื่องหมายอินทิกรัล:f
f′(x)=ddx12π∫∞−∞exp(−ixt)ϕ(t)dt=−i2π∫∞−∞texp(−ixt)ϕ(t)dt.
เพื่อให้มีความชัดเจนดีอินทิกรัลสุดท้ายต้องมาบรรจบกันอย่างแน่นอน นั่นคือ,
∫∞−∞|texp(−ixt)ϕ(t)|dt=∫∞−∞|t||ϕ(t)|dt
จะต้องมาบรรจบกับค่า จำกัด ในทางกลับกันเมื่อมันมาบรรจบกันอนุพันธ์จะมีอยู่ทุกหนทุกแห่งโดยอาศัยสูตรผกผันเหล่านี้
ตอนนี้มันชัดเจนว่าความแตกต่างของ PDF สำหรับผลรวมของตัวแปรเครื่องแบบคือ: จากสัญลักษณ์แรก, CF ของผลรวมของตัวแปร iid คือ CF ของหนึ่งในนั้นยกกำลังพลังงาน, นี่เท่ากับ n เศษเป็นที่สิ้นสุด (มันประกอบด้วยคลื่นไซน์) ในขณะที่ตัวหารเป็น{n}) เราสามารถคูณเช่น integrand โดย และมันจะยังคงมาบรรจบกันอย่างยิ่งเมื่อและมาบรรจบกันตามเงื่อนไขเมื่อn-1 ดังนั้นการใช้สัญลักษณ์แสดงหัวข้อย่อยที่สามซ้ำแสดงว่า PDF สำหรับผลรวมของชุดรูปแบบจะเป็นแบบต่อเนื่องnnth(exp(it)−1)n/(it)nO(tn)tss<n−1s=n−1nn−2ความแตกต่างของเวลาและในสถานที่ส่วนใหญ่มันจะแตกต่างกันเท่าn−1
เส้นโค้งสีเทาสีน้ำเงินเป็นพล็อตบันทึกการใช้งานของค่าสัมบูรณ์ของส่วนที่แท้จริงของ CF ของผลรวมของชุดรูปแบบ iid ที่ต่างกัน เส้นประสีแดงเป็นเส้นกำกับ ความชันของมันคือซึ่งแสดงว่า PDF นั้นคือเท่าที่สามารถหาอนุพันธ์ได้ สำหรับการอ้างอิงเส้นโค้งสีเทาพล็อตจริงของ CF สำหรับฟังก์ชัน Gaussian ที่มีรูปร่างคล้ายกัน (PDF ปกติ)n=10−1010−2=8
ปรีชาจากความน่าจะเป็น
ให้และเป็นตัวแปรสุ่มอิสระที่มีการแจกแจงแบบสม่ำเสมอพิจารณาช่วงเวลาที่แคบเราแยกโอกาสที่เป็นโอกาสที่อยู่ใกล้กับช่วงเวลานี้มากพอโอกาสที่เป็นขนาดที่เหมาะสม เพื่อวางในช่วงเวลานี้เนื่องจากอยู่ใกล้พอ:YXX[0,1](t,t+dt]X+Y∈(t,t+dt]YXX+YY
fX+Y(t)dt=Pr(X+Y∈(t,t+dt])=Pr(X+Y∈(t,t+dt]|Y∈(t−1,t+dt])Pr(Y∈(t−1,t+dt])=Pr(X∈(t−Y,t−Y+dt]|Y∈(t−1,t+dt])(FY(t+dt)−FY(t−1))=1dt(FY(t+dt)−FY(t−1)).
ความเสมอภาคสุดท้ายมาจากการแสดงออกสำหรับรูปแบบไฟล์ PDF ของXหารทั้งสองข้างด้วยและรับค่าตามที่ให้d t d t → 0Xdtdt→0
fX+Y(t)=FY(t)−FY(t−1).
ในคำอื่น ๆ เพิ่มเครื่องแบบตัวแปรการใด ๆตัวแปรเปลี่ยนแปลงรูปแบบไฟล์ PDFเป็น differenced CDF(t-1) เนื่องจาก PDF เป็นอนุพันธ์ของ CDF นี่ก็หมายความว่าในแต่ละครั้งที่เราเพิ่มตัวแปรเครื่องแบบอิสระให้กับไฟล์ PDF ที่ได้จะมีความแตกต่างกันมากกว่าครั้งก่อน X[0,1]XYfYFY(t)−FY(t−1)Y
ลองใช้ข้อมูลเชิงลึกนี้เริ่มต้นด้วยตัวแปรเครื่องแบบYPDF ต้นฉบับไม่สามารถเปลี่ยนแปลงได้ที่หรือ : ไม่ต่อเนื่องที่นั่น รูปแบบไฟล์ PDF ของไม่ได้เป็นอนุพันธ์ที่ ,หรือแต่มันต้องต่อเนื่องที่จุดนั้นเพราะมันคือความแตกต่างของปริพันธ์ของไฟล์ PDF ของ Yเพิ่มตัวแปรเครื่องแบบอิสระอื่นอีก : PDF ของนั้นสามารถหาค่าได้ที่ , ,และ - แต่มันไม่จำเป็นต้องมีวินาทีY01Y+X012YX2Y+X+X2 0123อนุพันธ์ที่จุดเหล่านั้น และอื่น ๆ
สัญชาตญาณจากเรขาคณิต
CDF ที่ของผลรวมของเครื่องแบบ IID variates เท่ากับปริมาณของหน่วย hypercube ที่นอนภายในครึ่งพื้นที่เสื้อ สถานการณ์สำหรับ variates จะแสดงที่นี่มีชุดที่ ,และจากนั้น5/2tn[0,1]nx1+x2+⋯+xn≤tn=3t1/23/25/2
ในฐานะที่เป็นความคืบหน้าจากผ่านที่ไฮเปอร์เพลข้ามจุดที่ , n ในแต่ละครั้งที่รูปร่างของส่วนไขว้มีการเปลี่ยนแปลง: ในภาพก่อนเป็นรูปสามเหลี่ยม ( -simplex) จากนั้นเป็นรูปหกเหลี่ยมจากนั้นรูปสามเหลี่ยมอีกครั้ง ทำไมไม่ PDF มีโค้งหักศอกที่ค่าเหล่านี้ของ ?t0nHn(t):x1+x2+⋯+xn=tt=0t=1,…,t=n2t
เพื่อทำความเข้าใจนี้ก่อนพิจารณาค่าเล็ก ๆ ของเสื้อที่นี่ไฮเปอร์เพลนตัด -simplex ออก ทั้งหมดขนาดของเริมเป็นสัดส่วนโดยตรงกับไหน "พื้นที่" ของมันเป็นสัดส่วนกับ{n-1} สัญลักษณ์บางอย่างสำหรับสิ่งนี้จะมีประโยชน์ในภายหลัง ให้เป็น "ฟังก์ชันขั้นตอนต่อหน่วย"tHn(t)n−1n−1ttn−1θ
θ(x)={01x<0x≥0.
หากไม่ใช่สำหรับการปรากฏตัวของอีกมุมหนึ่งของ hypercube การปรับขนาดนี้จะดำเนินต่อไปเรื่อย ๆ พล็อตของพื้นที่ของ -simplex จะมีลักษณะเป็นเส้นโค้งสีน้ำเงินทึบด้านล่าง: มันเป็นศูนย์ที่ค่าลบและเท่ากับในแง่บวกเขียนได้อย่างสะดวก. มันมี "หงิกงอ" ของคำสั่งที่จุดกำเนิดในแง่ที่ว่าอนุพันธ์ทั้งหมดผ่านคำสั่งมีอยู่และต่อเนื่อง แต่อนุพันธ์ด้านซ้ายและขวาของคำสั่งมีอยู่ แต่ไม่เห็นด้วยที่แหล่งกำเนิด .n−1tn−1/(n−1)!θ(t)tn−1/(n−1)!n−2n−3n−2
(ส่วนโค้งอื่น ๆ ที่แสดงในรูปนี้คือ (สีแดง), (gold) และ (สีดำ) บทบาทของพวกเขาในกรณีจะกล่าวถึงต่อไปด้านล่าง)−3θ(t−1)(t−1)2/2!3θ(t−2)(t−2)2/2!−θ(t−3)(t−3)2/2!n=3
เพื่อให้เข้าใจสิ่งที่เกิดขึ้นเมื่อข้ามเรามาตรวจสอบอย่างละเอียดในกรณีที่โดยที่เรขาคณิตทั้งหมดเกิดขึ้นในระนาบ เราอาจดูหน่วย "คิวบ์" (ตอนนี้เป็นเพียงตาราง) เป็นการรวมกันเชิงเส้นของควอดเรนดังที่แสดงไว้ที่นี่:t1n=2
Quadrant แรกปรากฏในแผงด้านซ้ายล่างเป็นสีเทา ค่าของคือเพื่อหาเส้นทแยงมุมที่แสดงในพาเนลทั้งห้า CDF เท่ากับพื้นที่สีเหลืองที่แสดงทางด้านขวา พื้นที่สีเหลืองนี้ประกอบด้วย:t1.5
พื้นที่สีเทาสามเหลี่ยมในแผงด้านซ้ายล่าง
ลบพื้นที่สีเขียวรูปสามเหลี่ยมที่แผงด้านซ้ายบน
ลบพื้นที่สามเหลี่ยมสีแดงในแผงกลางต่ำ
บวกกับพื้นที่สีฟ้าใด ๆ ในแผงกลาง ( แต่ไม่มีพื้นที่ใด ๆ ดังกล่าวหรือจะมีจนกว่าเกิน )t2
หนึ่งในพื้นที่เหล่านี้คือพื้นที่ของรูปสามเหลี่ยม เครื่องชั่งแรกเช่นสองเครื่องถัดไปเป็นศูนย์สำหรับและเครื่องชั่งเช่นและสุดท้ายคือศูนย์สำหรับและอื่น ๆ เช่นเครื่องชั่งน้ำหนัก n การวิเคราะห์เชิงเรขาคณิตนี้ได้พิสูจน์แล้วว่า CDF เป็นสัดส่วนกับ = ; เท่ากับ PDF เป็นสัดส่วนกับผลรวมของทั้งสามฟังก์ชั่น ,และ2n=4tn=t2t<1(t−1)n=(t−1)2t<2(t−2)nθ(t)t2−θ(t−1)(t−1)2−θ(t−1)(t−1)2+θ(t−2)(t−2)2θ(t)t2−2θ(t−1)(t−1)2+θ(t−2)(t−2)2θ(t)t−2θ(t−1)(t−1)θ(t−2)(t−2)(แต่ละรายการจะถูกปรับเป็นเชิงเส้นเมื่อ ) แผงด้านซ้ายของรูปนี้แสดงกราฟ: เห็นได้ชัดว่าเป็นกราฟต้นฉบับทั้งหมดแต่ (a) เลื่อนจาก ,และหน่วยไปทางขวาและ (b) ช่วยลด ,และตามลำดับn=2θ(t)t0121−21
แผงด้านขวาแสดงผลรวมของกราฟเหล่านี้ (เส้นโค้งสีดำทึบซึ่งถูกทำให้เป็นมาตรฐานเพื่อให้มีพื้นที่หน่วย: นี่คือ PDF ที่มีลักษณะเชิงมุมที่แม่นยำแสดงในคำถามเดิม
ตอนนี้เราสามารถเข้าใจลักษณะของ "kinks" ใน PDF ของผลรวมของตัวแปรชุด iid พวกมันเหมือนกับ "หงิกงอ" ที่เกิดขึ้นที่ในฟังก์ชันอาจจะช่วยได้และเปลี่ยนเป็นจำนวนเต็มสอดคล้องกับตำแหน่งไฮเปอร์เพลนข้ามจุดยอดของ hypercube สำหรับนี้คือการเปลี่ยนแปลงที่มองเห็นได้ในทิศทางที่: อนุพันธ์ทางขวาของที่เป็นในขณะที่ตราสารอนุพันธ์ทางด้านซ้ายของมันคือ1สำหรับนี่คือสิ่งต่อเนื่อง0θ(t)tn−11,2,…,nHn(t)n=2θ(t)t001n=3เปลี่ยนทิศทาง แต่เป็นการเปลี่ยนแปลงอย่างฉับพลัน (ไม่ต่อเนื่อง) ในอนุพันธ์อันดับสอง สำหรับทั่วไปจะมีสัญญาซื้อขายล่วงหน้าอย่างต่อเนื่องผ่านการสั่งซื้อแต่ไม่ต่อเนื่องในส่วนอนุพันธ์nn−2n−1st
ปรีชาจากการจัดการพีชคณิต
การรวมเข้าด้วยกันเพื่อคำนวณ CF รูปแบบของความน่าจะเป็นเงื่อนไขในการวิเคราะห์ความน่าจะเป็นและการสังเคราะห์ไฮเปอร์คิวบ์เป็นการรวมกันเชิงเส้นของจตุภาคทั้งหมดแนะนำให้กลับไปที่การแจกแจงแบบดั้งเดิม . แน่นอนมันสามารถเขียน PDF ได้
fX(x)=θ(x)−θ(x−1).
ให้เราแนะนำตัวดำเนินการกะ : มันทำหน้าที่บนฟังก์ชันใด ๆโดยเลื่อนกราฟหนึ่งหน่วยไปทางขวา:Δf
(Δf)(x)=f(x−1).
อย่างเป็นทางการแล้วสำหรับ PDF ของตัวแปรชุดเราอาจเขียนX
fX=(1−Δ)θ.
PDF ของผลรวมของเครื่องแบบ iid คือการด้วยตัวมันเองครั้ง นี้ต่อไปจากความหมายของผลรวมของตัวแปรสุ่มที่ว่าบิดของทั้งสองฟังก์ชั่นและเป็นฟังก์ชั่นnfXnfg
(f⋆g)(x)=∫∞−∞f(x−y)g(y)dy.
มันเป็นเรื่องง่ายที่จะตรวจสอบว่าการเดินทางบิดกับ\เพียงเปลี่ยนตัวแปรของการรวมจากเป็น :Δyy+1
(f⋆(Δg))=∫∞−∞f(x−y)(Δg)(y)dy=∫∞−∞f(x−y)g(y−1)dy=∫∞−∞f((x−1)−y)g(y)dy=(Δ(f⋆g))(x).
สำหรับ PDF ของผลรวมของเครื่องแบบ iid ตอนนี้เราอาจดำเนินการทางพีชคณิตเพื่อเขียนn
f=f⋆nX=((1−Δ)θ)⋆n=(1−Δ)nθ⋆n
(โดยที่ "power" หมายถึงการบิดซ้ำซ้อน, ไม่ใช่การคูณด้วยคะแนน!) ตอนนี้เป็นการรวมกลุ่มโดยตรงโดยตรง⋆nθ⋆n
θ⋆n(x)=θ(x)xn−1n−1!.
ส่วนที่เหลือเป็นพีชคณิตเพราะทฤษฎีบททวินามใช้บังคับ (เช่นเดียวกับที่ใช้ในพีชคณิตการเปลี่ยนแปลงใด ๆ เหนือ reals):
f=(1−Δ)nθ⋆n=∑i=0n(−1)i(ni)Δiθ⋆n.
เนื่องจากเปลี่ยนการโต้แย้งโดยเดียวนี่เป็นการแสดงรูปแบบ PDFเป็นการรวมเชิงเส้นของเวอร์ชันที่เลื่อนของตรงตามที่เราอนุมานทางเรขาคณิต:Δiifθ(x)xn−1
f(x)=1(n−1)!∑i=0n(−1)i(ni)(x−i)n−1θ(x−i).
(จอห์นคุกเสนอราคาสูตรนี้ในโพสต์บล็อกของเขาโดยใช้เครื่องหมายสำหรับ )(x−i)n−1+(x−i)n−1θ(x−i)
ดังนั้นเนื่องจากเป็นฟังก์ชั่นที่ราบรื่นทุกที่พฤติกรรมเอกพจน์ของ PDF จะเกิดขึ้นเฉพาะในสถานที่ที่เป็นเอกพจน์ (เห็นได้ชัดแค่ ) และที่สถานที่เหล่านั้นเลื่อนไปทางขวาโดย . ธรรมชาติของพฤติกรรมเอกพจน์นั้น - ระดับความนุ่มนวล - จะเหมือนกันในทุกตำแหน่งที่xn−1θ(x)01,2,…,nn+1
ภาพประกอบนี้เป็นภาพสำหรับ , แสดง (ในแผงด้านซ้าย) แต่ละคำศัพท์ในผลรวมและ (ในแผงด้านขวา) ผลรวมบางส่วน, ปิดท้ายด้วยผลรวม (เส้นโค้งสีดำทึบ):n=8
การปิดความคิดเห็น
มันจะมีประโยชน์ที่จะต้องทราบว่าวิธีการสุดท้ายนี้ในที่สุดก็ให้ผลขนาดกะทัดรัดและการแสดงออกในทางปฏิบัติสำหรับการคำนวณ PDF ของผลรวมของตัวแปรเครื่องแบบ iid (ได้รับสูตรสำหรับ CDF ในทำนองเดียวกัน)n
ทฤษฎีขีด จำกัด กลางมีเพียงเล็กน้อยที่จะพูดที่นี่ ท้ายที่สุดผลรวมของตัวแปร iid Binomialจะรวมกันเป็นการแจกแจงแบบปกติ แต่ผลรวมนั้นจะแยกกันเสมอ : มันไม่เคยมีแม้แต่ PDF เลย! เราไม่ควรหวังสำหรับสัญชาตญาณใด ๆ เกี่ยวกับ "kinks" หรือมาตรการอื่น ๆ ของความแตกต่างของ PDF มาจาก CLT