คำถามติดแท็ก cdf

ฟังก์ชันการกระจายสะสม ในขณะที่ PDF ให้ความหนาแน่นของความน่าจะเป็นของแต่ละค่าของตัวแปรสุ่ม CDF (มักจะแสดงเป็น ) ให้ความน่าจะเป็นที่ตัวแปรสุ่มจะน้อยกว่าหรือเท่ากับค่าที่ระบุ F(x)

1
การอ้างอิง: ส่วนท้ายของ c ผกผัน
ฉันเกือบจะแน่ใจว่าฉันได้เห็นผลลัพธ์ต่อไปนี้ในสถิติ แต่ฉันจำไม่ได้ว่าอยู่ที่ไหน ถ้าเป็นตัวแปรสุ่มแบบบวกและดังนั้นเมื่อโดยที่คือ CDF ของXE ( X ) &lt; ∞ ε F - 1 ( 1 - ε ) → 0 ε → 0 + F XXXXE(X)&lt;∞E(X)&lt;∞\mathbb{E}(X)<\inftyεF−1(1−ε)→0εF−1(1−ε)→0\varepsilon F^{-1}(1-\varepsilon) \to 0ε→0+ε→0+\varepsilon\to 0^+FFFXXX นี้เป็นเรื่องง่ายที่จะเห็นทางเรขาคณิตโดยใช้ความเสมอภาคและโดยพิจารณาตัดแนวนอนที่ของพื้นที่ใต้เส้นโค้งของ integrand 1-Fε 1 - FE(X)=∫1−FE(X)=∫1−F\mathbb{E}(X)=\int 1-Fεε\varepsilon1−F1−F1-F คุณรู้จักการอ้างอิงสำหรับผลลัพธ์นี้และมีชื่อหรือไม่

2
อะไรคือความหมายที่เข้าใจง่ายที่อยู่เบื้องหลังการเสียบตัวแปรสุ่มเข้ากับ pdf หรือ cdf ของมันเอง
โดยทั่วไปแล้วไฟล์ PDF จะเขียนเป็นโดยที่ตัวพิมพ์เล็กนั้นถือว่าเป็นการรับรู้หรือผลลัพธ์ของตัวแปรสุ่มซึ่งมี pdf นั้น ในทำนองเดียวกัน CDF เขียนเป็นซึ่งมีความหมาย&lt;x) อย่างไรก็ตามในบางสถานการณ์เช่นคำจำกัดความของฟังก์ชั่นการให้คะแนนและการได้มาซึ่ง cdf นั้นมีการกระจายอย่างสม่ำเสมอปรากฏว่าตัวแปรสุ่มถูกเสียบเข้ากับ pdf / cdf ของตัวเอง เราจะได้ตัวแปรสุ่มใหม่หรือf(x|θ)f(x|θ)f(x|\theta)xxxXXXFX(x)FX(x)F_X(x)P(X&lt;x)P(X&lt;x)P(X<x)XXX Y=f(X|θ)Y=f(X|θ)Y=f(X|\theta)Z=FX(X)Z=FX(X)Z=F_X(X). ฉันไม่คิดว่าเราจะเรียกไฟล์นี้ว่า pdf หรือ cdf ได้อีกต่อไปเพราะตอนนี้มันเป็นตัวแปรสุ่มและในกรณีหลัง "การตีความ"ดูเหมือนไร้สาระสำหรับฉันFX(X)=P(X&lt;X)FX(X)=P(X&lt;X)F_X(X)=P(X<X) นอกจากนี้ในกรณีหลังข้างต้นฉันไม่แน่ใจว่าฉันเข้าใจคำแถลงว่า "cdf ของตัวแปรสุ่มตามการแจกแจงแบบเดียวกัน" cdf เป็นฟังก์ชั่นไม่ใช่ตัวแปรสุ่มดังนั้นจึงไม่มีการแจกแจง แต่สิ่งที่มีการแจกแจงแบบสม่ำเสมอคือตัวแปรสุ่มที่แปลงโดยใช้ฟังก์ชันที่แสดงถึง cdf ของตัวเอง แต่ฉันไม่เห็นว่าทำไมการแปลงนี้จึงมีความหมาย เช่นเดียวกันกับฟังก์ชันคะแนนซึ่งเราเสียบตัวแปรสุ่มเข้ากับฟังก์ชันที่แสดงถึงโอกาสในการบันทึกของมันเอง ฉันพยายามทำลายสมองของฉันเป็นเวลาหลายสัปดาห์เพื่อพยายามหาความหมายที่เข้าใจง่ายเบื้องหลังการเปลี่ยนแปลงเหล่านี้ แต่ฉันติดอยู่ ความเข้าใจใด ๆ จะได้รับการชื่นชมอย่างมาก!

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
CDF สองตัวอย่างของและจากการทดสอบ Kolmogorov-Smirnov ด้านเดียวคืออะไร
ฉันพยายามที่จะเข้าใจวิธีการรับค่าสำหรับการทดสอบ Kolmogorov-Smirnov ด้านเดียวและฉันพยายามหา CDF สำหรับและในกรณีตัวอย่างสองตัวอย่าง ด้านล่างนี้ถูกอ้างถึงในบางแห่งเนื่องจาก CDF สำหรับในกรณีตัวอย่างเดียว:pppD+n1,n2Dn1,n2+D^{+}_{n_{1},n_{2}}D−n1,n2Dn1,n2−D^{-}_{n_{1},n_{2}}D+nDn+D^{+}_{n} p+n(x)=P(D+n≥x|H0)=x∑j=0⌊n(1−x)⌋(nj)(jn+x)j−1(1−x−jn)n−jpn+(x)=P(Dn+≥x|H0)=x∑j=0⌊n(1−x)⌋(nj)(jn+x)j−1(1−x−jn)n−jp^{+}_{n}\left(x\right) = \text{P}\left(D^{+}_{n} \ge x | \text{H}_{0}\right) = x\sum_{j=0}^{\lfloor n\left(1-x\right)\rfloor}{ \binom{n}{j} \left(\frac{j}{n}+x\right)^{j-1}\left(1 - x - \frac{j}{n}\right)^{n-j}} นอกจากนี้ whuber sez มีสูตรที่แตกต่างกันเล็กน้อยของ CDF ตัวอย่างหนึ่งนี้ (ฉันแทนxxxสำหรับtttในเครื่องหมายคำพูดของเขาเพื่อความสอดคล้องกับสัญกรณ์ของฉันที่นี่): การใช้การแปลงค่าความน่าจะเป็นแบบครบวงจร, Donald Knuth ได้มาจากการแจกแจง (ร่วมกัน) บน p 57 และออกกำลังกาย 17 ของTAoCPเล่ม 2 ฉันพูด: (D+n≤xn−−√)=xnn∑c≤k≤x(nk)(k−x)k(x+n−k)n−k−1(Dn+≤xn)=xnn∑c≤k≤x(nk)(k−x)k(x+n−k)n−k−1\left(D^{+}_{n}\le \frac{x}{\sqrt{n}}\right)=\frac{x}{n^{n}}\sum_{c\le k\le x}\binom{n}{k}\left(k-x\right)^{k}\left(x+n-k\right)^{n-k-1} สิ่งนี้จะนำไปใช้กับสมมติฐานด้านเดียวในกรณีตัวอย่างหนึ่งตัวอย่างเช่น: H …

2
ความแปรปรวนของค่าเฉลี่ยตัวอย่างของตัวอย่างบู๊ตสแตรป
ให้เป็นข้อสังเกตที่ชัดเจน (ไม่มีความสัมพันธ์) ให้แสดงตัวอย่าง bootstrap (ตัวอย่างจาก CDF เชิงประจักษ์) และให้{*} ค้นหาและ{*})X1,...,XnX1,...,XnX_{1},...,X_{n}X∗1,...,X∗nX1∗,...,Xn∗X_{1}^{*},...,X_{n}^{*}X¯* * * *n=1nΣni = 1X* * * *ผมX¯n∗=1n∑i=1nXi∗\bar{X}_{n}^{*}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*}E(X¯* * * *n)E(X¯n∗)E(\bar{X}_{n}^{*})V a r (X¯* * * *n)Var(X¯n∗)\mathrm{Var}(\bar{X}_{n}^{*}) สิ่งที่ฉันมีอยู่คือคือแต่ละอันมีความน่าจะเป็นดังนั้น and ซึ่งให้ X* * * *ผมXi∗X_{i}^{*}X1, . . . ,XnX1,...,XnX_{1},...,X_{n}1n1n\frac{1}{n}E(X* * * *ผม) =1nE(X1) + . . . +1nE(Xn) =n μn= μE(Xi∗)=1nE(X1)+...+1nE(Xn)=nμn=μ E(X_{i}^{*})=\frac{1}{n}E(X_{1})+...+\frac{1}{n}E(X_{n})=\frac{n\mu}{n}=\mu …

2
การคำนวณการแจกแจงสะสมของการเบิกสูงสุดของการเดินสุ่มด้วยการดริฟท์
ฉันสนใจในการแจกแจงการเบิกสูงสุดของการเดินสุ่ม: ให้โดยที่ . เบิกเงินกู้สูงสุดหลังจากงวดเป็น\ max_ {0 \ le ฉัน \ le J \ le n} (x_i - X_j) กระดาษโดยMagdon-Ismail และ อัล ให้การแจกแจงสำหรับการดรอดาวน์สูงสุดของการเคลื่อนไหวบราวน์พร้อมดริฟท์ การแสดงออกเกี่ยวข้องกับผลรวมอนันต์ซึ่งรวมถึงคำบางคำที่กำหนดไว้โดยนัยเท่านั้น ฉันมีปัญหาในการเขียนการใช้งานซึ่งมาบรรจบกัน มีใครทราบถึงการแสดงออกทางเลือกของ CDF หรือการใช้งานอ้างอิงในรหัสหรือไม่X0=0,Xi+1=Xi+Yi+1X0=0,Xi+1=Xi+Yi+1X_0 = 0, X_{i+1} = X_i + Y_{i+1}Yi∼N(μ,1)Yi∼N(μ,1)Y_i \sim \mathcal{N}(\mu,1)nnnmax0≤i≤j≤n(Xi−Xj)max0≤i≤j≤n(Xi−Xj)\max_{0 \le i \le j \le n} (X_i - X_j)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.