คำถามติดแท็ก pdf

ฟังก์ชันความหนาแน่นน่าจะเป็น (PDF) ของตัวแปรสุ่มแบบต่อเนื่องให้ความน่าจะเป็นสัมพัทธ์สำหรับแต่ละค่าที่เป็นไปได้ ใช้แท็กนี้สำหรับฟังก์ชันมวลความน่าจะเป็นแบบแยก (PMF) เช่นกัน

1
การกระจายตัวเล็กน้อยของเส้นทแยงมุมของเมทริกซ์ Wishart แบบกระจาย
สมมติว่า ) ฉันสนใจในการกระจายร่อแร่ขององค์ประกอบในแนวทแยงวินิจฉัย( X ) = ( x 11 , ... , x พีพี ) มีผลลัพธ์ง่าย ๆ สองสามข้อเกี่ยวกับการกระจายตัวของเมทริกซ์ย่อยของX (อย่างน้อยก็บางอันอยู่ในวิกิพีเดีย) จากนี้ฉันสามารถคิดได้ว่าการกระจายตัวขององค์ประกอบเดี่ยวใด ๆ ในแนวทแยงเป็นแกมมาผกผัน แต่ฉันไม่สามารถอนุมานการกระจายข้อต่อได้X∼ InvWishart( ν, Σ0)X~InvWishart⁡(ν,Σ0)X\sim \operatorname{InvWishart}(\nu, \Sigma_0)วินิจฉัย( X) = ( x11, … , xพีพี)วินิจฉัย⁡(X)=(x11,...,xพีพี)\operatorname{diag}(X) = (x_{11}, \dots, x_{pp})XXX ฉันคิดว่าบางทีมันอาจจะมาจากองค์ประกอบเช่น: p ( x11|xผมฉัน, ฉัน> 1 ) p ( x22|xผมฉัน, ฉัน> …

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
มีตัวประมาณระยะทางของ Hellinger ระหว่างการแจกแจงสองแบบหรือไม่?
ในการตั้งค่าที่หนึ่งสังเกตกระจายออกมาจากการกระจายความหนาแน่นฉันสงสัยว่ามีการประมาณการที่เป็นกลาง (ตามx_i 's) ของระยะทาง Hellinger การกระจายที่มีความหนาแน่นอีกf_0คือ mathfrak \ {H} (f, f_0) = \ left \ {1 - \ int_ \ mathcal {X} \ sqrt {f (x) f_0 (x)} \ text {d} x \ right \} ^ {1/2} \ ,. f X ฉันf 0 H ( f , f 0 ) …

4
“ พื้นที่ทั้งหมดภายใต้ฟังก์ชันความหนาแน่นของความน่าจะเป็นคือ 1” - เทียบกับอะไร
แนวคิดฉันเข้าใจความหมายของวลี "พื้นที่ทั้งหมดภายใต้ PDF คือ 1" ควรหมายความว่าโอกาสที่ผลลัพธ์จะอยู่ในช่วงเวลาทั้งหมดของความเป็นไปได้คือ 100% แต่ฉันไม่เข้าใจจริง ๆ จากมุมมอง "เรขาคณิต" ยกตัวอย่างเช่นในรูปแบบ PDF แกน x หมายถึงความยาวพื้นที่ทั้งหมดที่อยู่ใต้ส่วนโค้งจะไม่ใหญ่ขึ้นถ้าวัดในหน่วยมิลลิเมตรเป็นมิลลิเมตรมากกว่ากิโลเมตรหรือไม่ ฉันมักจะลองนึกภาพว่าพื้นที่ใต้เส้นโค้งจะดูอย่างไรถ้าฟังก์ชั่นนั้นแบนเป็นเส้นตรง ความสูง (ตำแหน่งบนแกน y) ของบรรทัดนั้นจะเหมือนกันสำหรับ PDF ใด ๆ หรือจะมีค่าขึ้นอยู่กับช่วงเวลาในแกน x ที่ฟังก์ชันกำหนดไว้หรือไม่

3
เป็นวิธีการที่ , พิกัดเชิงขั้วกระจายเมื่อและเมื่อ ?
ให้คาร์ทีเซียนพิกัดของจุดสุ่มจะเลือกเซนต์(-10,10)x,yx,yx,y(x,y)∼U(−10,10)×U(−10,10)(x,y)∼U(−10,10)×U(−10,10)(x,y) \sim U(-10,10) \times U(-10,10) ดังนั้นรัศมีจะไม่กระจายอย่างสม่ำเสมอเป็นโดยนัย 's รูปแบบไฟล์ PDFρ=x2+y2−−−−−−√ρ=x2+y2\rho = \sqrt{x^2 + y^2}ρρ\rho อย่างไรก็ตามฉันคาดว่าเกือบจะเหมือนกันยกเว้นสิ่งประดิษฐ์เนื่องจากมีของเหลือ 4 ชิ้นที่ขอบ:θ=arctanyxθ=arctan⁡yx\theta = \arctan{\frac{y}{x}} ต่อไปนี้เป็นฟังก์ชันความหนาแน่นของความน่าจะเป็นที่คำนวณ grafically ของและ : θθ\thetaρρ\rho ตอนนี้ถ้าฉันปล่อยให้ถูกแจกจ่าย stจากนั้นดูเหมือนกระจายอย่างสม่ำเสมอ:x , y ∼ N ( 0 , 20 2 ) × N ( 0 , 20 2 ) θx,yx,yx,yx,y∼N(0,202)×N(0,202)x,y∼N(0,202)×N(0,202)x,y \sim N(0,20^2)\times N(0,20^2)θθ\theta ทำไมไม่เหมือนกันเมื่อและเป็นชุดเมื่อ ?θθ\theta(x,y)∼U(−10,10)×U(−10,10)(x,y)∼U(−10,10)×U(−10,10)(x,y) \sim …


2
เหตุใด CDF ของตัวอย่างกระจายอย่างสม่ำเสมอ
ฉันอ่านที่นี่ที่ได้รับตัวอย่างจากการกระจายอย่างต่อเนื่องกับ cdfตัวอย่างที่สอดคล้องกับเป็นไปตามการแจกแจงแบบมาตรฐานF X U ฉัน = F X ( X i )X1,X2,...,XnX1,X2,...,Xn X_1,X_2,...,X_n FXFX F_X Ui=FX(Xi)Ui=FX(Xi) U_i = F_X(X_i) ฉันตรวจสอบสิ่งนี้โดยใช้แบบจำลองเชิงคุณภาพใน Python และฉันสามารถตรวจสอบความสัมพันธ์ได้อย่างง่ายดาย import matplotlib.pyplot as plt import scipy.stats xs = scipy.stats.norm.rvs(5, 2, 10000) fig, axes = plt.subplots(1, 2, figsize=(9, 3)) axes[0].hist(xs, bins=50) axes[0].set_title("Samples") axes[1].hist( scipy.stats.norm.cdf(xs, 5, 2), bins=50 ) axes[1].set_title("CDF(samples)") …
17 pdf  uniform  cdf  intuition 

2
การกระจายตัวของคือ ,คือการแจกแจงแบบสม่ำเสมอ?
ฉันมีสี่อิสระตัวแปรกระจายอย่างสม่ำเสมอ , ในแต่ละ [0,1]ฉันต้องการที่จะคำนวณการกระจายของ(โฆษณา)ฉันคำนวณการกระจายตัวของเป็น (ดังนั้น ) และจากจะเป็นตอนนี้การกระจายของจำนวนเงินที่คือ (นอกจากนี้ยังมี อิสระ)เพราะa,b,c,da,b,c,da,b,c,d[0,1][0,1][0,1](a−d)2+4bc(a−d)2+4bc(a-d)^2+4bcu2=4bcu2=4bcu_2=4bcf2(u2)=−14lnu24f2(u2)=−14ln⁡u24f_2(u_2)=-\frac{1}{4}\ln\frac{u_2}{4}u2∈(0,4]u2∈(0,4]u_2\in(0,4]u1=(a−d)2u1=(a−d)2u_1=(a-d)^2 f1(u1)=1−u1−−√u1−−√.f1(u1)=1−u1u1.f_1(u_1)=\frac{1-\sqrt{u_1}}{\sqrt{u_1}}.u1+u2u1+u2u_1+u_2u1,u2u1,u2u_1,\, u_2fu1+u2(x)=∫+∞−∞f1(x−y)f2(y)dy=−14∫401−x−y−−−−√x−y−−−−√⋅lny4dy,fu1+u2(x)=∫−∞+∞f1(x−y)f2(y)dy=−14∫041−x−yx−y⋅ln⁡y4dy,f_{u_1+u_2}(x)=\int_{-\infty}^{+\infty}f_1(x-y)f_2(y)dy=-\frac{1}{4}\int_0^4\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy,y∈(0,4]y∈(0,4]y\in(0,4]. ที่นี่จะต้องเป็นดังนั้นอินทิกรัลเท่ากับตอนนี้ฉันแทรกมันลงใน Mathematica และรับx>yx>yx>yfu1+u2(x)=−14∫x01−x−y−−−−√x−y−−−−√⋅lny4dy.fu1+u2(x)=−14∫0x1−x−yx−y⋅ln⁡y4dy.f_{u_1+u_2}(x)=-\frac{1}{4}\int_0^{x}\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy.fu1+u2(x)=14[−x+xlnx4−2x−−√(−2+lnx)].fu1+u2(x)=14[−x+xln⁡x4−2x(−2+ln⁡x)].f_{u_1+u_2}(x)=\frac{1}{4}\left[-x+x\ln\frac{x}{4}-2\sqrt{x}\left(-2+\ln x\right)\right]. ฉันสร้างชุดอิสระสี่ชุดประกอบด้วยตัวเลข10 ^ 6แต่ละชุดและดึงฮิสโตแกรมของ(โฆษณา) ^ 2 + 4bc :10 6 ( a - d ) 2 + 4 b ca,b,c,da,b,c,da,b,c,d10610610^6(a−d)2+4bc(a−d)2+4bc(a-d)^2+4bc และดึงพล็อตfu1+u2(x)fu1+u2(x)f_{u_1+u_2}(x) : โดยทั่วไปพล็อตจะคล้ายกับฮิสโตแกรม แต่ในช่วงเวลา(0,5)(0,5)(0,5)ส่วนใหญ่จะเป็นลบ (รากอยู่ที่ 2.27034) และหนึ่งของส่วนที่เป็นบวกคือ≈0.77≈0.77\approx 0.770.77 ความผิดพลาดอยู่ที่ไหน หรือฉันหายไปบางสิ่ง แก้ไข:ฉันปรับฮิสโตแกรมเพื่อแสดง PDF แก้ไข 2:ฉันคิดว่าฉันรู้ว่ามีปัญหาในการให้เหตุผลของฉัน - ในข้อ …

3
pdf และ pmf และ cdf มีข้อมูลเหมือนกันหรือไม่?
pdf และ pmf และ cdf มีข้อมูลเหมือนกันหรือไม่? สำหรับฉัน pdf ให้ความน่าจะเป็นทั้งหมดจนถึงจุดหนึ่ง (โดยทั่วไปคือพื้นที่ภายใต้ความน่าจะเป็น) pmf ให้ความน่าจะเป็นของบางจุด cdf ให้ความน่าจะเป็นภายใต้จุดหนึ่ง ดังนั้นสำหรับฉันไฟล์ PDF และ cdf มีข้อมูลเหมือนกัน แต่ pmf ไม่ได้เพราะมันให้ความน่าจะเป็นสำหรับxการแจกแจง

5
ค่าเฉลี่ยตัวแปรสุ่มแบบตัวแปรไม่แปรจะเท่ากับจำนวนอินทิกรัลของฟังก์ชันควอไทล์เสมอหรือไม่?
ฉันเพิ่งสังเกตเห็นว่าการรวมฟังก์ชั่นควอไทล์ของตัวแปรสุ่ม (ตัวแปรผกผัน cdf) แบบ univariate จาก p = 0 ถึง p = 1 ทำให้เกิดค่าเฉลี่ยของตัวแปร ฉันไม่เคยได้ยินความสัมพันธ์นี้มาก่อนดังนั้นฉันจึงสงสัยว่า: เป็นเช่นนี้เสมอหรือไม่ ถ้าเป็นเช่นนั้นความสัมพันธ์นี้เป็นที่รู้จักกันอย่างกว้างขวาง? นี่คือตัวอย่างในไพ ธ อน: from math import sqrt from scipy.integrate import quad from scipy.special import erfinv def normalPdf(x, mu, sigma): return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 …

3
เหตุใดฟังก์ชันการแจกแจงสะสม (CDF) จึงกำหนดการกระจายโดยเฉพาะ
ฉันได้รับการบอกเสมอว่า CDF ไม่เหมือนใคร แต่ PDF / PMF ไม่เหมือนกันทำไมจึงเป็นเช่นนั้น คุณสามารถยกตัวอย่างที่ PDF / PMF ไม่ซ้ำกันได้หรือไม่?

1
วิธีค้นหา / ประมาณความหนาแน่นของความน่าจะเป็นจากฟังก์ชันความหนาแน่นใน R
สมมติว่าฉันมีตัวแปรเช่นเดียวXกับการกระจายที่ไม่รู้จัก ใน Mathematica โดยใช้SmoothKernelDensityฟังก์ชั่นที่เราสามารถมีประมาณ function.This ความหนาแน่นของฟังก์ชั่นความหนาแน่นประมาณสามารถนำมาใช้ควบคู่ไปกับPDFฟังก์ชั่นฟังก์ชั่นความหนาแน่นของการคำนวณความน่าจะเป็นของมีค่าเช่นXในรูปแบบของPDF[density,X]สมมติว่า "ความหนาแน่น" SmoothKernelDensityเป็นผลมาจาก มันจะดีถ้ามีคุณสมบัติดังกล่าวใน R นี่คือวิธีการทำงานใน Mathematica http://reference.wolfram.com/mathematica/ref/SmoothKernelDistribution.html เป็นตัวอย่าง (ขึ้นอยู่กับฟังก์ชั่น Mathematica): data = RandomVariate[NormalDistribution[], 100]; #generates 100 values from N(0,1) density= SmoothKernelDistribution[data]; #estimated density PDF[density, 2.345] returns 0.0588784 คุณสามารถหาข้อมูลเพิ่มเติมเกี่ยวกับ PDF ได้ที่นี่ http://reference.wolfram.com/mathematica/ref/PDF.html ฉันรู้ว่าฉันสามารถวางแผนฟังก์ชั่นความหนาแน่นของมันโดยใช้density(X)ใน R และโดยการใช้ecdf(X)ฉันสามารถได้รับฟังก์ชั่นการแจกแจงสะสมเชิงประจักษ์มันเป็นไปได้ที่จะทำสิ่งเดียวกันใน R ตามสิ่งที่ฉันอธิบายเกี่ยวกับ Mathematica? ความช่วยเหลือและความคิดใด ๆ ที่ชื่นชม
17 r  pdf  cdf 

4
ซึ่งเชื่อว่า: ทดสอบ Kolmogorov-Smirnov หรือพล็อต QQ?
ฉันพยายามที่จะตรวจสอบว่าชุดข้อมูลของฉันของข้อมูลอย่างต่อเนื่องเป็นไปตามการกระจายแกมม่าที่มีพารามิเตอร์รูปร่าง 1.7 และอัตรา= 0.000063====== ปัญหาคือเมื่อฉันใช้ R เพื่อสร้างพล็อต QQ ของชุดข้อมูลของฉันกับแกมมาทฤษฎีการกระจาย (1.7 0.000063) ผมได้รับการพล็อตที่แสดงให้เห็นว่าข้อมูลเชิงประจักษ์ ๆ เห็นด้วยกับการกระจายรังสีแกมมาที่ สิ่งเดียวกันนี้เกิดขึ้นกับพล็อต ECDFxxx แต่เมื่อฉันเรียกใช้การทดสอบ Kolmogorov-Smirnov มันทำให้ฉันมีขนาดเล็กเกินสมควร -value ของ\%&lt; 1 %ppp&lt;1%&lt;1%<1\% ฉันควรเลือกที่จะเชื่อ เอาต์พุตกราฟิกหรือผลลัพธ์จากการทดสอบ KS หรือไม่

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

2
พื้นที่ภายใต้“ pdf” ในการประมาณความหนาแน่นของเคอร์เนลใน R
ฉันพยายามใช้ฟังก์ชัน ' ความหนาแน่น ' ใน R เพื่อทำการประมาณความหนาแน่นของเคอร์เนล ฉันมีความยากลำบากการตีความผลและเปรียบเทียบชุดข้อมูลต่างๆที่ดูเหมือนว่าพื้นที่ใต้เส้นโค้งไม่จำเป็นต้อง 1. สำหรับใด ๆฟังก์ชั่นความหนาแน่นของความน่าจะเป็น (PDF) , เราจำเป็นต้องมีพื้นที่∫ ∞ - ∞ φ ( x ) d x = 1 ฉันสมมติว่าการประมาณความหนาแน่นของเคอร์เนลรายงาน pdf ฉันใช้integrate.xyจากsfsmiscเพื่อประเมินพื้นที่ใต้เส้นโค้งϕ ( x )φ(x)\phi(x)∫∞- ∞ϕ ( x ) dx = 1∫-∞∞φ(x)dx=1\int_{-\infty}^\infty \phi(x) dx = 1 &gt; # generate some data &gt; xx&lt;-rnorm(10000) &gt; …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.