คำถามติดแท็ก copula

โคปูลาคือการแจกแจงแบบหลายตัวแปรที่มีการแจกแจงขอบสม่ำเสมอ Copulas ส่วนใหญ่จะใช้เพื่อแสดงหรือสร้างแบบจำลองโครงสร้างของการพึ่งพาระหว่างตัวแปรสุ่มโดยแยกจากการแจกแจงส่วนขอบ

3
เป็นไปได้ไหมที่จะมีตัวแปรสุ่มแบบเกาส์ซึ่งเป็นการกระจายข้อต่อไม่ใช่เกาส์เซียน
ใครบางคนถามคำถามนี้กับฉันในการสัมภาษณ์งานและฉันตอบว่าการกระจายข้อต่อเป็นแบบเกาส์น ฉันคิดว่าฉันสามารถเขียนเกาส์ไบรอาริเอตด้วยวิธีและความแปรปรวนและความแปรปรวนร่วมได้ ฉันสงสัยว่าอาจมีกรณีที่น่าจะเป็นร่วมกันของ Gaussians สองไม่ Gaussian?

5
การอ่านเบื้องต้นเกี่ยวกับ Copulas
ตอนนี้ฉันกำลังมองหาการอ่านเบื้องต้นเกี่ยวกับ Copulas สำหรับการสัมมนาของฉัน ฉันกำลังค้นหาเนื้อหามากมายที่พูดถึงแง่มุมทางทฤษฎีซึ่งเป็นเรื่องที่ดี แต่ก่อนที่ฉันจะพูดถึงสิ่งเหล่านั้นฉันกำลังมองหาเพื่อสร้างความเข้าใจที่เข้าใจง่ายในหัวข้อนี้ ใครช่วยแนะนำเอกสารที่ดีที่ให้รากฐานที่ดีให้กับผู้เริ่มต้น (ฉันมี 1-2 หลักสูตรในสถิติและเข้าใจ marginals การกระจายหลายตัวแปรการแปลงผกผัน ฯลฯ ในระดับที่เหมาะสม)?

1
ความสัมพันธ์ที่สามารถบรรลุได้สำหรับตัวแปรสุ่ม lognormal
พิจารณา lognormal ตัวแปรสุ่มX1X1X_1และX2X2X_2กับlog(X1)∼N(0,1)log⁡(X1)∼N(0,1)\log(X_1)\sim \mathcal{N}(0,1)และlog(X2)∼N(0,σ2)log⁡(X2)∼N(0,σ2)\log(X_2)\sim \mathcal{N}(0,\sigma^2) ) ρmaxρmax\rho_{\max}ρminρmin\rho_{\min}ρ(X1,X2)ρ(X1,X2)\rho (X_1,X_2) ρmax=ρ(exp(Z),exp(σZ))ρmax=ρ(exp⁡(Z),exp⁡(σZ))\rho_{\max}=\rho (\exp(Z),\exp(\sigma Z))และ ρmin=ρ(exp(Z),exp(−σZ))ρmin=ρ(exp⁡(Z),exp⁡(−σZ))\rho_{\min}=\rho (\exp(Z),\exp(-\sigma Z)) , แต่พวกเขาได้ทำการอ้างอิงถึง comonotonicity และ countercomonotonicity ฉันหวังว่าจะมีคนช่วยให้ฉันเข้าใจว่าพวกเขาเกี่ยวข้องกันอย่างไร (ฉันรู้วิธีที่จะได้รับสิ่งนี้จากการแสดงออกทั่วไป แต่ต้องการที่จะรู้ว่าสิ่งที่ส่วน comonotonicity กำลังพูด)

1
ความแตกต่างระหว่างการแจกแจงแบบปกติแบบหลายตัวแปรมาตรฐานและ copula แบบเกาส์เซียน
ฉันสงสัยว่าความแตกต่างระหว่างการแจกแจงแบบปกติแบบหลายตัวแปรมาตรฐานและโคคูล่าแบบเกาส์คืออะไรเพราะเมื่อฉันดูฟังก์ชันความหนาแน่นพวกมันดูเหมือนกันกับฉัน ปัญหาของฉันคือเหตุผลที่ว่าทำไม Copula Copula ถูกนำมาใช้หรือสิ่งที่เป็นประโยชน์ต่อ Copula Gaussian สร้างขึ้นหรือสิ่งที่เหนือกว่าของมันคือเมื่อ Copula Gaussian ไม่มีอะไรเลยนอกจากฟังก์ชั่นมาตรฐานหลายตัวแปรตัวเอง แนวคิดที่อยู่เบื้องหลังการแปลงความน่าจะเป็นรวมในโคคูล่าคืออะไร? ฉันหมายความว่าเรารู้ว่า copula เป็นฟังก์ชันที่มีตัวแปรสม่ำเสมอ ทำไมต้องเป็นชุด? ทำไมไม่ใช้ข้อมูลจริงเช่นการแจกแจงปกติหลายตัวแปรและหาเมทริกซ์สหสัมพันธ์ (โดยปกติเราจะพล็อตสินทรัพย์สองรายการเพื่อพิจารณาความสัมพันธ์ของพวกเขา แต่เมื่อมันเป็นโคคูลาเราจะพล็อตเราซึ่งเป็นความน่าจะเป็นแทน) คำถามอื่น ฉันยังสงสัยว่าเมทริกซ์สหสัมพันธ์จาก MVN อาจไม่ใช่แบบพารามิเตอร์หรือกึ่งพาราเมตริกเหมือนของโคคูล่า (สำหรับพารามิเตอร์โคคูลาสามารถเป็นเอกภาพของเคนดัลล์เป็นต้น) ฉันจะขอบคุณมากสำหรับความช่วยเหลือของคุณตั้งแต่ฉันใหม่ในพื้นที่นี้ (แต่ฉันได้อ่านบทความมากมายและนี่เป็นสิ่งเดียวที่ฉันไม่เข้าใจ)

1
ขอบเขตบนของความหนาแน่นของโคคูล่า?
Fréchet-Hoeffding ผูกไว้บนใช้กับฟังก์ชั่นการกระจายเชื่อมและมันจะได้รับจาก C(u1,...,ud)≤min{u1,..,ud}.C(u1,...,ud)≤min{u1,..,ud}.C(u_1,...,u_d)\leq \min\{u_1,..,u_d\}. มีความคล้ายคลึงกัน (ในแง่ที่ว่ามันขึ้นอยู่กับความหนาแน่นของขอบ) สำหรับความหนาแน่นของแทนที่จะเป็น CDF หรือไม่?c(u1,...,ud)c(u1,...,ud)c(u_1,...,u_d) การอ้างอิงใด ๆ จะได้รับการชื่นชมอย่างมาก

1
วิธีการจำลองจากแบบเกาส์เกาส์?
สมมติว่าฉันมีการแจกแจงมาร์จิ้นที่ไม่แปรผันสองค่ากล่าวว่าFFFและGGGซึ่งฉันสามารถจำลองได้ ตอนนี้สร้างร่วมกันจำหน่ายของตนโดยใช้เชื่อม Gaussianชี้แนะC(F,G;Σ)C(F,G;Σ)C(F,G;\Sigma) ) ทราบพารามิเตอร์ทั้งหมด มีวิธีการที่ไม่ใช่ MCMC สำหรับการจำลองจาก copula นี้หรือไม่?

2
เทคนิคใดบ้างสำหรับการสุ่มตัวอย่างสองตัวแปรสุ่มที่สัมพันธ์กัน?
เทคนิคใดบ้างสำหรับการสุ่มตัวอย่างตัวแปรสุ่มที่มีความสัมพันธ์สองตัว: ถ้าการแจกแจงความน่าจะเป็นของพวกเขาถูกแปร (เช่น log-normal) หากพวกเขามีการแจกแจงแบบไม่อิงพารามิเตอร์ ข้อมูลเป็นอนุกรมเวลาสองชุดที่เราสามารถคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ได้ เราต้องการจำลองข้อมูลเหล่านี้ในอนาคตโดยสมมติว่าความสัมพันธ์ทางประวัติศาสตร์และอนุกรมเวลา CDF นั้นคงที่ สำหรับกรณี (2) อะนาล็อก 1-D จะสร้าง CDF และตัวอย่างจากมัน ดังนั้นฉันเดาว่าฉันสามารถสร้าง CDF 2 มิติและทำสิ่งเดียวกัน อย่างไรก็ตามฉันสงสัยว่ามีวิธีที่จะเข้าใกล้โดยใช้ 1-D CDFs แต่ละรายการและเชื่อมโยงตัวเลือกอย่างใด ขอบคุณ!

2
การทดลอง Bernoulli ที่สัมพันธ์กันการกระจายแบบหลายตัวแปรของ Bernoulli?
ฉันลดความซับซ้อนของคำถามการวิจัยที่ฉันมีในที่ทำงาน ลองนึกภาพว่าฉันมี 5 เหรียญและขอเรียกให้ประสบความสำเร็จ เหล่านี้เป็นเหรียญที่มีอคติมากโดยมีโอกาสประสบความสำเร็จ p = 0.1 ตอนนี้ถ้าเหรียญเป็นอิสระแล้วได้รับความน่าจะเป็นของอย่างน้อย 1 หัวหรือมากกว่าง่ายมาก 5 ในสถานการณ์สมมติของฉันการทดลอง Bernoulli ของฉัน (การโยนเหรียญ) ไม่เป็นอิสระ ข้อมูลเดียวที่ฉันสามารถเข้าถึงได้คือความน่าจะเป็นของความสำเร็จ (แต่ละอันคือ p = .1) และความสัมพันธ์เชิงทฤษฎีของเพียร์สันในหมู่ตัวแปรไบนารี1−(1−1/10)51−(1−1/10)51-(1-1/10)^5 มีวิธีการคำนวณความน่าจะเป็นของความสำเร็จหนึ่งครั้งหรือมากกว่านั้นกับข้อมูลนี้หรือไม่? ฉันกำลังพยายามหลีกเลี่ยงวิธีการจำลองสถานการณ์เนื่องจากผลลัพธ์ทางทฤษฎีเหล่านี้จะถูกใช้เพื่อเป็นแนวทางในความแม่นยำของการศึกษาแบบจำลอง ฉันได้รับการพิจารณาในการกระจายตัวของ Bernoulli หลายตัวแปร แต่ฉันไม่คิดว่าฉันสามารถระบุได้อย่างเต็มที่กับความสัมพันธ์และโอกาสที่จะประสบความสำเร็จเพียงเล็กน้อยเท่านั้น เพื่อนคนหนึ่งของฉันแนะนำให้สร้างแบบเกาส์เกาส์ด้วยเบอเนลลีขอบ (ใช้แพ็คเกจ R copula) จากนั้นใช้pMvdc()ฟังก์ชั่นบนตัวอย่างขนาดใหญ่เพื่อให้ได้ความน่าจะเป็นที่ฉันต้องการ แต่ฉันไม่แน่ใจว่าจะทำอย่างไรกับมัน

5
วิธีการสร้างข้อมูลที่ไม่สัมพันธ์กัน
ฉันสนใจที่จะหาวิธีในการสร้างข้อมูลที่มีความสัมพันธ์และไม่ปกติ ดังนั้นการกระจายบางอย่างที่ใช้ในเมทริกซ์ความแปรปรวนร่วม (หรือสหสัมพันธ์) เป็นพารามิเตอร์และสร้างข้อมูลที่ใกล้เคียงกับมัน แต่นี่คือสิ่งที่จับได้: วิธีที่ฉันพยายามค้นหาควรมีความยืดหยุ่นในการควบคุมความเบ้และ / หรือ kurtosis หลายตัวแปรด้วย ฉันคุ้นเคยกับวิธีของเฟลชแมนและวิธีการใช้พลังงานของตัวแปรปกติ แต่ฉันเชื่อว่าส่วนขยายเหล่านั้นส่วนใหญ่อนุญาตให้ผู้ใช้ใช้การรวมกันของความเบ้เล็กน้อยและความโด่งเท่านั้นทำให้เหลือความเบ้ / ความหลายหลาก สิ่งที่ฉันสงสัยคือถ้ามีวิธีที่ช่วยระบุความเบ้หลายตัวแปรและ / หรือ kurtosis พร้อมกับโครงสร้างความสัมพันธ์ / ความแปรปรวนร่วมบางอย่าง ประมาณหนึ่งปีที่ผ่านมาฉันได้สัมมนาเกี่ยวกับการแจกแจงแบบโคคูล่าและฉันจำได้ว่าศาสตราจารย์กล่าวอย่างไม่ตั้งใจว่าผ่านการใช้เถาวัลย์โคโพลีสเราสามารถสร้างข้อมูลซึ่งกล่าวคือสมมาตรในระยะขอบ 1-D แต่ร่วมกันเบ้ -versa หรือยิ่งไปกว่านั้นอัตรากำไรขั้นต้นที่ต่ำกว่าอาจมีความเบ้หรือความโด่งในขณะที่ยังคงมีขนาดสมมาตรสูงสุด (หรือไม่) ฉันประหลาดใจกับความคิดที่ว่ามีความยืดหยุ่นเช่นนี้ฉันพยายามค้นหาบทความหรือเอกสารการประชุมที่อธิบายวิธีการดังกล่าว แต่ฉันไม่ประสบความสำเร็จ :( มันไม่จำเป็นต้องผ่านการใช้ copulas ฉันเปิดรับทุกอย่างที่ใช้ได้ แก้ไข: ฉันได้เพิ่มรหัส R เพื่อพยายามแสดงสิ่งที่ฉันหมายถึง จนถึงตอนนี้ฉันคุ้นเคยกับคำจำกัดความของความเบ้หลายตัวแปรและความโด่งของ Mardia เท่านั้น เมื่อฉันเข้าหาปัญหาของฉันครั้งแรกฉันคิดอย่างไร้เดียงสาว่าถ้าฉันใช้ copula symmetric (Gaussian ในกรณีนี้) กับ marginals ที่เบ้ (เบต้าในตัวอย่างนี้) การทดสอบ …

1
R / mgcv: เพราะเหตุใดผลิตภัณฑ์ te () และ ti () เทนเซอร์จึงให้พื้นผิวที่แตกต่างกัน
mgcvแพคเกจสำหรับการRมีสองฟังก์ชั่นสำหรับการปฏิสัมพันธ์กระชับเมตริกซ์ผลิตภัณฑ์: และte() ti()ฉันเข้าใจการแบ่งขั้นพื้นฐานของการใช้แรงงานระหว่างคนทั้งสอง (ปรับให้เหมาะสมกับการทำงานแบบไม่เป็นเชิงเส้นเปรียบเทียบกับการย่อยสลายการโต้ตอบนี้เป็นผลกระทบหลักและการโต้ตอบ) สิ่งที่ฉันไม่เข้าใจคือสาเหตุte(x1, x2)และti(x1) + ti(x2) + ti(x1, x2)อาจให้ผลลัพธ์ที่แตกต่าง (เล็กน้อย) MWE (ดัดแปลงมาจาก?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 


2
การสุ่มตัวอย่าง CDF ผกผันสำหรับการแจกแจงแบบผสม
เวอร์ชันย่อที่ไม่อยู่ในบริบท ปล่อยให้เป็นตัวแปรสุ่มด้วย CDF yyyF(⋅)≡{θθ+(1−θ)×CDFlog-normal(⋅;μ,σ) y = 0 y > 0F(⋅)≡{θ y = 0 θ+(1−θ)×CDFlog-normal(⋅;μ,σ) y > 0 F(\cdot) \equiv \cases{\theta & y = 0 \\ \theta + (1-\theta) \times \text{CDF}_{\text{log-normal}}(\cdot; \mu, \sigma) & y > 0} สมมติว่าฉันต้องการจำลองการจับด้วยวิธี inverse CDF เป็นไปได้ไหม ฟังก์ชั่นนี้ไม่ได้มีสิ่งที่ตรงกันข้าม จากนั้นอีกครั้งมีการสุ่มตัวอย่างการแปลงผกผันสำหรับการกระจายการผสมของการแจกแจงปกติสองรายการซึ่งแสดงให้เห็นว่ามีวิธีที่รู้จักในการใช้การสุ่มตัวอย่างการแปลงผกผันที่นี่yyy ฉันทราบวิธีสองขั้นตอน แต่ฉันไม่ทราบวิธีนำไปใช้กับสถานการณ์ของฉัน (ดูด้านล่าง) รุ่นยาวที่มีพื้นหลัง ฉันติดตั้งโมเดลต่อไปนี้สำหรับการตอบสนองที่มีค่าเวกเตอร์โดยใช้ MCMC (โดยเฉพาะสแตน):yi=(y1,…,yK)iyi=(y1,…,yK)iy^i = …

2
การเชื่อมต่อแบบปรับตัวคืออะไร?
คำถามพื้นฐานของฉันคืออะไร copula แบบปรับได้คืออะไร ฉันมีสไลด์จากงานนำเสนอ (โชคไม่ดีที่ฉันไม่สามารถขอให้ผู้เขียนสไลด์) เกี่ยวกับ Copulae ที่ปรับตัวได้และฉันไม่ได้รับสิ่งนี้หมายถึงการตอบสนอง สิ่งนี้ดีสำหรับอะไร? นี่คือสไลด์: จากนั้นสไลด์จะดำเนินการทดสอบจุดเปลี่ยน ฉันสงสัยว่ามันเกี่ยวข้องกับอะไรและทำไมฉันจึงต้องการสิ่งนี้ในการเชื่อมโยงกับ copulae? สไลด์จบลงด้วยพล็อตพารามิเตอร์โดยประมาณแบบปรับตัวได้: ดูเหมือนว่าจะแสดงว่าการประมาณการของฉันล่าช้า การตีความอื่นใดความเห็นก็ดีมาก!
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.