คำถามติดแท็ก poisson-process

สำหรับคำถามเกี่ยวกับทฤษฎีหรือการประยุกต์ใช้กระบวนการปัวซองเป็นหนึ่งในกระบวนการจุดที่ใช้กันอย่างแพร่หลายในด้านสถิติและที่อื่น ๆ

5
โปรดอธิบายความขัดแย้งที่รอคอย
ไม่กี่ปีที่ผ่านมาฉันออกแบบเครื่องตรวจจับรังสีที่ทำงานโดยการวัดช่วงเวลาระหว่างเหตุการณ์แทนที่จะนับพวกเขา ข้อสันนิษฐานของฉันคือเมื่อทำการวัดตัวอย่างที่ไม่ต่อเนื่องกันโดยเฉลี่ยฉันจะวัดครึ่งหนึ่งของช่วงเวลาที่เกิดขึ้นจริง อย่างไรก็ตามเมื่อฉันทดสอบวงจรด้วยแหล่งที่ได้รับการสอบเทียบการอ่านเป็นปัจจัยที่มีค่าสูงเกินไปซึ่งหมายความว่าฉันทำการวัดช่วงเวลาเต็ม ในหนังสือเก่าเกี่ยวกับความน่าจะเป็นและสถิติฉันพบส่วนเกี่ยวกับสิ่งที่เรียกว่า "The Waiting Paradox" มันนำเสนอตัวอย่างที่มีรถบัสมาถึงที่ป้ายรถเมล์ทุก 15 นาทีและผู้โดยสารมาถึงโดยการสุ่มมันระบุว่าผู้โดยสารโดยเฉลี่ยจะรอเต็ม 15 นาที ฉันไม่เคยเข้าใจคณิตศาสตร์ที่นำเสนอด้วยตัวอย่างและยังคงมองหาคำอธิบายต่อไป หากใครบางคนสามารถอธิบายได้ว่าทำไมมันเป็นเช่นนั้นเพื่อให้ผู้โดยสารรอช่วงเวลาเต็มฉันจะนอนหลับดีขึ้น

8
มีมาตรฐานทองคำสำหรับการสร้างแบบจำลองช่วงเวลาที่เว้นระยะผิดปกติหรือไม่?
ในสาขาเศรษฐศาสตร์ (ฉันคิดว่า) เรามี ARIMA และ GARCH สำหรับอนุกรมเวลาที่มีระยะห่างเป็นประจำและ Poisson, Hawkes สำหรับการสร้างแบบจำลองกระบวนการจุดดังนั้นวิธีการเกี่ยวกับความพยายามสำหรับการสร้างแบบจำลองอนุกรมเวลาเว้นระยะเวลา ? (หากคุณมีความรู้ในหัวข้อนี้คุณสามารถขยายบทความ wiki ที่เกี่ยวข้องได้ด้วย) Edition (เกี่ยวกับค่าที่หายไปและอนุกรมเวลาที่เว้นระยะไม่สม่ำเสมอ): ตอบกลับความคิดเห็น @Lucas Reis หากช่องว่างระหว่างการวัดหรือตัวแปรการรับรู้เป็นระยะห่างเนื่องจาก (ตัวอย่าง) กระบวนการปัวซงไม่มีที่ว่างสำหรับการทำให้เป็นมาตรฐานแบบนี้ แต่มีขั้นตอนง่าย ๆ : t(i)เป็นดัชนีเวลา i-th ของตัวแปร x (เวลา i-th ของ การทำให้เป็นจริง x), จากนั้นกำหนดช่องว่างระหว่างเวลาของการวัดเป็นg(i)=t(i)-t(i-1), จากนั้นเราทำการแยกg(i)โดยใช้ค่าคงที่c, dg(i)=floor(g(i)/cและสร้างอนุกรมเวลาใหม่ที่มีจำนวนค่าว่างระหว่างการสังเกตแบบเก่าจากอนุกรมเวลาดั้งเดิมiและi+1เท่ากับ dg (i) แต่ปัญหาคือ ขั้นตอนสามารถสร้างอนุกรมเวลาได้อย่างง่ายดายด้วยจำนวนข้อมูลที่หายไปที่ใหญ่กว่าจำนวนการสังเกตดังนั้นการประมาณค่าที่สมเหตุสมผลของค่าการสังเกตที่หายไปอาจเป็นไปไม่ได้และใหญ่เกินไปcลบ "โครงสร้างเวลา / การพึ่งพาเวลา ฯลฯ " ของปัญหาการวิเคราะห์ (กรณีที่รุนแรงจะได้รับโดยการc>=max(floor(g(i)/c))ที่เพียงแค่ยุบอนุกรมเวลาเว้นระยะผิดปกติเป็นระยะห่างปกติ Edition2 (เพื่อความสนุกสนาน): …

2
จะรู้ได้อย่างไรว่าข้อมูลตามการกระจายของปัวซองใน R หรือไม่
ฉันเป็นนักศึกษาระดับปริญญาตรีและมีโครงการสำหรับชั้นเรียนความเป็นไปได้ของฉัน โดยพื้นฐานแล้วฉันมีชุดข้อมูลเกี่ยวกับพายุเฮอริเคนที่ส่งผลกระทบต่อประเทศของฉันเป็นเวลาหลายปี ในหนังสือน่าจะเป็นของฉัน (ความน่าจะเป็นและสถิติที่มี R) มีตัวอย่าง (ไม่สมบูรณ์) ของวิธีการตรวจสอบว่าข้อมูลเป็นไปตามการแจกแจงแบบปัวซงพวกเขาเริ่มพยายามพิสูจน์ว่าเกณฑ์ 3 ข้อเหล่านี้: (จากหนังสือของฉันหน้า ตัวอย่าง 120 (เกณฑ์) หน้า 122-123) 1- จำนวนผลลัพธ์ในช่วงเวลาที่ไม่ทับซ้อนกันนั้นเป็นอิสระ กล่าวอีกนัยหนึ่งจำนวนผลลัพธ์ในช่วงเวลา (0, t] เป็นอิสระจากจำนวนผลลัพธ์ในช่วงเวลา (t, t + h], h> 0 2- ความน่าจะเป็นของผลลัพธ์สองรายการขึ้นไปในช่วงเวลาสั้น ๆ ที่เพียงพอเป็นศูนย์ กล่าวอีกนัยหนึ่งหาก h มีขนาดเล็กเพียงพอความน่าจะเป็นที่จะได้รับผลลัพธ์สองช่วงขึ้นไปในช่วงเวลานั้น (t, t + h] นั้นเล็กน้อยเมื่อเทียบกับความน่าจะเป็นที่จะได้ผลลัพธ์หนึ่งหรือศูนย์ในช่วงเวลาเดียวกัน 3- ความน่าจะเป็นของผลลัพธ์หนึ่งรายการในช่วงเวลาสั้น ๆ อย่างเพียงพอหรือพื้นที่ขนาดเล็กเป็นสัดส่วนกับความยาวของช่วงเวลาหรือภูมิภาค กล่าวอีกนัยหนึ่งความน่าจะเป็นที่จะเกิดผลลัพธ์หนึ่งครั้งในช่วงความยาว h คือ lambda * h …

2
เปลี่ยนจากการทำแบบจำลองกระบวนการโดยใช้การกระจายแบบปัวซงเพื่อใช้การกระจายแบบลบแบบทวินาม?
\newcommand{\P}{\mathbb{P}}เรามีขั้นตอนการสุ่มที่อาจจะหรืออาจจะไม่เกิดขึ้นหลายครั้งในระยะเวลาที่กำหนดของเวลาTเรามีฟีดข้อมูลจากรูปแบบที่มีอยู่ก่อนของกระบวนการนี้ที่ให้ความน่าจะเป็นของจำนวนของเหตุการณ์ที่เกิดขึ้นในช่วงเวลาที่&lt;T โมเดลที่มีอยู่นี้เก่าและเราจำเป็นต้องเรียกใช้การตรวจสอบสดกับข้อมูลฟีดสำหรับข้อผิดพลาดในการประเมิน รุ่นเก่าผลิตข้อมูลฟีด (ซึ่งจะให้ความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในเวลาที่เหลืออีก ) จะอยู่ที่ประมาณ Poisson กระจายTTT0≤t&lt;T0≤t&lt;T0 \leq t < Tnnnttt ดังนั้นเพื่อตรวจสอบความผิดปกติ / ข้อผิดพลาดเราปล่อยให้tttเป็นเวลาที่เหลืออยู่และXtXtX_tเป็นจำนวนรวมของเหตุการณ์ที่จะเกิดขึ้นในระยะเวลาที่เหลือทีtttรุ่นเก่าหมายถึงการประมาณการP(Xt≤c)P(Xt≤c)\P(X_t \leq c)ค) ดังนั้นภายใต้สมมติฐานของเราXt∼Poisson(λt)Xt∼Poisson⁡(λt)X_t\sim \operatorname{Poisson}(\lambda_{t})เรามี: P(Xt≤c)=e−λ∑k=0cλktk!.P(Xt≤c)=e−λ∑k=0cλtkk!. \P(X_t \leq c) = e^{-\lambda}\sum_{k=0}^c\frac{\lambda_t^k}{k!}\,. เพื่อให้ได้อัตราการจัดกิจกรรมของเราλtλt\lambda_tจากเอ้าท์พุทของโมเดลเก่า (การสังเกตytyty_{t} ) เราใช้วิธีพื้นที่ของรัฐและสร้างแบบจำลองความสัมพันธ์ของรัฐเป็น: yt=λt+εt(εt∼N(0,Ht)).yt=λt+εt(εt∼N(0,Ht)). y_t = \lambda_t + \varepsilon_t\quad (\varepsilon_t \sim N(0, H_t))\,. เรากรองการสังเกตจากแบบจำลองเก่าโดยใช้แบบจำลองพื้นที่รัฐ [การสลายตัวด้วยความเร็วคงที่] สำหรับการวิวัฒนาการของλtλt\lambda_tเพื่อรับสถานะการกรองE(λt|Yt)E(λt|Yt)E(\lambda_t|Y_t)และตั้งค่าสถานะความผิดปกติ / ความผิดพลาดในความถี่เหตุการณ์โดยประมาณจาก ที่ฟีดข้อมูลหากE(λt|Yt)&lt;ytE(λt|Yt)&lt;ytE(\lambda_t|Y_t) < y_t&lt;y_t วิธีการนี้ใช้งานได้ดีในการรับข้อผิดพลาดในเหตุการณ์ที่คาดการณ์นับในช่วงเวลาTเต็มรูปแบบTTTแต่ไม่ดีถ้าเราต้องการทำเช่นเดียวกันสำหรับช่วงเวลาอื่น0≤t&lt;σ0≤t&lt;σ0 \leq t …

1
วิธีประมาณกระบวนการปัวซองโดยใช้ R (หรือ: วิธีการใช้แพคเกจ NHPoisson?)
ฉันมีฐานข้อมูลของเหตุการณ์ (เช่นตัวแปรของวันที่) และ covariates ที่เกี่ยวข้อง เหตุการณ์ถูกสร้างขึ้นโดยกระบวนการปัวซองที่ไม่อยู่กับที่ซึ่งพารามิเตอร์เป็นฟังก์ชันที่ไม่รู้จัก (แต่อาจเป็นเชิงเส้น) ของ covariates บางตัว ฉันคิดว่าแพ็คเกจ NHPoisson มีไว้เพื่อจุดประสงค์นี้เท่านั้น แต่หลังจากการวิจัยไม่ประสบความสำเร็จ 15 ชั่วโมงฉันก็ยังไม่รู้ว่าจะใช้อย่างไร Heck ฉันลองอ่านหนังสืออ้างอิงทั้งสองเล่ม: Coles, S. (2001) บทนำสู่การสร้างแบบจำลองทางสถิติของค่าที่สูงที่สุด สปริงเกอร์ Casella, G. และ Berger, RL, (2002) อนุมานทางสถิติ. บรูคส์ / โคล ตัวอย่างเดียวในเอกสารประกอบของ fitPP.fun ดูเหมือนจะไม่เหมาะกับการตั้งค่าของฉัน ฉันไม่มีคุณค่ามากนัก! ฉันเพิ่งมีเหตุการณ์ที่เปลือยเปล่า ทุกคนได้โปรดช่วยฉันด้วยตัวอย่างง่ายๆของการกระชับกระบวนการ Poisson กับพารามิเตอร์กับตัวแปรร่วมเดียวและสมมติฐานที่ ? ฉันสนใจในการประมาณและ\ฉันให้ชุดข้อมูลสองคอลัมน์พร้อมเวลาของเหตุการณ์ (สมมติว่าวัดเป็นวินาทีหลังจากเวลาโดยพลการ ) และอีกคอลัมน์หนึ่งที่มีค่าของ covariate ?X λ = …

1
อะไรคือความแตกต่างระหว่างการวิเคราะห์การอยู่รอดและการถดถอยปัวซอง?
ฉันกำลังทำงานกับปัญหาการทำนายการปั่นแบบดั้งเดิมโดยใช้จำนวนการเข้าชมของผู้ใช้ที่กำหนดให้กับไซต์หนึ่งและฉันคิดว่า Poisson Regression เป็นเครื่องมือที่เหมาะสมสำหรับการสร้างแบบจำลองการมีส่วนร่วมในอนาคตของผู้ใช้นั้น เมื่อนั้นฉันเจอหนังสือเกี่ยวกับการวิเคราะห์การอยู่รอดและการจำลองแบบอันตรายและฉันไม่รู้ว่าเทคนิคใดดีที่สุด ฉันไม่ต้องการทำการค้นคว้าทั้งสองหัวข้อในเวลาเดียวกันดังนั้นสิ่งที่ดีที่สุดสำหรับการสร้างแบบจำลองการมีส่วนร่วมของผู้ใช้โดยใช้ข้อมูลในอดีตและข้อมูลประชากร

1
การทดสอบที่แน่นอนของฟิชเชอร์และการกระจาย hypergeometric
ฉันต้องการที่จะเข้าใจการทดสอบที่แม่นยำของฟิชเชอร์มากขึ้นดังนั้นฉันจึงคิดค้นตัวอย่างของเล่นต่อไปนี้โดยที่ f และ m สอดคล้องกับเพศชายและเพศหญิงและ n และ y สอดคล้องกับ "การบริโภคโซดา" เช่นนี้: &gt; soda_gender f m n 0 5 y 5 0 เห็นได้ชัดว่านี่คือการทำให้เข้าใจง่ายมาก แต่ฉันไม่ต้องการให้บริบทเข้ามาขวางทาง ที่นี่ฉันเพิ่งสันนิษฐานว่าผู้ชายไม่ดื่มโซดาและหญิงดื่มโซดาและต้องการดูว่าวิธีการทางสถิติมาถึงข้อสรุปเดียวกัน เมื่อฉันทำการทดสอบฟิชเชอร์ที่แน่นอนใน R ฉันจะได้ผลลัพธ์ต่อไปนี้: &gt; fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 …

1
เราจะทำนายเหตุการณ์ที่หายากได้อย่างไร
ฉันกำลังพัฒนารูปแบบการทำนายความเสี่ยงด้านการประกันภัย โมเดลเหล่านี้เป็น "เหตุการณ์ที่หายาก" เช่นการคาดคะเนการไม่แสดงตัวตนของสายการบินการตรวจจับข้อผิดพลาดของฮาร์ดแวร์ ฯลฯ ขณะที่ฉันเตรียมชุดข้อมูลของฉันฉันพยายามใช้การจำแนกประเภท แต่ฉันไม่สามารถรับตัวแยกประเภทที่มีประโยชน์ได้ . ฉันไม่มีประสบการณ์ด้านสถิติและการสร้างแบบจำลองมากไปกว่าหลักสูตรสถิติของโรงเรียนมัธยมดังนั้นฉันจึงสับสน อย่างที่ฉันคิดไว้ฉันคิดว่าจะใช้แบบจำลองกระบวนการปัวซองซึ่งมีความเป็นเนื้อเดียวกัน ฉันจัดประเภทตามข้อมูลเหตุการณ์ (date, lat, lon) เพื่อให้ได้ค่าประมาณความเสี่ยงที่ดี ณ เวลาใดเวลาหนึ่งของแต่ละวัน ฉันอยากรู้ว่าอะไรคือวิธีการ / ขั้นตอนวิธีในการทำนายเหตุการณ์ที่เกิดขึ้นได้ยาก คุณแนะนำอะไรเป็นวิธีแก้ไขปัญหานี้

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE &lt;- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
ความน่าจะเป็นของกระบวนการปัวซองอิสระขบวนอื่น
ฉันเคยถามคำถามนี้มาก่อนในรูปแบบอื่นบนสแต็คแลกเปลี่ยนอื่น ๆ ดังนั้นขออภัยสำหรับ repost ที่ค่อนข้าง ฉันถามอาจารย์และนักศึกษาปริญญาเอกสองคนถึงเรื่องนี้โดยไม่มีคำตอบที่ชัดเจน ฉันจะระบุปัญหาก่อนจากนั้นวิธีแก้ปัญหาที่เป็นไปได้ของฉันและปัญหาเกี่ยวกับวิธีแก้ปัญหาของฉันดังนั้นขอโทษสำหรับกำแพงข้อความ ปัญหา: สมมติสองอิสระ Poisson กระบวนการและกับและสำหรับช่วงเวลาเดียวกันอาจมีการ\ความน่าจะเป็นว่าที่จุดใด ๆ ในเวลาเป็นเวลาที่มีแนวโน้มที่จะอินฟินิตี้ที่การส่งออกรวมของกระบวนการคืออะไรมีขนาดใหญ่กว่าการส่งออกรวมของกระบวนการบวกคือD) หากต้องการแสดงตัวอย่างให้สมมติว่ามีสองสะพานและโดยเฉลี่ยแล้วรถและขับผ่านสะพานและMMMRRRλRλR\lambda_RλMλM \lambda_MλR&gt;λMλR&gt;λM\lambda_R>\lambda_MMMMRRRDDDP(M&gt;R+D)P(M&gt;R+D)P(M>R+D)RRRMMMλRλR\lambda_RλMλM\lambda_MRRRMMMตามลำดับต่อช่วงเวลาและ\รถยนต์ได้ขับแล้วข้ามสะพานเป็นสิ่งที่น่าจะเป็นที่ที่จุดใด ๆ ในเวลารถยนต์เพิ่มเติมทั้งหมดได้ขับข้ามสะพานกว่าRλR&gt;λMλR&gt;λM\lambda_R>\lambda_MDDDRRRMMMRRR วิธีแก้ไขปัญหานี้ของฉัน: ครั้งแรกที่เรากำหนดกระบวนการปัวซงสองกระบวนการ: M(I)∼Poisson(μM⋅I)R(I)∼Poisson(μR⋅I)M(I)∼Poisson⁡(μM⋅I)R(I)∼Poisson⁡(μR⋅I)M(I) \sim \operatorname{Poisson}(\mu_M\cdot I ) \\ R(I) \sim \operatorname{Poisson}(\mu_R\cdot I ) \\ ขั้นตอนต่อไปคือการค้นหาฟังก์ชั่นที่อธิบายหลังจากช่วงเวลากำหนด นี้จะเกิดขึ้นในกรณีเงื่อนไขในการส่งออกของสำหรับทุกค่าที่ไม่ใช่เชิงลบของkเพื่อแสดงให้เห็นว่าการส่งออกรวมของคือแล้วการส่งออกรวมของจะต้องมีขนาดใหญ่กว่า D ดังแสดงด้านล่างP(M&gt;R+D)P(M&gt;R+D)P(M>R+D)IIIM(I)&gt;k+DM(I)&gt;k+DM(I)>k+DR(I)=kR(I)=kR(I)=kkkkRRRXXXMMMX+DX+DX+D P(M(I))&gt;R(I)+D)=∑k=0n[P(M(I)&gt;k+D∪R(I)=k)]P(M(I))&gt;R(I)+D)=∑k=0n[P(M(I)&gt;k+D∪R(I)=k)]P(M(I))>R(I)+D)=\sum_{k=0}^n \bigg [P(M(I) >k+D\cup R(I)=k) \bigg] n→∞n→∞n\rightarrow \infty เนื่องจากความเป็นอิสระนี้สามารถเขียนใหม่เป็นผลิตภัณฑ์ของสององค์ประกอบที่องค์ประกอบแรกคือ 1-CDF ของการกระจาย Poisson และองค์ประกอบที่สองคือ Poisson PMF: …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.