คำถามติดแท็ก spatial

สาขาการศึกษาที่เกี่ยวข้องกับวิธีการทางสถิติที่ใช้พื้นที่และความสัมพันธ์เชิงพื้นที่ (เช่นระยะทางพื้นที่ปริมาตรความยาวความสูงการวางแนวศูนย์กลางและ / หรือลักษณะเชิงพื้นที่อื่น ๆ ของข้อมูล) โดยตรงในการคำนวณทางคณิตศาสตร์ของพวกเขา

1
Kriging Interpolation ทำงานอย่างไร
ฉันกำลังทำงานกับปัญหาที่ฉันต้องใช้ Kriging เพื่อทำนายค่าของตัวแปรบางตัวตามตัวแปรโดยรอบบางตัว ฉันต้องการติดตั้งรหัสด้วยตนเอง ดังนั้นฉันจึงต้องอ่านเอกสารมากเกินไปเพื่อให้เข้าใจว่ามันทำงานอย่างไร แต่ฉันก็สับสนมาก โดยทั่วไปฉันเข้าใจว่ามันเป็นค่าเฉลี่ยถ่วงน้ำหนัก แต่ฉันไม่เข้าใจกระบวนการคำนวณน้ำหนักอย่างสมบูรณ์จากนั้นจึงทำนายค่าของตัวแปร ทุกคนสามารถอธิบายให้ฉันในแง่ง่ายด้านคณิตศาสตร์ของวิธีการแก้ไขนี้และวิธีการทำงานหรือไม่

1
ความคงที่เชิงพื้นที่ที่แท้จริง: มันไม่ได้ใช้เฉพาะกับความล่าช้าเล็ก ๆ เท่านั้นหรือ
จากคำจำกัดความของความนิ่งที่แท้จริง: E[ Z( x ) - Z( x - h ) ] = 0E[Z(x)−Z(x−h)]=0E[Z(x)-Z(x-h)] = 0 สมมติฐานนี้ใช้เป็นตัวอย่างใน kriging ธรรมดาแทนที่จะสมมติค่าเฉลี่ยคงที่ทั่วทั้งพื้นที่เราถือว่าค่าเฉลี่ยคงที่ในพื้นที่ หากค่าเฉลี่ยคงที่ในละแวกใกล้เคียงเราคาดหวังความแตกต่างระหว่างการวัดสองค่าใกล้กันเป็นศูนย์ แต่เมื่อค่าเฉลี่ยแตกต่างกันไปตามพื้นที่เราไม่คาดหวังความแตกต่างของค่าที่อยู่ห่างจากกันเป็นศูนย์หรือไม่ ดังนั้นการสันนิษฐานของความนิ่งภายในไม่ควร: E[Z(x)−Z(x−h)]=0E[Z(x)−Z(x−h)]=0E[Z(x)-Z(x-h)] = 0สำหรับh→0h→0h \to 0
10 spatial 

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
ฉันจะอธิบายความแปรปรวนเชิงพื้นที่ในรูปแบบเชิงเส้นได้อย่างไร
พื้นหลัง ฉันมีข้อมูลจากการศึกษาภาคสนามซึ่งมีสี่ระดับการรักษาและหกซ้ำในแต่ละช่วงตึก (4x6x2 = 48 การสังเกต) บล็อกอยู่ห่างกันประมาณ 1 ไมล์และภายในบล็อกมีตารางของ 42, 2m x 4m แปลงและทางเดินกว้าง 1m; การศึกษาของฉันใช้เพียง 24 แปลงในแต่ละบล็อก ฉันต้องการประเมินความแปรปรวนร่วมเชิงพื้นที่ นี่คือตัวอย่างการวิเคราะห์โดยใช้ข้อมูลจากบล็อกเดียวโดยไม่มีการบัญชีสำหรับความแปรปรวนร่วมเชิงพื้นที่ ในชุดข้อมูลplotคือ id ของพล็อตxคือตำแหน่ง x และyตำแหน่ง y ของแต่ละพล็อตที่มีพล็อต 1 อยู่ตรงกลางที่ 0, 0 levelคือระดับการรักษาและresponseเป็นตัวแปรตอบกลับ layout <- structure(list(plot = c(1L, 3L, 5L, 7L, 8L, 11L, 12L, 15L, 16L, 17L, 18L, 22L, 23L, 26L, …

2
การถดถอยของดิสก์ยูนิตเริ่มต้นจากตัวอย่าง "เว้นระยะสม่ำเสมอ"
ฉันต้องแก้ปัญหาการถดถอยที่ซับซ้อนบนดิสก์ยูนิต คำถามดั้งเดิมดึงดูดความคิดเห็นที่น่าสนใจ แต่ไม่มีคำตอบที่น่าเสียดาย ในขณะเดียวกันฉันได้เรียนรู้เพิ่มเติมเกี่ยวกับปัญหานี้ดังนั้นฉันจะพยายามแยกปัญหาดั้งเดิมออกเป็นปัญหาย่อยและดูว่าฉันโชคดีขึ้นในครั้งนี้หรือไม่ ฉันมีเซ็นเซอร์อุณหภูมิ 40 ตัวอยู่ในวงแหวนแคบ ๆ ภายในดิสก์ยูนิตเป็นประจำ: เซ็นเซอร์เหล่านี้รับอุณหภูมิในเวลา อย่างไรก็ตามเนื่องจากความแปรปรวนของเวลามีขนาดเล็กกว่าการแปรผันของอวกาศเรามาทำให้ปัญหาง่ายขึ้นโดยไม่สนใจความแปรปรวนของเวลาและสมมติว่าเซ็นเซอร์แต่ละตัวให้เวลาฉันโดยเฉลี่ยเท่านั้น ซึ่งหมายความว่าฉันมี 40 ตัวอย่าง (หนึ่งตัวสำหรับเซ็นเซอร์แต่ละตัว) และฉันไม่มีตัวอย่างซ้ำ ฉันต้องการสร้างพื้นผิวการถดถอยจากข้อมูลเซ็นเซอร์ การถดถอยมีสองเป้าหมาย:T= f( ρ , θ ) + ϵT=f(ρ,θ)+ϵT=f(\rho,\theta)+\epsilon ฉันต้องการที่จะประเมินค่าเฉลี่ยรัศมีอุณหภูมิT_ด้วยการถดถอยเชิงเส้นฉันได้ประมาณพื้นผิวซึ่งเป็นพื้นผิวอุณหภูมิเฉลี่ยแล้วดังนั้นฉันจึงต้องรวมพื้นผิวของฉันกับใช่ไหม? ถ้าฉันใช้พหุนามเพื่อการถดถอยขั้นตอนนี้ควรเป็นเค้กชิ้นหนึ่งTm e a n=ก.1( ρ ) + ϵTmean=g1(ρ)+ϵT_{mean}=g_1(\rho)+\epsilonθθ\theta ฉันต้องการที่จะประเมินโปรไฟล์อุณหภูมิรัศมีเช่นว่าในแต่ละตำแหน่งรัศมีPT95=ก.2( ρ ) + ϵT95=g2(ρ)+ϵT_{95}=g_2(\rho)+\epsilonP( T( ρ ) &lt;T95( ρ ) ) = .95P(T(ρ)&lt;T95(ρ))=.95P(T(\rho)<T_{95}(\rho))=.95 ด้วยสองเป้าหมายนี้ฉันควรใช้เทคนิคใดในการถดถอยของดิสก์ยูนิต แน่นอนกระบวนการแบบเกาส์มักใช้สำหรับการถดถอยเชิงพื้นที่ …

1
ทำไมคุณต้องจัดทำรูปแบบตัวอักษรย่อตัวเมื่อคุณได้รับความสนใจ
ฉันยังใหม่กับสถิติเชิงพื้นที่และดูแบบฝึกหัดมากมาย แต่ฉันไม่เข้าใจว่าทำไมคุณต้องจัดทำรูปแบบ Variogram เมื่อคุณ krige ฉันใช้แพ็คเกจ gstat ใน R และนี่คือตัวอย่างที่พวกเขาให้: library(sp) data(meuse) coordinates(meuse) = ~x+y data(meuse.grid) str(meuse.grid) gridded(meuse.grid) = ~x+y m &lt;- vgm(.59, "Sph", 874, .04) print(m) # ordinary kriging: x &lt;- krige(log(zinc)~1, meuse, meuse.grid, model = m) มีใครสามารถอธิบายในสองบรรทัดทำไมคุณต้องจัดหา vgm ก่อน? และคุณจะตั้งค่าพารามิเตอร์ได้อย่างไร ขอบคุณล่วงหน้า! แคสเปอร์
9 spatial 

1
หนังสือที่แนะนำเกี่ยวกับสถิติเชิงพื้นที่
อะไรคือหนังสือที่ดีที่สุดสำหรับการศึกษา i) ความแปรปรวนของตัวแปร univariate และหลายตัวแปร (ข้อมูลจริงนับจำนวน) ทั่วโดเมนเชิงพื้นที่ ii) การสุ่มตัวอย่างตัวแปร univariate หรือตัวแปรหลายตัวแปรตามการกระจายข้ามพื้นที่เชิงพื้นที่ (การสุ่มตัวอย่างเชิงพื้นที่ในระยะสั้น)

1
การสร้างแบบจำลองแนวโน้มเชิงพื้นที่โดยการถดถอยด้วย
ฉันวางแผนที่จะรวมพิกัดเป็น covariates ในสมการถดถอยเพื่อปรับสำหรับแนวโน้มเชิงพื้นที่ที่มีอยู่ในข้อมูล หลังจากนั้นฉันต้องการทดสอบเศษที่เหลือจากความสัมพันธ์เชิงพื้นที่ในรูปแบบสุ่ม ฉันมีคำถามหลายข้อ: ฉันควรทำการถดถอยเชิงเส้นซึ่งตัวแปรอิสระเพียงอย่างเดียวคือพิกัดและจากนั้นทดสอบส่วนที่เหลือในการเปลี่ยนแปลงเชิงพื้นที่สัมพันธ์หรือฉันควรจะรวมพิกัดไม่เพียงเป็น covariates แต่ยังรวมถึงตัวแปรอื่น ๆ แล้วทดสอบส่วนที่เหลือด้วยxxxYYy หากฉันคาดว่าจะมีแนวโน้มเป็นกำลังสองแล้วรวมไม่เพียงแต่ยัง ,และแต่แล้วบางส่วนของพวกเขา (และ ) มีค่าสูงกว่า threshold - ฉันควรแยกตัวแปรเหล่านั้นที่มีค่าสูงกว่าว่าไม่สำคัญหรือไม่? ฉันจะตีความแนวโน้มได้อย่างไรว่ามันไม่ได้เป็นกำลังสองอีกต่อไปแล้ว?x , yx,Yx,yx yxYxyx2x2x^2Y2Y2y^2x yxYxyY2Y2y^2พีพีpพีพีp ฉันเดาว่าฉันควรจะรักษาพิกัดและเป็น covariates อื่น ๆ และทดสอบพวกเขาในการมีความสัมพันธ์เชิงเส้นกับตัวแปรตามโดยการสร้างแปลงที่เหลือบางส่วน ... แต่เมื่อฉันเปลี่ยนพวกเขา (ถ้าพวกเขาต้องการการแปลง) ที่จะไม่ เป็นแนวโน้มแบบนั้นอีกต่อไป (โดยเฉพาะถ้าฉันรวม ,และสำหรับแนวโน้มกำลังสอง) มันอาจแสดงให้เห็นว่าเช่นต้องการการแปลงในขณะที่xxxYYyx yxYxyx2x2x^2Y2Y2y^2x2x2x^2xxxไม่ได้หรืออย่างนั้น? ฉันจะตอบสนองอย่างไรในสถานการณ์เหล่านี้? ขอบคุณ.

3
ปัญหาการประมาณค่าในการติดตาม GPS
ปัญหา:พิจารณารถยนต์สองคัน (นำมาเป็นวัตถุแบบจุด) ชื่อหัวหน้าLLL และผู้ติดตาม FFFทั้งคู่ติดตั้งอุปกรณ์ GPS ที่สื่อสารกัน วัตถุประสงค์ของFFF คือการปฏิบัติตาม LLLให้ใกล้เคียงที่สุดเท่าที่จะเป็นไปได้ในภายหลัง ระบุว่าอุปกรณ์ GPS ทั้งหมดมีการกระจายข้อผิดพลาดแบบวงกลมข้อผิดพลาด (CEP) โดยมีค่าเฉลี่ยที่กำหนดμ = (μx,μY)μ=(μx,μy)\mu = (\mu_x,\mu_y) และเมทริกซ์ความแปรปรวนร่วมที่กำหนด Σ2 × 2Σ2×2\Sigma_{2\times 2}. ระบุว่า LLL ลัดเลาะเป็นเส้นโค้ง คCC ในระนาบเส้นโค้งที่คาดหวังไว้คืออะไร FFF? นอกจากนี้การกระจายของคืออะไรFFFเส้นทาง เป็นวิธีที่ดีที่สุดสำหรับอะไร FFF เพื่อประเมิน LLL ในช่วงเวลาหนึ่ง? พื้นหลัง:นี่เป็นปัญหาที่เกิดขึ้นจริงที่ฉันต้องเผชิญในงานทดลองและไม่ทำการบ้านไม่ว่าจะด้วยวิธีใดก็ตาม ฉันรับรู้ถึงเครื่องมือต่าง ๆ เช่นตัวกรองคาลมานเพื่อการประมาณค่าสถานะที่เหมาะสมเมื่อเผชิญกับสัญญาณรบกวนของสีขาว แต่ฉันไม่แน่ใจว่าจะขยายไปยังกรณีนี้ได้อย่างไร ฉันต้องการทราบวรรณกรรมการวิจัยที่เกี่ยวข้องด้วย

3
ความแตกต่างระหว่างการพึ่งพาเชิงพื้นที่และความแตกต่างเชิงพื้นที่คืออะไร?
ความแตกต่างระหว่างการพึ่งพาเชิงพื้นที่และความแตกต่างเชิงพื้นที่คืออะไร? คำถามของฉันคือแรงบันดาลใจจากการอ่านในรูปแบบสเปปัญหาในเศรษฐมิติเชิงพื้นที่โดยเฉพาะอย่างยิ่งAnselin (2010)

3
ฉันจะจำลอง microdata การสำรวจสำมะโนประชากรสำหรับพื้นที่ขนาดเล็กโดยใช้ตัวอย่าง microdata 1% ที่สถิติขนาดใหญ่และมวลรวมในระดับพื้นที่ขนาดเล็กได้อย่างไร
ฉันต้องการทำการวิเคราะห์หลายตัวแปรในระดับบุคคลในระดับเล็ก ๆ ของการรวมกลุ่มทางภูมิศาสตร์ (เขตการเก็บรวบรวมสำมะโนประชากรของออสเตรเลีย) เห็นได้ชัดว่าการสำรวจสำมะโนประชากรไม่สามารถหาได้จากการรวมตัวเพียงเล็กน้อยด้วยเหตุผลความเป็นส่วนตัวดังนั้นฉันจึงตรวจสอบทางเลือกอื่น ๆ ตัวแปรที่น่าสนใจเกือบทั้งหมดจัดอยู่ในหมวดหมู่ ฉันมีสองชุดข้อมูลที่การกำจัดของฉัน: ตัวอย่างการสำรวจสำมะโนประชากร 1% นั้นมีอยู่ในระดับที่สูงกว่าของการรวมตัวเชิงพื้นที่ (พื้นที่ที่มีประชากรประมาณ 190,000 คนและการแยกเชิงพื้นที่ขนาดใหญ่ของประชากร ตารางความถี่สำหรับตัวแปรที่ฉันสนใจในระดับพื้นที่เล็ก ๆ (500 พื้นที่เล็ก ๆ หมายถึงป๊อป = 385, sd = 319, มัธยฐาน = 355) ฉันจะใช้ชุดข้อมูลทั้งสองนี้เพื่อจำลองการกระจายของประชากรในระดับพื้นที่ขนาดเล็กที่ใกล้เคียงกับประชากรจริงของพื้นที่ขนาดเล็กที่สุดได้อย่างไร ฉันขอขอบคุณที่อาจมีวิธีการประจำในการทำเช่นนี้; ถ้าเป็นเช่นนั้นตัวชี้ไปยังตำราหรือบทความในวารสารที่เกี่ยวข้องจะได้รับการชื่นชมอย่างมากมาย

2
การจัดกลุ่มเชิงพื้นที่ตามความหนาแน่นของแอปพลิเคชันที่มีการจัดกลุ่มเสียง (DBSCAN) ใน R
คำถามนี้เริ่มต้นเป็น "การจัดกลุ่มข้อมูลเชิงพื้นที่ใน R " และตอนนี้ย้ายไปยังคำถาม DBSCAN เนื่องจากการตอบคำถามแรกแนะนำให้ฉันค้นหาข้อมูลเกี่ยวกับ DBSCAN และอ่านเอกสารบางอย่างเกี่ยวกับ มีคำถามใหม่เกิดขึ้น DBSCAN ต้องการพารามิเตอร์บางตัวหนึ่งในนั้นคือ "ระยะทาง" เนื่องจากข้อมูลของฉันมีสามมิติลองจิจูดละติจูดและอุณหภูมิฉันควรใช้ "ระยะทาง" ใด มิติใดเกี่ยวข้องกับระยะทางนั้น ฉันควรจะเป็นอุณหภูมิ ฉันจะค้นหาระยะห่างขั้นต่ำเช่น R ได้อย่างไร พารามิเตอร์อื่นคือจำนวนจุดต่ำสุดที่ควรสร้างเป็นคลัสเตอร์ มีวิธีการหาหมายเลขนั้นหรือไม่? น่าเสียดายที่ฉันไม่พบ กำลังค้นหา Google ฉันไม่สามารถหาตัวอย่าง R สำหรับการใช้ dbscan ในชุดข้อมูลที่คล้ายกับของฉันคุณรู้จักเว็บไซต์ใดที่มีตัวอย่างประเภทนี้หรือไม่ ดังนั้นฉันสามารถอ่านและพยายามปรับให้เข้ากับกรณีของฉัน คำถามสุดท้ายคือความพยายามครั้งแรกของฉันกับ DBSCAN (ไม่มีคำตอบที่ถูกต้องสำหรับคำถามก่อนหน้า) ทำให้เกิดปัญหาหน่วยความจำ R บอกว่ามันไม่สามารถจัดสรรเวกเตอร์ได้ ฉันเริ่มต้นด้วยตารางที่เว้นระยะ 4 กม. ด้วย 779191 จุดที่สิ้นสุดในประมาณ 300,000 แถว x 3 คอลัมน์ (ละติจูดลองจิจูดและอุณหภูมิ) …
9 r  clustering  spatial 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.