การประมาณค่าพารามิเตอร์สำหรับกระบวนการเชิงพื้นที่


12

ฉันได้รับตารางของค่าจำนวนเต็มบวก ตัวเลขเหล่านี้แสดงถึงความเข้มที่ควรสอดคล้องกับความแข็งแกร่งของความเชื่อของบุคคลที่ครอบครองตำแหน่งกริดนั้น (ค่าที่สูงกว่าหมายถึงความเชื่อที่สูงกว่า) โดยทั่วไปแล้วคน ๆ หนึ่งจะมีอิทธิพลเหนือเซลล์กริดหลายเซลล์n×n

ฉันเชื่อว่ารูปแบบของความเข้มควร "ดูเกาส์เซียน" ในที่นั้นจะมีที่ตั้งกลางของความเข้มสูงและจากนั้นความเข้มจะลดลงอย่างรุนแรงในทุกทิศทาง โดยเฉพาะฉันต้องการสร้างแบบจำลองค่าที่มาจาก "Gaussian แบบปรับขนาด" พร้อมพารามิเตอร์สำหรับความแปรปรวนและอีกแบบสำหรับตัวประกอบสเกล

มีสองปัจจัยที่ซับซ้อน:

  • การไม่มีบุคคลจะไม่สอดคล้องกับค่าศูนย์เนื่องจากเสียงพื้นหลังและเอฟเฟกต์อื่น ๆ แต่ค่าควรน้อยกว่า พวกมันอาจเอาแน่เอานอนไม่ได้และในการประมาณครั้งแรกอาจเป็นการยากที่จะจำลองแบบเสียงเกาส์แบบง่าย
  • ช่วงความเข้มอาจแตกต่างกันไป สำหรับอินสแตนซ์หนึ่งค่าอาจอยู่ในช่วงระหว่าง 1 ถึง 10 และในอีกกรณีระหว่าง 1 ถึง 100

ฉันกำลังมองหากลยุทธ์การประมาณค่าพารามิเตอร์ที่เหมาะสมหรือตัวชี้ไปยังเอกสารที่เกี่ยวข้อง ชี้ให้เห็นว่าทำไมฉันถึงเข้าถึงปัญหานี้ในทางที่ผิดทั้งหมดก็จะได้รับการชื่นชม :) ฉันได้อ่านเกี่ยวกับกระบวนการ kriging และ Gaussian แล้ว แต่ดูเหมือนว่าเป็นเครื่องจักรที่หนักมากสำหรับปัญหาของฉัน


1
คุณหมายความว่าอย่างไรกับ Gaussian ที่มีพารามิเตอร์ความแปรปรวนและมาตราส่วน? พารามิเตอร์ผลต่างคือพารามิเตอร์มาตราส่วนของ Gaussian! ฉันยังไม่แน่ใจเล็กน้อยเกี่ยวกับแบบจำลองที่คุณตั้งค่ามา คุณช่วยอธิบายปัญหาที่คุณพยายามแก้ไขโดยละเอียดได้หรือไม่? การใช้แบบเกาส์เพื่อสังเกตแบบจํานวนเต็มจํานวนที่ละเอียดเป็นเม็ดเล็ก ๆ นั้นดูน่ากลัว
พระคาร์ดินัล

(+1) สำหรับคำถามที่น่าสนใจ รอคอยที่จะเข้าใจในสิ่งที่คุณกำลังพยายามแก้ไขให้ดีขึ้น
พระคาร์ดินัล

ต่อไปนี้เป็นข้อสังเกตหลายประการ: 1. หากค่าของคุณเป็นจำนวนเต็มการใช้ Gaussian ดูเหมือนจะไม่เหมาะสม 2. มันไม่ชัดเจนว่าอะไรคือวัตถุประสงค์ของแบบจำลองของคุณคุณต้องการระบุกลุ่มของความเชื่อที่แข็งแกร่งเช่น? สิ่งที่จะตีความพารามิเตอร์ของคุณถ้าคุณมีพวกเขา? 3. เนื่องจากคุณมีกริดทำไมไม่ลองผสมส่วนผสมของการกระจายแบบสองตัวแปร? จากนั้นกริดจะได้รับการสนับสนุนจากการกระจาย (พูดหน่วยสี่เหลี่ยม) และความเข้มจะสอดคล้องกับภูมิภาคน่าจะเป็นสูง
mpiktas

ขอบคุณสำหรับทุกจุดที่น่าสนใจ ให้ฉันพยายามอธิบาย ทางเลือกของ "เกาส์เซียน" ในแง่ของความคิดเห็นอาจเป็นปลาเฮอริ่งแดงที่ทำให้เกิดความสับสนมากกว่าที่จะช่วย คุณลักษณะที่สำคัญของข้อมูลคือค่าความเข้มสูง ณ จุดที่มีความเชื่อสูงสุดในตำแหน่งของบุคคลและการลด "รัศมี" รอบ ๆ มัน (ซึ่งฉันสังเกตเห็นด้วยสังเกตุ) ค่าความเข้มมาจากการแก้ปัญหาถึงปัญหาผกผัน (เชิงเส้น) และที่จริงแล้วไม่จำเป็นต้องเป็นอินทิกรัล - นั่นเป็นเพียงข้อมูลที่เราเกิดขึ้น
Suresh Venkatasubramanian

btw ฉันขอขอบคุณความพยายามที่จะทำให้คำถามที่กำหนดไว้ดีขึ้นและเป็นแบบอย่างที่ดีขึ้น ฉันจะพยายามอย่างเต็มที่ที่จะอธิบายการตั้งค่าข้อมูลจริงเพื่อที่จะมารวมกันบนสมมติฐานการสร้างแบบจำลองที่ถูกต้อง
Suresh Venkatasubramanian

คำตอบ:


5

คุณสามารถใช้โมดูลนี้ของไลบรารี pysal python สำหรับวิธีการวิเคราะห์ข้อมูลเชิงพื้นที่ที่ฉันกล่าวถึงด้านล่าง

คำอธิบายของคุณเกี่ยวกับทัศนคติของแต่ละคนที่ได้รับอิทธิพลจากทัศนคติของคนรอบตัวเธอนั้นสามารถแสดงแบบจำลองเชิงพื้นที่อัตโนมัติ (SAR) (ดูคำอธิบาย SAR แบบง่าย ๆ ของฉันจากคำตอบ SE 2 นี้ ) วิธีที่ง่ายที่สุดคือการไม่คำนึงถึงปัจจัยอื่น ๆ และประเมินความแข็งแกร่งของอิทธิพลว่าคนรอบข้างมีผลต่อทัศนคติของคนอื่นอย่างไรโดยใช้สถิติ Moran I

y=bx+rhoWy+e

Wwijij

เพื่อให้ได้แนวคิดที่เข้าใจง่ายด้านล่างฉันแสดงให้เห็นว่ากระบวนการสร้างข้อมูลอัตโนมัติเชิงพื้นที่ (DGP) จะสร้างรูปแบบของค่าได้อย่างไร สำหรับ 2 โปรยของค่าที่จำลองแล้วบล็อกสีขาวแสดงถึงค่าสูงและบล็อกที่มืดแทนค่าต่ำ

rho

สุ่ม (เสียน)

rhoป้อนคำอธิบายรูปภาพที่นี่


นั่นน่าสนใจมาก (และเป็น Geary C ที่เกี่ยวข้องด้วย) นี่อาจใกล้เคียงกับสิ่งที่ฉันต้องการ
Suresh Venkatasubramanian

Geary C ช่วยให้คุณเห็นว่าค่าใกล้กับอีกกลุ่มหนึ่งแม้ค่าที่อยู่ตรงกลางของการกระจาย โมแรนฉันช่วยให้คุณเห็นว่ากลุ่มของค่าที่สูงมากมีค่าที่สูงมากและกลุ่มของค่าที่ต่ำมากรอบค่าที่ต่ำมาก ดังนั้นบางทีคุณอาจจะถูกต้องและวิธีที่ง่ายที่สุดและดีที่สุดคือ Geary's C โปรดจำไว้ว่าวิธีการของ Geary นั้นมีการสำรวจและจะไม่ทำให้คุณได้รับผลลัพธ์ตามปัจจัยอื่น ๆ ดูโมดูลหลามนี้รหัสเพื่อใช้ในเกียรี่ C: pysal.org/1.1/library/esda/geary.html
b_dev

ให้ฉันเล่นกับสิ่งเหล่านี้อีก หากดูเหมือนว่าจะทำสิ่งที่ฉันต้องการ (และฉันคิดว่ามันจะ) นี้ดูเหมือนคำตอบที่ดีที่สุด
Suresh Venkatasubramanian

3

นี่คือความคิดง่ายๆที่อาจใช้งานได้ อย่างที่ฉันได้กล่าวไว้ในความคิดเห็นถ้าคุณมีกริดที่มีความเข้มทำไมไม่เหมาะกับความหนาแน่นของการกระจายตัวแบบไบวาริเอต?

นี่คือกราฟตัวอย่างเพื่อแสดงจุดของฉัน: ป้อนคำอธิบายรูปภาพที่นี่

จุดกริดแต่ละจุดจะแสดงเป็นสี่เหลี่ยมจัตุรัสซึ่งมีสีตามความเข้ม ทับบนกราฟเป็นโครงร่างของพล็อตความหนาแน่นปกติ bivariate ในขณะที่คุณสามารถเห็นเส้นชั้นความสูงขยายไปในทิศทางของการลดความเข้ม ศูนย์กลางจะถูกควบคุมโดยค่าเฉลี่ยของตัวแปรแบบไบวาเรียตและการกระจายของความเข้มตามเมทริกซ์ความแปรปรวนร่วม

ในการรับการประมาณค่าเฉลี่ยและความแปรปรวนร่วมของเมทริกซ์การหาค่าเหมาะที่สุดแบบง่ายสามารถใช้เปรียบเทียบความเข้มกับค่าของฟังก์ชันความหนาแน่นโดยใช้ค่าเฉลี่ยและเมทริกซ์ความแปรปรวนร่วมเป็นพารามิเตอร์ ย่อเล็กสุดเพื่อให้ได้ค่าประมาณ

แน่นอนว่านี่ไม่ใช่การประมาณการเชิงสถิติ แต่อย่างน้อยมันจะทำให้คุณมีความคิดในการดำเนินการต่อไป

นี่คือรหัสสำหรับการทำกราฟใหม่:

require(mvtnorm)
sigma=cbind(c(0.1,0.7*0.1),c(0.7*0.1,0.1))

x<-seq(0,1,by=0.01)
y<-seq(0,1,by=0.01)
z<-outer(x,y,function(x,y)dmvnorm(cbind(x,y),mean=mean,sigma=sigma))

mz<-melt(z)

mz$X1<-(mz$X1-1)/100
mz$X2<-(mz$X2-1)/100

colnames(mz)<-c("x","y","z")

mz$intensity<-round(mz$z*1000)

ggplot(mz, aes(x,y)) + geom_tile(aes(fill = intensity), colour = "white") + scale_fill_gradient(low = "white",     high = "steelblue")+geom_contour(aes(z=z),colour="black")

2

X[i,j]X[i,j](X[i1,j1],...,X[im,jm])(X[i1+k,j1+l]...,X[im+k,jm+l])corr(X[i1,j1],X[i2,j2])d([i1,j1],[i2,j2])ρ(d)ρ(d)=kd1k

d([i1,j1],[i2,j2])=|i1i2|+|j1j2|ρ(d)เช่นผ่านโอกาสสูงสุด สำหรับแนวคิดเพิ่มเติมให้มองหา "ช่องสุ่ม"


1
"ต้องการสันนิษฐานว่าอวกาศคงที่" ปรากฏขึ้นโดยตรงเพื่อแย้งกับสมมติฐานของ OP ว่า "ความเข้มลดลงอย่างรุนแรงในทุกทิศทาง"
whuber

งั้นเหรอ รูปแบบดังกล่าวจะเกิดขึ้นกับโครงสร้างสัมพันธ์อัตโนมัติที่ฉันเสนอ
charles.y.zheng

1
@charles มันเป็นจุดสำคัญ: ถ้าจริง ๆ แล้วแนวโน้มที่ชัดเจนนี้มีสาเหตุมาจากความสัมพันธ์แบบอัตโนมัติดังนั้นโดยหลักการแล้วการตระหนักถึงกระบวนการอื่นอย่างอิสระอาจดูเหมือนมีแนวโน้มที่แตกต่างกันอย่างมากเช่นการเพิ่มมูลค่าห่างจากจุดศูนย์กลาง เนื่องจาก OP มีการเชื่อมต่อที่ชัดเจนและจำแนกองค์ประกอบที่กำหนดได้อย่างชัดเจนสำหรับแนวโน้ม ("การเรเดียลเรียว") และองค์ประกอบที่สัมพันธ์กัน ("มีอิทธิพลเหนือเซลล์กริดหลายเซลล์") การตอบกลับว่าสิ่งนี้น่าจะถูกมองในเชิงบวกมากกว่า OP "จะต้องการ" เปลี่ยนความคิดของเขา
whuber

ฉันไม่แน่ใจว่าฉันเข้าใจสภาพพื้นที่คงที่ บนพื้นผิวดูเหมือนว่าจะขัดแย้งกับความคิดในการมี "จุดสูงสุดที่ลดลง" ในสถานที่เฉพาะ แต่ฉันชัดเจนไม่เข้าใจบางสิ่งบางอย่าง
Suresh Venkatasubramanian

1
@charles รูปแบบที่คุณอธิบายจะปรากฏสำหรับแต่ละจุดของกริดเนื่องจากข้อสมมติฐานเชิงพื้นที่คงที่ การหยุดนิ่งโดยพื้นฐานแล้วบอกว่าคะแนนทั้งหมดของฉันมีพฤติกรรมคล้ายกัน นี่ไม่ใช่กรณีที่อธิบายโดย OP คำตอบยังดีมาก แต่ไม่เหมาะสมในกรณีนี้
mpiktas
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.