ตัวแบบสำหรับการประมาณความหนาแน่นของประชากร


14

ฐานข้อมูลของ (ประชากรพื้นที่รูปร่าง) สามารถใช้ในการทำแผนที่ความหนาแน่นของประชากรโดยกำหนดค่าคงที่ของประชากร / พื้นที่ให้กับแต่ละรูปร่าง อย่างไรก็ตามประชากรมักไม่กระจายอย่างสม่ำเสมอภายในรูปหลายเหลี่ยม การทำแผนที่ Dasymetricเป็นกระบวนการของการปรับการประเมินความหนาแน่นเหล่านี้โดยใช้ข้อมูลเสริม มันเป็นปัญหาที่สำคัญในสังคมศาสตร์ตามที่รีวิวล่าสุดระบุ

สมมติว่าเรามีแผนที่เสริมของที่ดินปกคลุม (หรือปัจจัยอื่นใดที่ไม่ต่อเนื่อง) ในกรณีที่ง่ายที่สุดเราสามารถใช้พื้นที่ที่ไม่สามารถอยู่อาศัยได้อย่างเห็นได้ชัดเช่นแหล่งน้ำเพื่อแยกแยะว่าประชากรไม่ได้อยู่ที่ใดและกำหนดประชากรทั้งหมดให้กับพื้นที่ที่เหลือ โดยทั่วไปแต่ละหน่วยสำรวจสำมะโนประชากรของจะแกะสลักเป็นkส่วนมีพื้นที่ผิวx J ฉัน , ฉัน= 1 , 2 , ... , k ชุดข้อมูลของเราจะถูกเพิ่มเข้าไปในรายการของ tuplesjkxjii=1,2,,k

(yj,xj1,xj2,,xjk)

ที่เป็นประชากร (สันนิษฐานว่าวัดไม่มีข้อผิดพลาด) ในหน่วยJและ - แม้ว่านี้ไม่เคร่งครัดกรณี - เราอาจคิดทุกx J ฉันยังเป็นวัดว่า ในข้อตกลงเหล่านี้มีวัตถุประสงค์เพื่อแยกแต่ละy jเป็นผลรวมyjjxjiyj

yj=zj1+zj2++zjk

ซึ่งแต่ละและZ J ฉันประมาณการประชากรภายในหน่วยเจพำนักอยู่ในที่ดินปกระดับฉัน การประมาณการต้องไม่เอนเอียง พาร์ทิชันนี้กลั่นแผนที่ความหนาแน่นของประชากรโดยการกำหนดความหนาแน่นZ J ฉัน / x J ฉันแยกของเจTHสำรวจสำมะโนประชากรของรูปหลายเหลี่ยมและฉันTHชั้นปกคลุมดิน zji0zjijizji/xjijthith

ปัญหานี้แตกต่างจากการตั้งค่าการถดถอยมาตรฐานในรูปแบบที่โดดเด่น:

  1. การแบ่งพาร์ติชันของแต่ละต้องเป็นแบบตรงทั้งหมด yj
  2. ส่วนประกอบของทุกพาร์ติชั่นต้องไม่เป็นลบ
  3. มี (โดยสันนิษฐาน) ไม่มีข้อผิดพลาดในข้อมูลใด ๆ : ประชากรทั้งหมดนับและพื้นที่ทั้งหมดx j iถูกต้อง yjxji

มีวิธีการมากมายในการแก้ปัญหาเช่นวิธี " การทำแผนที่อัจฉริยะ dasymetric " แต่สิ่งที่ฉันได้อ่านมาทั้งหมดนั้นมีองค์ประกอบแบบเฉพาะกิจและมีศักยภาพที่ชัดเจนสำหรับความลำเอียง ฉันกำลังค้นหาคำตอบที่แนะนำวิธีการทางสถิติที่สร้างสรรค์และใช้งานง่าย การประยุกต์ใช้ทันทีกังวลคอลเลกชันของ - 10 6หน่วยสำรวจสำมะโนประชากรเฉลี่ย 40 คนต่อคน (แม้จะมีเศษส่วนขนาดใหญ่ที่มี 0 คน) และประมาณหนึ่งโหลชั้นเรียนครอบคลุมที่ดิน105106


แก้ไขปัญหาการจัดรูปแบบแล้ว มันเป็นข้อผิดพลาด
Rob Hyndman

@Rob ขอบคุณและขอขอบคุณทุกคนที่ดูสิ่งนี้: ฉันเห็นความคิดเห็นของคุณก่อนที่พวกเขาจะถูกลบและขอบคุณสำหรับความพยายามของคุณ
whuber

1
สิ่งนี้: P. A Zandbergen และ D. A Ignizio,“ การเปรียบเทียบเทคนิคการทำแผนที่ Dasymetric สำหรับการประมาณจำนวนประชากรในพื้นที่ขนาดเล็ก” การทำแผนที่และวิทยาการสารสนเทศภูมิศาสตร์ 37, ไม่มี 3 (2010): 199–214 ingentaconnect.com/content/acsm/cagis/2010/00000037/00000003/ ...... ซึ่งดูเหมือนว่าจะเรียกร้องให้ผสม
fgregg

1
บทความนี้อาจเป็นประโยชน์: Hwahwan Kim และ Xiaobai Yao,“ การแก้ไข Pycnophylactic ได้มีการทบทวนอีกครั้ง: การทำงานร่วมกับวิธีการทำแผนที่แบบ dasymetric” วารสารนานาชาติ Remote Sensing 31, ฉบับที่ 31 21 (2010): 5657. informaworld.com/10.1080/01431161.2010.496805
fgregg

1
คุณรู้ไหมว่าการทำแผนที่ dasymetric ในที่สุดก็เป็นปัญหาการอนุมานทางนิเวศวิทยา ผลงานล่าสุดของ K. Imai อาจมีประโยชน์: pan.oxfordjournals.org/content/16/1/41.abstract
fgregg

คำตอบ:


4

คุณอาจต้องการตรวจสอบงานของ Mitchel Langford ในการทำแผนที่แบบ dasymetric

เขาสร้างแรสเตอร์ซึ่งเป็นตัวแทนของการกระจายตัวของประชากรในเวลส์และวิธีการบางอย่างของวิธีการของเขาอาจมีประโยชน์ที่นี่

ปรับปรุง: นอกจากนี้คุณยังอาจจะต้องดูที่การทำงานของเจเรมี Mennis (โดยเฉพาะอย่างยิ่งเหล่านี้ สองบทความ)


2
ขอขอบคุณ. งานนั้นให้ตัวชี้ไปยังเว็บของการวิจัยล่าสุดเกี่ยวกับการทำแผนที่ dasymetric
whuber

2

คำถามที่น่าสนใจ นี่คือแทงชั่วคราวที่เข้าใกล้สิ่งนี้จากมุมสถิติ สมมติว่าเรามาด้วยวิธีการที่จะกำหนดจำนวนประชากรในแต่ละพื้นที่ฉัน แสดงความสัมพันธ์นี้ดังนี้:xji

zji=f(xji,β)

เห็นได้ชัดว่ารูปแบบการทำงานใด ๆ ที่เรากำหนดไว้ในจะเป็นการประมาณความสัมพันธ์ที่แท้จริงที่ดีที่สุด ดังนั้นข้างต้นกลายเป็น:f(.)

zji=f(xji,β)+ϵji

ที่ไหน

ϵjiN(0,σ2)

ข้อผิดพลาดในการกระจายข้อสันนิษฐานเกี่ยวกับข้อผิดพลาดมีวัตถุประสงค์เพื่อเป็นตัวอย่าง หากจำเป็นเราสามารถเปลี่ยนได้ตามความเหมาะสม

yjif(.)

iϵji=0

if(xji,β)=yj

zjizjf(xji,β)fj

zjN(fj,σ2I)I(fje=yj)I((zjfj)e=0)

ที่ไหน

e

yj

yjσ2

แก้ไข 1

การคิดสูตรข้างต้นให้มากขึ้นนั้นง่ายขึ้นเนื่องจากมีข้อ จำกัด มากกว่าที่ต้องการ

zji=f(xji,β)+ϵji

ที่ไหน

ϵjiN(0,σ2)

zjizjf(xji,β)fj

zjN(fj,σ2I)I(zje=yj)

ที่ไหน

e

zj


2
@Srikant ขอบคุณ ฉันคิดถึงเส้นที่คล้ายกันเมื่อฉันโพสต์คำถามและได้ทดสอบ GLM (การแจกแจงปัวซงด้วยการเชื่อมโยงเชิงเส้น ) เช่นเดียวกับรุ่นอื่น ๆ น่าเสียดายที่ตอนนี้ดูเหมือนว่าโมเดลใด ๆ ที่ยึดตามประเภทของที่ดินและสัดส่วนจะไม่สามารถใช้งานได้ดีตัวอย่างของข้อมูลเหล่านี้ชี้ให้เห็นว่ารูปแบบของประชากรขึ้นอยู่กับบริบทเชิงพื้นที่ที่กว้างขึ้น อย่างน้อยที่สุดเราจะต้องรวม covariates ที่มีความสัมพันธ์เชิงพื้นที่ในโมเดลเชิงเส้น
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.