เครื่องมือสถิติเชิงพื้นที่: การวิเคราะห์การจัดกลุ่มข้อมูล raster

ฉันเห็นได้ชัดว่าเป็นปัญหาที่เรียบง่าย แต่ฉันไม่สามารถหาวิธีการที่ชัดเจนในการใช้

ฉันมอบหมายให้กำหนดขอบเขต "เมือง" โดย vector convex polygons โดยใช้Gridded Population of the World dataset จาก CIESIN

ชุดข้อมูลนี้ให้ค่าความหนาแน่นของประชากรทั่วโลกเป็นไฟล์แรสเตอร์ ปัญหาคือตามที่คุณเดาแล้วว่าค่าความหนาแน่นกำลังเปลี่ยนแปลงไปมากและคำจำกัดความของ "เมือง" นั้นค่อนข้างสัมพันธ์กัน

ฉันพยายามใช้วิธีแบบคลาสสิกและคำนวณความลาดชันราวกับว่าค่าความหนาแน่นเป็นระดับความสูง แต่ค่าของความลาดชันก็ซับซ้อนและสลับซับซ้อนกันมาก

ฉันได้ดูอัลกอริธึมการจัดกลุ่มเชิงพื้นที่เครื่องมือ LISA (Local Indocators of Spatial Association) ด้วย ArcGIS และ GeoDa แต่ฉันเสียเครื่องมือเหล่านี้ไปมาก วิธีการบางอย่างใช้งานได้กับรูปร่างเวกเตอร์เท่านั้นดังนั้นจึงจำเป็นต้องมีการจัดประเภทและการทำให้เป็นเวกเตอร์ (การคำนวณแบบยาว)

คุณสามารถช่วยฉันปรับแต่งชุดวิธีการและเครื่องมือที่จะใช้ได้หรือไม่? ขอบคุณมาก!

— Laurent Jégou
แหล่งที่มา

อะไรคือคำจำกัดความของคำว่า "urban" BTW ฉันจะไม่คาดหวังว่าเขตเมืองทั้งหมดจะได้รับการอธิบายอย่างเพียงพอโดยรูปหลายเหลี่ยมนูน หลายคนมีรูปร่างที่ควบคุมโดยลักษณะทางภูมิศาสตร์ - ภูเขาแนวชายฝั่งและแม่น้ำ - ที่ไม่มีความนูนสูง

— whuber

ไม่ได้นิยามคำนิยามไม่ใช่ค่าคงที่ ฉันคิดว่าเป้าหมายคือการหาพื้นที่ที่มีความหนาแน่นมากขึ้นในแง่ของสภาพแวดล้อมซึ่งแตกต่างกันไป ดังนั้นความคิดเกี่ยวกับสถิติเชิงพื้นที่และ LISA คุณพูดถูกต้องฉันควรเขียนว่า "ไม่ใช่การตัดกันด้วยตนเองและไม่ตัดกันรูปหลายเหลี่ยมอื่น ๆ "

— Laurent Jégou

ในฐานะที่เป็นส่วนประกอบฉันพบโมดูล R ทั้งหมดซึ่งอุทิศให้กับเครื่องมือการรวมตัวกันในอวกาศ: spdep

— Laurent Jégou

คำตอบ:

ฉันทำงานเกี่ยวกับเรื่องนี้สำหรับ MSc ของฉันhttp://ian01.geog.psu.edu/papers/mscthesis.pdf - โดยทั่วไปฉันทำงานเกี่ยวกับการเปลี่ยนแปลงแบบไล่ระดับสี แต่การสนทนาอาจช่วยคุณได้

— Ian Turton
แหล่งที่มา

ขอบคุณฉันจะอ่านเร็ว ๆ นี้ แต่นั่นเป็นสัญญา :-)

— Laurent Jégou

ฉันได้ลองวิธีอนุพันธ์คู่ Sobel 2 ที่คุณอธิบายในวิทยานิพนธ์ในโซนทดสอบที่ จำกัด และมันน่าสนใจมาก! เคอร์เนลของเมืองที่ชัดเจนจะถูกแยกออกทำให้ค่าความหนาแน่นแตกต่างกันมาก ขอบคุณมาก :) ด้วยวิธีที่ฉันใช้ซอฟต์แวร์ฟรีและโอเพ่นซอร์สในการคำนวณ convolutions และ raster math: Opticks

— Laurent Jégou

การวัดแสงเทียมจะเป็นตัวแทนที่ดีสำหรับสภาพเมือง การค้นหา google ควรหาตัวอย่างการศึกษา

— b_dev

@indiehacker - ฉันดูแล้ว แต่มันขึ้นอยู่กับวัฒนธรรมฝรั่งเศสเป็นตัวอย่างที่มืดกว่าสหราชอาณาจักร

— Ian Turton

จากมุมมองของความหนาแน่นของประชากร "เขตเมือง" โดยทั่วไปควรจะตอบสนองเพียงไม่กี่เกณฑ์จริง :

ขอบเขตของมันไม่ควรรวมจุดใด ๆ ของ (ค่อนข้าง) ความหนาแน่นสูงเมื่อเทียบกับความหนาแน่นสูงสุดภายในการ
มันควรจะเชื่อมต่อได้ง่าย (ไม่มี "หลุม")
ความหนาแน่นของประชากรโดยเฉลี่ยควรเกินเกณฑ์ที่กำหนดไว้ล่วงหน้า

Axiom (1)เป็นธรรมชาติที่สุด: ถ้าจุดขอบเขตมีความหนาแน่นสูงเราจะย้ายขอบเขตออกไปด้านนอกเพื่อรวมจุดนั้นไว้ในเขตเมือง ฉันอยากจะแนะนำว่า "ญาติ" หมายถึงสัดส่วนของจำนวนสูงสุดเช่นหนึ่งในสิบหรือหนึ่งร้อยหรืออะไรก็ตาม ความจริง (2)หลีกเลี่ยงการยกเว้นสวนสาธารณะและภูมิภาคที่มีความหนาแน่นต่ำอื่น ๆ ที่เกิดขึ้นตามธรรมชาติในเมือง ความจริง (3)ซึ่งเพราะมันขึ้นอยู่กับเกณฑ์ค่อนข้างโดยพลการกำจัดหมู่บ้านเล็ก ๆ ที่มีขนาดกะทัดรัด

ที่จริงแล้วมีอย่างน้อยหนึ่งองค์ประกอบของความเด็ดขาด: แผนที่ gridded ใด ๆ ของความหนาแน่นของประชากรโดยเฉลี่ยค่าเฉลี่ยประชากรทั่วละแวกใกล้เคียงท้องถิ่น (เท่ากับหนึ่งเซลล์ในบางกรณีและเท่ากับรัศมีเคอร์เนลสำหรับการประมาณการความหนาแน่นของเคอร์เนล) มายอมรับขนาดพื้นที่ใกล้เคียงโดยปริยายนี้ (ซึ่งสามารถเปลี่ยนแปลงได้โดยการใช้วิธีการโฟกัสครั้งแรกหรือเคอร์เนลอื่น ๆ ทำให้แผนที่ความหนาแน่นดั้งเดิมราบเรียบ) ขีด จำกัด ประชากรนี้และความรู้สึกของ "ค่อนข้างสูง" ในสัจพจน์ 1 เป็นพารามิเตอร์ที่ผู้ใช้ตั้งค่าได้ผลลัพธ์.

สัจพจน์เหล่านี้นำไปสู่อัลกอริธึมที่ค่อนข้างง่ายโดยธรรมชาติ : เราต้องค้นหาตำแหน่งสูงสุดในท้องถิ่นดูในละแวกใกล้เคียงจนกว่าจะพบขอบเขตเพื่อตอบสนองความจริง (1) เติมหลุมใด ๆ เพื่อตอบสนองความจริง (2) ตาม (3) สิ่งนี้ทำได้ดังนี้:

เลือกแผนที่ความหนาแน่นได้อย่างราบรื่น
ทำอัลกอริทึม "เติม" บนแผนที่ที่เกี่ยวข้องกับความหนาแน่น (ดูด้านล่าง)
RegionGroup ผลลัพธ์
ลบหลุมออกจากรูปหลายเหลี่ยมของ RegionGrouped
ดำเนินการผลบวกความหนาแน่นของประชากรในรูปหลายเหลี่ยม
กำจัดรูปหลายเหลี่ยมใด ๆ ที่มีผลรวม (หรือความหนาแน่นเฉลี่ย) ต่ำกว่าขีด จำกัด ประชากร (ความหนาแน่น)

สิ่งที่เหลืออยู่คือทางออกของคุณ

ให้ฉันพูดเกี่ยวกับขั้นตอนเล็ก ๆ น้อย ๆ (1) ซึ่งเป็นกุญแจสำคัญ อัลกอรึทึมการเติมระบุ "sinks" และ "เติม" ให้สูงกว่าระดับความสูง นี่คือว่าสิ่งที่ความจริง (1) ขอให้เราทำอย่างไรให้ (ก) เราสามารถทำให้ "อ่าง" เล่นบทบาทของ "สูงสุดท้องถิ่น" และ (ข) ให้ "จำนวนคงที่ดังกล่าวข้างต้น" เล่นบทบาทของ "อย่างต่อเนื่องส่วนของ " วิธีที่จะทำคือการเติมลอการิทึมลบของความหนาแน่นมากกว่าความหนาแน่นนั่นเอง (เพิ่มค่าคงที่เล็ก ๆ ก่อนเพื่อความหนาแน่น - พูดประมาณ 0.1 คนต่อตารางกิโลเมตร - ก่อนที่จะบันทึกเพื่อให้เซลล์ใด ๆ ที่มีศูนย์จะไม่ทำให้เกิดปัญหา) "ทะเลสาบ" ในความหนาแน่นของบันทึกเชิงลบระบุผู้สมัคร เขตเมือง คุณยังคงมีสามพารามิเตอร์อิสระที่จะเล่นด้วย (เข้าสู่ขั้นตอนที่ 0, 1 และ 5) การตั้งค่าพวกเขาจะต้องมีความคิดเกี่ยวกับสิ่งที่คุณหมายถึงจริง ๆ โดย "เขตเมือง" เช่นเดียวกับการทดลองบางอย่าง

— whuber
แหล่งที่มา

ขอบคุณสำหรับคำตอบโดยละเอียดของคุณ ฉันจะพยายามหาเครื่องมือซอฟต์แวร์ที่เหมาะสม (หรือตั้งโปรแกรม) เพื่อทดสอบอัลกอริธึมเติมด้วยบันทึกเชิงลบซึ่งดูเหมือนว่าจะเป็นผู้นำที่ดี

— Laurent Jégou