เมื่อจัดการกับความละเอียดที่แตกต่างกัน rasters ควรหนึ่งตัวอย่างที่ความละเอียดสูงสุดหรือต่ำสุด?


16

ฉันกำลังมองหาคำแนะนำเกี่ยวกับแนวทางปฏิบัติที่ดีที่สุดสำหรับการจัดการกับเลเยอร์ข้อมูลแรสเตอร์ที่มีความละเอียดและการคาดการณ์ที่แตกต่างกัน คำแนะนำที่ฉันได้รับคือการสุ่มตัวอย่างเลเยอร์ใหม่ด้วยความละเอียดต่ำสุดเสมอก่อนทำการวิเคราะห์ใด ๆ แต่ดูเหมือนว่าฉันจะเสียความแม่นยำไปมากและฉันไม่เคยได้รับคำอธิบายที่ชัดเจนว่าทำไมจึงควรทำ

เมื่อใดจึงมีความสมเหตุสมผลในการสุ่มตัวอย่างใหม่เพื่อให้ตรงกับตารางความละเอียดที่สูงกว่าและสิ่งที่เป็นความหมายเปรียบเทียบกับ resampling กับความละเอียดที่ต่ำกว่า?

ฉันตระหนักว่านี่เป็นสถานการณ์ที่ขึ้นอยู่กับสถานการณ์ ฉันมักจะมองหาแนวทางทั่วไป แต่นี่เป็นสถานการณ์เฉพาะของฉันสำหรับการอ้างอิง:

สถานการณ์จำลอง:ฉันกำลังมองหาที่จะสร้างแบบจำลองการถดถอยเชิงพื้นที่เพื่อทำนายการใช้ที่ดินโดยพิจารณาจากความหลากหลายของชั้นสิ่งแวดล้อมและสังคม - เศรษฐกิจ แผนที่การใช้ที่ดินของฉันคือ Landsat ที่ได้รับและด้วยความละเอียด 30 ม. ตัวอย่างของเลเยอร์ที่อธิบายได้ ได้แก่SRTM DEM (3 อาร์ค - วินาที, ~ 90 ม.) และเลเยอร์ภูมิอากาศBioclim (30 อาร์ค - วินาที, ~ 1 กม.)


1
คุณช่วยกรุณาให้ข้อมูลเพิ่มเติมเกี่ยวกับรูปแบบการถดถอยและวิธีการใช้งานได้หรือไม่? +1 สำหรับคำถามที่น่าสนใจและถูกสร้างขึ้นมาอย่างดี!
แอรอน

ฉันกำลังเปรียบเทียบการครอบคลุมของฟอเรสต์ในเวลาสองจุดและใช้แบบจำลองการถดถอยโลจิสติกพร้อมกับ (ความน่าจะเป็น) ที่เป็นการตัดไม้ทำลายป่าเป็นการตอบสนองของฉัน ฉันจะนำไปใช้ใน R.
Matt SM

คำตอบ:


17

จริง ๆ แล้วมันไม่ใช่ทุกอย่างที่ขึ้นอยู่กับสถานการณ์และเป็นเรื่องเกี่ยวกับข้อผิดพลาดทางสถิติ

เมื่อใดก็ตามที่คุณ resample เป็นความละเอียดสูงกว่าคุณจะแนะนำความถูกต้องเท็จ พิจารณาชุดข้อมูลที่วัดเป็นฟุตที่ตัวเลขทั้งหมดเท่านั้น จุดใดก็ตามที่ระบุอาจอยู่ในระดับ +/- 0.5 ฟุตจากตำแหน่งจริง หากคุณส่งตัวอย่างต่อไปยังอันดับที่สิบที่ใกล้ที่สุดตอนนี้คุณกำลังพูดว่าหมายเลขที่ระบุใด ๆ ไม่เกิน +/- 0.1 จากตำแหน่งจริง แต่คุณรู้ว่าการวัดเริ่มต้นของคุณนั้นไม่ถูกต้องและตอนนี้คุณกำลังทำงานอยู่ภายในระยะขอบของข้อผิดพลาด อย่างไรก็ตามหากคุณไปอีกทางหนึ่งแล้วสุ่มไปที่ความละเอียดต่ำกว่าคุณจะรู้ว่าค่าจุดใด ๆ ที่ให้นั้นมีความถูกต้องแน่นอน

นอกเหนือจากคณิตศาสตร์สถิติสถานที่แรกที่นึกได้คือการสำรวจที่ดิน การสำรวจก่อนหน้านี้ระบุเฉพาะแบริ่งลงไปถึงครึ่งนาทีที่ใกล้ที่สุดและระยะทางถึงหนึ่งในสิบของเท้า การพล็อตการข้ามเขตแดนด้วยการวัดเหล่านี้มักส่งผลให้เกิดความผิดพลาด (จุดเริ่มต้นและจุดสิ้นสุดควรเหมือนกัน แต่ไม่ได้วัด) เป็นฟุต การสำรวจความคิดเห็นสมัยใหม่จะไปอย่างน้อยวินาทีและใกล้ที่สุด ค่าที่ได้รับ (เช่นพื้นที่มาก) อาจได้รับผลกระทบอย่างมีนัยสำคัญจากความแตกต่างของความแม่นยำ มูลค่าที่ได้รับนั้นสามารถกำหนดได้อย่างแม่นยำมากเกินไป

ในกรณีการวิเคราะห์ของคุณหากคุณลองใช้ความละเอียดที่สูงขึ้นผลลัพธ์ของคุณจะให้ความแม่นยำมากกว่าข้อมูลที่ใช้ พิจารณา SRTM ของคุณที่ 90m ด้วยวิธีใดก็ตามที่พวกเขาวัดระดับความสูง (เฉลี่ย / ผลตอบแทนสูงสุด / เฉลี่ย) หน่วยที่เล็กที่สุด (พิกเซล) ที่สามารถแยกความแตกต่างจากเพื่อนบ้านคือ 90m หากคุณส่งตัวอย่างนั้นอีก 30 นาที

  • คุณคิดว่าพิกเซลที่เกิดขึ้นทั้งหมดเก้าตัวนั้นมีระดับความสูงเท่ากันเมื่อโดยความจริงแล้วอาจมีเพียงจุดเดียว - ศูนย์กลางหรือมุมบนซ้าย - (หรือไม่มีเลย!) คือ
  • คุณสอดแทรกระหว่างพิกเซลการสร้างค่าที่ได้มาไม่เคยปรากฏมาก่อน

ดังนั้นในทั้งสองกรณีคุณจะแนะนำความแม่นยำที่ผิดพลาดเนื่องจากชุดย่อยใหม่ของคุณไม่ได้วัดจริง

คำถามที่เกี่ยวข้อง: มีวิธีปฏิบัติอะไรบ้างสำหรับการสร้างแบบจำลองความเหมาะสมของที่ดิน?


นั่นถือเป็นจุดข้อมูลอย่างแน่นอน แต่ฉันสงสัยว่ามันแตกต่างกันสำหรับข้อมูลแรสเตอร์ที่เฉลี่ยปริมาณเชิงพื้นที่ที่เปลี่ยนแปลงอย่างต่อเนื่องซึ่งมีความแม่นยำของตำแหน่งและความแม่นยำของปริมาณที่วัดได้ นอกจากนี้ปริมาณที่ต่างกันก็มีระดับความแปรปรวนของอวกาศต่างกัน ตัวอย่างเช่นข้อมูลการยกระดับความสูงอีกครั้งไปยังความละเอียดที่สูงขึ้นจะต้องมีข้อผิดพลาดในพื้นที่ภูเขามากกว่าทุ่งหญ้า
Matt SM

@MattSM เป็นจริงของข้อมูลเชิงพื้นที่ทั้งหมดและประกอบกับข้อผิดพลาดทางสถิติของปริมาณที่วัดได้ พิจารณา SRTM ของคุณที่ 90m ด้วยวิธีใดก็ตามที่พวกเขาวัดระดับความสูง (avg / max / Mean return) หน่วยที่เล็กที่สุด (พิกเซล) ที่สามารถแยกความแตกต่างจากเพื่อนบ้านคือ 90m หากคุณสุ่มตัวอย่างใหม่อีกครั้งเป็น 30 ม. คุณกำลังบอกว่า 9 พิกเซลที่เป็นผลลัพธ์นั้นมีระดับความสูงเท่ากันเมื่อโดยความจริงแล้วอาจมีเพียงหนึ่ง (หรือไม่มีเลย!) คือ - ศูนย์กลางหรือมุมบนซ้าย หรือคุณสอดแทรกระหว่างพิกเซลการสร้างค่าที่ไม่เคยมีมาก่อนจึงมีความแม่นยำที่ผิดพลาด และใช่ช่วงค่าจะเล่นกับข้อผิดพลาดที่อาจเกิดขึ้น
Chris W

เช่นเดียวกับการบันทึกด้านข้างเป็นไปได้ที่จะแก้ไขคุณลักษณะเฉพาะในกรณีพิเศษที่รูปแบบถูก จำกัด อย่างชัดเจน - คุณลักษณะที่ไม่ใช่ทางภูมิศาสตร์หนึ่งคุณลักษณะที่อยู่ในใจคือการสร้างข้อมูลหมายเลขทะเบียนจากภาพถ่ายที่ความละเอียดต่ำเกินกว่าจะอ่านได้ แต่คุณต้องรู้ว่าคุณกำลังมองดูอะไรฉันจำได้ว่าบางกรณีที่การสร้างหมายเลขทะเบียนใหม่ล้มเหลวเนื่องจากแผ่นที่มีปัญหานั้นอยู่ในสคริปต์ที่ไม่ใช่ภาษายุโรปเช่นภาษาอาหรับ
Steve Barnes

แล้ว rasters ที่มีความละเอียดแบบอาร์คไม่ใช่พวกมันมีกริดเซลล์ที่อาจมีพื้นที่ / อัตราส่วนภาพที่ต่างกันหรือไม่
CMCDragonkai

@CMCDragonkai ฉันไม่แน่ใจว่าจะจัดการกับสิ่งนั้นอย่างไรเพราะคุณกำลังเข้าสู่การแสดงข้อมูลเทียบกับรูปแบบและประสานงานระบบ / การคาดการณ์ ใช่พื้นที่ทางภูมิศาสตร์ในภาพแรสเตอร์นั้นไม่จำเป็นต้องมีความสม่ำเสมอเท่าพิกเซล (หรืออัตราส่วนภาพอื่น ๆ ) รายละเอียดข้อมูล sat จำนวนมากจะบอกคุณนี้ (พิกเซลคือ x ที่ขีดตกต่ำสุดและ y ที่ขอบ swath) แต่ปัญหาการ resampling ยังคงมีผลอยู่ (และขออภัยสำหรับความล่าช้าฉันไม่ได้อยู่ใน SE ในบางเวลา)
Chris W
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.