อะไรทำให้รูปแบบตัว U อยู่ในความสัมพันธ์เชิงพื้นที่?


12

ฉันสังเกตเห็นในงานของฉันเองแบบนี้เมื่อตรวจสอบความสัมพันธ์เชิงพื้นที่ที่ระยะทางที่แตกต่างกันรูปแบบรูปตัวยูในความสัมพันธ์ที่โผล่ออกมา โดยเฉพาะอย่างยิ่งความสัมพันธ์เชิงบวกที่แข็งแกร่งที่ถังขยะขนาดเล็กลดลงตามระยะทางจากนั้นไปถึงหลุมที่จุดใดจุดหนึ่งแล้วไต่กลับขึ้นไป

นี่คือตัวอย่างจากบล็อกอนุรักษ์ระบบนิเวศน์Macroecology สนามเด็กเล่น (3) - อัตเชิงพื้นที่

Morrel I Correlogram

ความสัมพันธ์เชิงบวกที่เป็นบวกอัตโนมัติที่แข็งแกร่งเหล่านี้ในระยะทางที่ใหญ่กว่านั้นเป็นการละเมิดกฎข้อแรกของภูมิศาสตร์ภูมิศาสตร์ของ Tobler ดังนั้นฉันจึงคาดว่าจะเกิดจากรูปแบบอื่นในข้อมูล ฉันคาดหวังว่าพวกเขาจะถึงศูนย์ในระยะทางที่แน่นอนจากนั้นเลื่อนเมาส์ไปรอบ ๆ 0 ที่ระยะทางไกลกว่า (ซึ่งเป็นสิ่งที่เกิดขึ้นโดยทั่วไปในชุดอนุกรมเวลาที่มีคำสั่ง AR หรือ MA ต่ำ)

หากคุณทำการค้นหารูปภาพของ Googleคุณสามารถค้นหาตัวอย่างอื่น ๆ ของรูปแบบประเภทเดียวกันนี้ได้ (ดูตัวอย่างอื่นที่นี่ได้ที่นี่ ) ผู้ใช้บนไซต์ GIS ได้โพสต์สองตัวอย่างที่รูปแบบปรากฏสำหรับ Moran I แต่ไม่ปรากฏสำหรับ Geary C ( 1 , 2 ) ร่วมกับงานของฉันเองรูปแบบเหล่านี้สามารถสังเกตได้จากข้อมูลต้นฉบับ แต่เมื่อปรับโมเดลให้เหมาะสมกับเงื่อนไขเชิงพื้นที่และตรวจสอบสิ่งตกค้างที่เหลือพวกมันจะไม่ปรากฏตัว

ฉันไม่ได้เจอตัวอย่างในการวิเคราะห์อนุกรมเวลาที่แสดงพล็อต ACF ที่คล้ายกันดังนั้นฉันไม่แน่ใจว่ารูปแบบใดในข้อมูลดั้งเดิมจะทำให้เกิดสิ่งนี้ Scortchi ในความคิดเห็นนี้คาดการณ์ว่ารูปแบบไซน์ อาจเกิดจากรูปแบบตามฤดูกาลที่ถูกละเว้นในซีรีส์เวลานั้น แนวโน้มเชิงพื้นที่ประเภทเดียวกันอาจทำให้เกิดรูปแบบนี้ในรูปคู่เชิงพื้นที่ได้หรือไม่ หรือมันเป็นสิ่งประดิษฐ์อื่น ๆ ของวิธีการคำนวณความสัมพันธ์?


นี่คือตัวอย่างจากการทำงานของฉัน ตัวอย่างมีขนาดค่อนข้างใหญ่และเส้นสีเทาอ่อนเป็นชุดข้อมูลเรียงสับเปลี่ยน 19 ชุดเพื่อสร้างการกระจายการอ้างอิง (เพื่อให้สามารถเห็นความแปรปรวนในเส้นสีแดงคาดว่ามีขนาดค่อนข้างเล็ก) ดังนั้นแม้ว่าพล็อตจะค่อนข้างไม่น่าทึ่งเหมือนที่แสดงครั้งแรกหลุมและจากนั้นขึ้นไปในระยะทางไกลปรากฏค่อนข้างพร้อมในพล็อต (โปรดทราบว่าหลุมในเหมืองของฉันไม่ได้เป็นลบเช่นเดียวกับตัวอย่างอื่น ๆ หากสิ่งนั้นทำให้ตัวอย่างแตกต่างจากที่ฉันไม่รู้)

ป้อนคำอธิบายรูปภาพที่นี่

นี่คือแผนผังความหนาแน่นของเคอร์เนลของข้อมูลเพื่อดูการกระจายเชิงพื้นที่ที่สร้าง correlogram ดังกล่าว

KDE Crime ใน DC


1
ฉันไม่แน่ใจว่ามันถูกต้องหรือไม่ดังนั้นฉันไม่โพสต์มันเป็นคำตอบ แต่ฉันเดาว่าจะเป็นในระยะทางที่สั้นกว่ามีการสังเกตเพียงเล็กน้อยและสิ่งที่คล้ายกันมาก เมื่อมองจากระยะไกลการสังเกตเพิ่มเติมจะกลายเป็น "ใกล้เคียง" แต่ก็มีความคล้ายคลึงกันน้อยลงดังนั้นเอฟเฟกต์จะหายไป ในระยะทางไกลทุกอย่างอยู่ในบริเวณใกล้เคียง แต่เอฟเฟกต์ขนาดใหญ่ แต่อยู่ไกลทำให้สำรองข้อมูล (High-Five สำหรับการศึกษาบ้านเกิดของฉัน btw.)I
Sycorax พูดว่า Reinstate Monica

ฉันสามารถดูว่าที่มาจาก @ user777 แม้ว่าฉันอาจคาดหวังอาร์กิวเมนต์ที่คล้ายกันซึ่งจะทำให้พล็อตมีแนวโน้มเป็น 0 asymptotically ละแวกพื้นที่ได้รับขนาดใหญ่ นั่นคือเมื่อละแวกใกล้เคียงใหญ่ขึ้นค่าเฉลี่ยของพื้นที่ใกล้เคียงจะใกล้เคียงกับค่าเฉลี่ยยิ่งใหญ่ ในหัวของฉัน (ฉันคิดว่า) ที่จะทำให้ความสัมพันธ์ไปถึงศูนย์ไม่ใช่อย่างใดอย่างหนึ่ง แต่ฉันอาจจะผิดได้ง่าย (อาร์กิวเมนต์เดียวกันควรใช้กับอนุกรมเวลาเช่นกันและฉันจำไม่ได้ว่าเห็นแผนการแปลง ACF สำหรับอนุกรมเวลาที่มีลักษณะเช่นนี้)
Andy W

kde ของ DC ทำให้ฉันนึกถึงกระดานหมากรุกสักหน่อย พล็อตการหาค่าอัตโนมัติเชิงพื้นที่จากกระดานหมากรุกมีลักษณะอย่างไร ฉันสงสัยว่ามันจะไม่สูงในระยะใกล้ (สแควร์เดียวกัน), ลดน้อยลงเล็กน้อย (สแควร์ที่แตกต่างกัน), และสูงขึ้นอีกครั้ง ฉันไม่รู้เกี่ยวกับหัวข้อนี้มากพอที่จะรู้ว่านั่นเป็นคำตอบหรือไม่
gung - Reinstate Monica

@ gung ขึ้นอยู่กับว่าคุณกำหนดระยะทางอย่างไรในกรณีนั้น สำหรับกระดานหมากรุกที่มีความต่อเนื่องกันของราชินีมันจะมีความหมายเหมือนกันกับคำที่เป็นลบอัตโนมัติซึ่งเป็นช่วงเวลาที่ทำให้เกิดการวางแผนแบบ ACF เพื่อเป็นทางเลือกระหว่างความสัมพันธ์เชิงบวกและเชิงลบ (และคลื่นจะลดลง ) มันมีความซับซ้อนมากกว่าในการวิเคราะห์เชิงพื้นที่มากกว่าในอนุกรมเวลา ฉันจะไม่อธิบายลักษณะนี้เป็นกระดานหมากรุกแม้ว่า
Andy W

2
ชุดข้อมูลของคุณมีพื้นที่ครอบคลุมไม่เพียงพอที่คุณควรประเมิน autocovariances ในระยะทาง 5 กิโลเมตร (พื้นที่ทั้งหมดไม่เกิน 10 กิโลเมตรข้ามและโดยทั่วไปคุณต้องการมีชุดข้อมูลที่ครอบคลุมหลายครั้ง ความยาวสหสัมพันธ์) สำหรับฉันแล้วคุณเห็นว่าคุณมี "blobs" สามตัวที่มีอาชญากรรมสูงในรูปสามเหลี่ยมโดยประมาณ 5K ห่างจากกันและมีช่องว่างระหว่างกัน ดังนั้นจึงไม่น่าแปลกใจที่จะเห็นความสัมพันธ์เชิงบวกในระยะเวลานั้น
Brian Borchers

คำตอบ:


4

คำอธิบาย

correlogram ที่มีรูปตัว u เป็นเหตุการณ์ที่เกิดขึ้นทั่วไปเมื่อมีการคำนวณข้ามขอบเขตทั้งหมดของปรากฏการณ์ที่เกิดขึ้น มันแสดงให้เห็นโดยเฉพาะอย่างยิ่งกับปรากฏการณ์ที่คล้ายขนนกในธรรมชาติเช่นการปนเปื้อนในดินหรือน้ำใต้ดินหรือเช่นในกรณีนี้ที่ปรากฏการณ์มีความสัมพันธ์กับความหนาแน่นของประชากรซึ่งโดยทั่วไปจะลดลงต่อขอบเขตของพื้นที่ศึกษา (อำเภอของ โคลัมเบียซึ่งมีใจกลางเมืองที่มีความหนาแน่นสูงและล้อมรอบด้วยชานเมืองที่มีความหนาแน่นต่ำ)

จงระลึกว่า correlogram สรุประดับความคล้ายคลึงกันของข้อมูลทั้งหมดตามจำนวนการแยกเชิงพื้นที่ ค่าที่สูงกว่านั้นคล้ายกันมากขึ้นและค่าที่ต่ำกว่าก็จะคล้ายกันน้อยลง จุดคู่เดียวที่สามารถแยกอวกาศได้มากที่สุดคือจุดที่อยู่ตรงข้ามกับแผนที่ ความสัมพันธ์จึงมีการเปรียบเทียบค่าตามแนวเขตแดนกับแต่ละอื่น ๆ เมื่อค่าข้อมูลโดยรวมมีแนวโน้มที่จะลดลงไปสู่ขอบเขต correlogram สามารถเปรียบเทียบค่าขนาดเล็กกับค่าขนาดเล็กได้ ดูเหมือนว่าพวกเขาจะคล้ายกันมาก

สำหรับปรากฏการณ์ที่มีลักษณะคล้ายขนนกหรือเชิงพื้นที่อื่น ๆ เราสามารถคาดการณ์ได้ก่อนที่จะรวบรวมข้อมูลที่มีความสัมพันธ์แบบสหสัมพันธ์จะลดลงจนกระทั่งถึงเส้นผ่านศูนย์กลางของพื้นที่ประมาณครึ่งหนึ่งจากนั้นจะเริ่มเพิ่มขึ้น

ผลกระทบรอง: ความแปรปรวนของการประมาณค่า

ผลกระทบที่สองคือมีจุดข้อมูลคู่มากขึ้นในการประมาณค่าความสัมพันธ์ในระยะทางสั้นกว่าระยะทางที่ไกลกว่า ที่ระยะทางปานกลางถึงไกล "ความล่าช้าของประชากร" ของคู่จุดดังกล่าวจะลดลง สิ่งนี้จะเพิ่มความแปรปรวนของ correlogram เชิงประจักษ์ บางครั้งความแปรปรวนนี้เพียงอย่างเดียวจะสร้างรูปแบบที่ผิดปกติใน correlogram เห็นได้ชัดว่ามีการใช้ชุดข้อมูลขนาดใหญ่ในรูปด้านบน ("Moran I") ซึ่งลดผลกระทบนี้ แต่อย่างไรก็ตามการเพิ่มขึ้นของความแปรปรวนนั้นเห็นได้ชัดในแอมพลิจูดขนาดใหญ่ของความผันผวนของท้องถิ่นในพล็อต ระยะทางสูงสุด

กฎของหัวแม่มือที่ยืนยาวในสถิติเชิงพื้นที่ดังนั้นเพื่อหลีกเลี่ยงการคำนวณ correlogram ในระยะทางที่มากกว่าครึ่งหนึ่งของพื้นที่ศึกษาและเพื่อหลีกเลี่ยงการใช้ระยะทางที่ยอดเยี่ยมสำหรับการทำนาย

เหตุใดระยะเวลาเชิงพื้นที่จึงไม่ใช่คำตอบที่สมบูรณ์

วรรณกรรมเกี่ยวกับสถิติเชิงพื้นที่แน่นอนว่ารูปแบบเชิงพื้นที่สามารถทำให้เกิดการสะท้อนกลับใน correlogram ในระยะทางที่กว้างขึ้น นักธรณีวิทยาเหมืองแร่เรียกสิ่งนี้ว่า มีคลาสของรูปแปรที่รวมคำศัพท์ไซน์ที่มีอยู่เพื่อจำลอง อย่างไรก็ตามการผันแปรเหล่านี้ทั้งหมดกำหนดให้การสลายตัวที่แข็งแกร่งด้วยระยะทางเช่นกันดังนั้นจึงไม่สามารถอธิบายถึงการกลับคืนสู่ความสัมพันธ์แบบเต็มรูปแบบที่แสดงในรูปแรกได้ ยิ่งไปกว่านั้นในสองมิติขึ้นไปมันเป็นไปไม่ได้สำหรับปรากฏการณ์ที่จะเป็นทั้ง isotropic (ซึ่งมีความสัมพันธ์ในทิศทางที่เหมือนกันทั้งหมด) และเป็นระยะ ดังนั้นช่วงเวลาของข้อมูลเพียงอย่างเดียวจะไม่นับรวมสิ่งที่ปรากฏ

สิ่งที่สามารถทำได้

วิธีที่ถูกต้องในการดำเนินการในสถานการณ์เช่นนี้คือการยอมรับว่าปรากฏการณ์นั้นไม่คงที่และนำแบบจำลองที่อธิบายไว้ในแง่ของรูปแบบที่กำหนดขึ้นมาบางอย่าง- "ดริฟท์" หรือ "เทรนด์" - ด้วยความผันผวนเพิ่มเติมรอบ ๆ ซึ่งอาจมีความสัมพันธ์เชิงพื้นที่ (และชั่วคราว) วิธีการอื่นในข้อมูลเช่นจำนวนอาชญากรรมคือการศึกษาตัวแปรที่เกี่ยวข้องที่แตกต่างกันเช่นอาชญากรรมต่อประชากรหน่วย


ขอขอบคุณคุณคิดว่าน้ำหนักแบบเฉพาะกิจสำหรับเอฟเฟกต์ขอบนั้นถูกเรียกมาหรือไม่? (นั่นอาจเกินความจริงสำหรับการวิเคราะห์เชิงสำรวจของแบบจำลองส่วนที่เหลือ) วิทยานิพนธ์ของฉันจริง ๆ แล้วฉันใช้ดริฟท์เชิงพื้นที่ที่ไม่เป็นเชิงเส้นและแนวโน้มแนวโน้ม - อาชญากรรมต่อประชากรหน่วยนั้นน่ารำคาญด้วยเหตุผลหลายประการ ประชากรที่อยู่อาศัยไม่ใช่พื้นฐานที่น่าสนใจจริงๆ - มันเหมือนกับการเดินเล่นรอบ ๆ ประชากร พื้นที่ในเมืองชั้นในนี้สามารถขยายตัวได้มาก (20 ~ 30 ครั้ง) ในบางช่วงเวลาและเกี่ยวข้องกับสถาบันที่ไม่ใช่ที่อยู่อาศัยมากกว่า (งานและความบันเทิง)
Andy W

คุณมีตัวเลือกมากมาย Andy เพราะไม่มีวิธีในการระบุรูปแบบที่ไม่ซ้ำใคร: คุณต้องตัดสินใจว่าคุณต้องการหยุดการสร้างแบบจำลองค่าในแง่ของการดริฟท์เชิงพื้นที่และเริ่มสร้างแบบจำลองพวกเขา แบบจำลองเชิงพื้นที่สุ่ม correlogram รูปตัวยูสามารถเข้าใจได้ว่าเป็นตัวบ่งชี้ที่แข็งแกร่งว่าจำเป็นต้องมีกลไกของการสร้างแบบจำลองการดริฟท์ การทำให้เป็นมาตรฐานโดยประชากรที่เกี่ยวข้อง (แม้ว่าจะสามารถประมาณได้โดยประมาณเท่านั้น) เป็นวิธีหนึ่งที่คุณสามารถใช้ได้ รวมถึงมาตรการของประชากร (หรือการใช้งานเป็นต้น) เนื่องจากโควาเรียตเป็นอีกมาตรการหนึ่ง
whuber

ฉันเข้ามาใกล้โดยใช้มาตรการการใช้พื้นที่กิจกรรมมากมาย (บาร์สถานีบริการน้ำมันโรงพยาบาลโรงเรียน ฯลฯ ) รวมถึงข้อกำหนดเชิงพื้นที่ นี่คือแผนที่ของการคาดการณ์ที่ถือผู้อื่นตัวแปรคงที่ ยังมีความสัมพันธ์แบบอัตโนมัติที่เหลืออยู่เล็กน้อย ฉันสงสัยว่าเกิดข้อผิดพลาดเท่าใดการทำแผนที่ dasymetric ของประชากรไปยังสถานที่เล็ก ๆ จะช่วยได้ แต่ฉันจินตนาการว่าฉันจะทำการวิเคราะห์นั้นในที่สุด
Andy W

นั่นเป็นวิธีการที่หลักการ: ให้ทฤษฎีแนะนำการพัฒนาองค์ประกอบดริฟท์ของแบบจำลองและประเมินค่าเศษเหลือเพื่อตัดสินใจว่ามันจะคุ้มค่ากับปัญหาของการสร้างแบบจำลองความสัมพันธ์เชิงพื้นที่สัมพันธ์หรือไม่ ในหลายกรณีความสัมพันธ์เชิงพื้นที่ส่วนใหญ่มีการอธิบายอย่างเพียงพอโดยเงื่อนไขการดริฟท์และเป็นเรื่องยากที่จะต้องใช้เครื่องจักรธรณีศาสตร์เต็มรูปแบบ ประเด็นที่น่าสนใจอย่างหนึ่งของปัญหาของคุณก็คือตัวชี้วัดพื้นฐาน (ระยะทางอวกาศ) อาจเป็นเวลาเดินทางหรือระยะทางในการเดินทางไปตามเครือข่ายถนนมากกว่าระยะทางแบบยุคลิด
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.