สถิติที่เหมาะสมในการวัดความสัมพันธ์เชิงพื้นที่ของจุดที่มีค่าไบนารีคืออะไร?


9

ฉันพยายามกำหนดระดับของความสัมพันธ์เชิงพื้นที่อัตโนมัติในชุดข้อมูลแบบจุด คุณลักษณะที่ฉันสนใจคือไบนารี (มี / ไม่มีสปีชีส์) ซึ่งโมแรนฉันไม่เหมาะสม ในทางกลับกันสถิติการนับร่วมซึ่งโดยทั่วไปจะแนะนำให้ใช้สำหรับข้อมูลไบนารีหรือหมวดหมู่เห็นได้ชัดว่าไม่เหมาะสำหรับข้อมูลจุด ในระยะสั้นคำถามคือ: อะไรคือสถิติที่เหมาะสมในการวัดระดับโลกและ / หรือท้องถิ่น autocorrelation จุดเมื่อคุณสมบัติของผลประโยชน์เป็นไบนารี?

คำตอบ:


4

การยืนยันของคุณว่าสถิติการเข้าร่วมนับไม่เหมาะสมสำหรับข้อมูลไบนารีไม่ถูกต้อง เป็นเพียงเรื่องของการระบุน้ำหนักเชิงพื้นที่ (Wij) เช่นเดียวกับใน Morna's-I คุณไม่สามารถใช้เมทริกซ์ระยะทางในการวิเคราะห์ประเภทนี้อย่างไรก็ตามเมทริกซ์ไบนารีที่เหมาะสมของความบังเอิญอาจคำนวณได้โดยใช้การตัดระยะทาง คุณสามารถสร้างเมทริกซ์ตุ้มน้ำหนักเชิงพื้นที่ประเภทนี้รวมทั้งทำการวิเคราะห์การเข้าร่วมนับในไลบรารี R spdep ดูฟังก์ชัน "joincount.test" และ joincount.mc (สำหรับการทดสอบการเปลี่ยนรูปของ Monte Carlo)


ขอบคุณเจฟฟรีย์ การนับร่วมเป็นวิธีที่ชัดเจนในการไปหาข้อมูลไบนารี แต่ฉันเห็นคำแนะนำ (จำไม่ได้ว่าตอนนี้) ว่าการนับร่วมนั้นเหมาะสมสำหรับข้อมูลพื้นที่ (ไม่ใช่จุด) เท่านั้น ฉันไม่เห็นชัดเจนเลยว่าทำไมคุณไม่สามารถสร้างเมทริกซ์ตุ้มน้ำหนักโดยใช้ระยะทางและใช้การนับร่วม แต่ฉันไม่พบตัวอย่างของสิ่งนี้ในการค้นหาคร่าวๆ มีการอ้างอิงที่คุณสามารถให้สำหรับการใช้งานประเภทนี้หรือไม่?
user13706

นี่เป็นวรรณกรรมขนาดใหญ่เกี่ยวกับการวิเคราะห์รูปแบบจุด สถิติการเข้าร่วมการนับนั้นไม่ได้ใช้กันทั่วไปและดังนั้นจึงไม่ค่อยแพร่หลายในวรรณกรรมปัจจุบัน ฉันจะกลับไปทำงานช่วงต้นโดย Diggle หรือ Geits เป้าหมายของคุณคืออะไรในการหาปริมาณการพึ่งพาเชิงพื้นที่ในข้อมูลทวินาม คุณไม่สามารถใช้สัมประสิทธิ์การเข้าร่วมนับในบางสิ่งเช่นเอฟเฟกต์แบบผสมหรือรุ่น CAR / SAR ที่นี่มีพื้นหลังที่น่าสนใจเกี่ยวกับการปรับรูปแบบการเข้าพัก ( en.wikipedia.org/wiki/Scaling_pattern_of_occupancy )
Jeffrey Evans

1
RandomForest เป็นโมเดลที่ไม่ใช้พารามิเตอร์และไม่มีผลกระทบใด ๆ จากการหาค่าอัตโนมัติ ข้อกังวลของรุ่นนี้คือความสัมพันธ์ภายใน bootstrap ensemble บ่อยครั้งที่การสร้างสัมพันธ์อัตโนมัติสามารถสร้าง "ความซ้ำซ้อน" ในข้อมูลของคุณที่สร้างอคติใน Bootstrap ฉันจะดูจากการกระจายตัวของเงื่อนไขของคุณโควาเรีย ฉันมีรหัส R พร้อมใช้งาน "R - ความหนาแน่นของพล็อตน่าจะเป็นตามการจัดกลุ่มปัจจัย" ที่นี่: conserveonline.org/workspaces/emt/documents/all.html
Jeffrey Evans

1
โอ้ฉันจะไม่พูดว่า RF เป็นกล่องดำทั้งหมด อันที่จริงแล้วไม่ใช่ในกรณีนี้ โมเดลนี้มักถูกอ้างอิงเป็น "กล่องสีเทา" เนื่องจากความรู้เบื้องต้นเกี่ยวกับอัตชีวประวัติมีอิทธิพลต่อสมมติฐานของ IID ในวิธีการที่ใช้เป็นประจำมันเป็นการยืนยันที่ค่อนข้างปลอดภัยว่าสมมติฐานที่ไม่ใช่พารามิเตอร์นั้นไม่ได้ถูกละเมิด
Jeffrey Evans

1
เรากำลังสรุปสถิติ "ที่ไม่ใช่พารามิเตอร์" สิ่งนี้ครอบคลุมวิธีการมากมาย หากคุณมองกลับไปที่บทพิสูจน์ของ Brieman ในปี 2001 คุณจะเห็นว่า RF ไม่ถือว่าเป็นอิสระ หนังสือ "องค์ประกอบของการเรียนรู้ทางสถิติ" ของ Hastie มีพื้นฐานทางสถิติที่แข็งแกร่งสำหรับทฤษฎีตัวอย่างที่เกี่ยวข้องกับวิธีการเรียนรู้ของเครื่อง ตามที่ระบุไว้ก่อนหน้านี้ความกังวลคือความสัมพันธ์ในชุดซึ่งอาจเกิดจากการปลอมแปลง / autocorrelation อย่างไรก็ตามนี่ไม่ใช่สมมุติฐานของแบบจำลองใน RF อย่างไรก็ตามหากไม่เพียงพอผลกระทบสุทธิของอคติหรือความไม่เหมาะสมจะเห็นได้ชัดว่าเหมือนกัน
Jeffrey Evans

0

ข้อมูลไบนารีเป็นกรณีการใช้งานปกติสำหรับการเปลี่ยนแปลงเชิงพื้นที่สัมพันธ์ ฉันคิดว่าหนังสือการวิเคราะห์เชิงพื้นที่ส่วนใหญ่จะพูดถึงมัน เอกสารนี้อาจช่วยได้


1
หน้าแรกของการอ้างอิงของคุณเน้นว่า "ที่ตั้งของข้อมูลเป็นภูมิภาค " ดังนั้นดูเหมือนว่ามันไม่ได้ใช้กับข้อมูลจุดเลย
whuber

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.