ประโยชน์ของการสุ่มตัวอย่างรูปหลายเหลี่ยมหกเหลี่ยมคืออะไร


47

ฉันมักจะมองหาวิธีที่มีประโยชน์ในการสุ่มตัวอย่างหรือพื้นที่การศึกษาพาร์ติชัน (มักจะอยู่ในรูปแบบของชุดข้อมูลแรสเตอร์) เป็นหน่วยเล็ก เมื่อเร็ว ๆ นี้ผมได้อ่านบทความในบล็อก ESRI เกี่ยวกับเครื่องมือใหม่สำหรับการสร้างรูปหกเหลี่ยมสุ่มตัวอย่าง แม้ว่ารูปหกเหลี่ยมจะเป็นที่สะดุดตาความคิดแรกของฉันคือมันซับซ้อนกว่าและมีจุดยอดมากกว่าตัวอย่างเช่นตารางตาข่ายแหอวนซึ่งสามารถบรรลุเป้าหมายเดียวกันได้ ประโยชน์ของการทำงานกับกริดหกเหลี่ยมบนกริดสี่เหลี่ยมสำหรับการสุ่มตัวอย่างพื้นที่ศึกษาหรือการแบ่งพาร์สข้อมูลชุดแรสเตอร์คืออะไร?

ป้อนคำอธิบายรูปภาพที่นี่


1
อาจเป็นไปได้ที่น่าสนใจ: ฉันเพิ่งเปิดตัวแพ็คเกจ R เรียกว่าdggridRสำหรับการวิเคราะห์เชิงพื้นที่หกเหลี่ยม
Richard

คำตอบ:


37

แนวคิดด้วยรูปหกเหลี่ยมคือการลดอคติการสุ่มตัวอย่างจากเอฟเฟกต์ขอบของรูปร่างกริดซึ่งสัมพันธ์กับขอบเขตรอบสูง: อัตราส่วนพื้นที่ วงกลมเป็นอัตราส่วนที่ต่ำที่สุด แต่ไม่สามารถสร้างกริดต่อเนื่องและรูปหกเหลี่ยมเป็นรูปร่างที่ใกล้เคียงที่สุดกับวงกลมที่ยังคงสามารถสร้างกริดได้
นอกจากนี้หากคุณกำลังทำงานในพื้นที่ขนาดใหญ่กริดสี่เหลี่ยมจะได้รับความผิดเพี้ยนมากขึ้นเนื่องจากความโค้งกว่ารูปทรงหกเหลี่ยม

มีเครื่องมือและส่วนขยายจำนวนมากสำหรับการสร้างและใช้กริดฐานสิบหกสำหรับการวิเคราะห์เชิงนิเวศวิทยา / ภูมิทัศน์นักวิเคราะห์แพทช์ (Rempel et al., 2003) เป็นตัวอย่างที่ดี เครื่องมือของ Hawth เดิมได้รับการออกแบบใหม่เป็น Geospatial Modeling Environment มีเครื่องมือมากมายที่พัฒนาขึ้นเพื่อเติมช่องว่างในการทำงานของ arcgis รวมถึงกริดที่ทำซ้ำ ส่วนขยายของบุคคลที่สามจำนวนหนึ่งถูกสร้างขึ้นมาเพื่อสิ่งนี้โดยปกติแล้วโดยนักวิจัยที่ต้องการพวกเขาดังนั้นพวกเขาจึงไม่มีทรัพยากรในการสร้างผลิตภัณฑ์ของตัวเองบ่อยครั้งหลังจากมีการเปิดตัว GIS รุ่นใหม่ทุกครั้ง ไม่มีอะไรให้ใช้

บทความนี้ (Birch, 2007)ยังนำเสนอการเปรียบเทียบอย่างละเอียดของกริดสี่เหลี่ยมและหกเหลี่ยมสำหรับการประยุกต์ใช้ในระบบนิเวศแสดงให้เห็นว่ากริดหกเหลี่ยมจะดีกว่าเมื่อปัญหาของการเชื่อมต่อพื้นที่ใกล้เคียงหรือเส้นทางการเคลื่อนไหวที่ใกล้เคียงที่สุด


6
เพื่อให้ชัดถ้อยชัดคำ, กริดฐานสิบหกลดสิ่งประดิษฐ์ขอบ, เพิ่มระดับรายละเอียดของเอฟเฟกต์เพื่อนบ้านและพวกเขาดูดีจริง ๆ :) - โปรดทราบว่า QGIS มีปลั๊กอินที่ยอดเยี่ยม (MMQGIS) ที่ใช้งานได้อย่างยอดเยี่ยม ของแพลตฟอร์ม
Bill Morris

25

ประโยชน์อย่างหนึ่งที่ฉันเห็นเมื่อทำสัตว์ป่าหรือแบบจำลองที่อยู่อาศัยโดยเฉพาะอย่างยิ่งคือรูปหกเหลี่ยมที่อนุญาตรูปแบบในข้อมูล(เช่นขอบของเขตข้อมูลหรือแพทช์อื่น ๆ )ที่จะเห็นได้ง่ายกว่าสี่เหลี่ยมที่จะเสนอ

ลองนึกถึงลูกฟุตบอลเหมือนกัน แต่ไม่ได้เป็นรูปหกเหลี่ยมเสมอไปรูปร่างทรงเรขาคณิตเหล่านั้นเข้ากับพื้นผิวโค้งค่อนข้างดี

ในภาพของคุณลองสร้างรูปหกเหลี่ยมที่เล็กกว่าและมันจะเข้าใกล้รูปร่างจริงของรูปหลายเหลี่ยม จากนั้นลองคำนวณตารางสี่เหลี่ยม / สี่เหลี่ยมจัตุรัสเหนือพื้นที่เดียวกันโดยมีความกว้างหรือความสูงใกล้เคียงกันและคุณจะเห็นความแตกต่าง

วนลูปมากกว่าขนาดช่องเก็บหกเหลี่ยม


3
เมื่อคุณพูดว่า "คุณเห็นความแตกต่าง" ฉันสงสัยว่าคุณอาจจะสามารถหาจำนวนความแตกต่างนั้นค่อนข้างง่ายเช่นกันโดยใช้ Select Layer By Location ของรูปหลายเหลี่ยมเหนือรูปหกเหลี่ยมและรูปหลายเหลี่ยมแหอวนเพื่อเก็บรูปหกเหลี่ยม / สี่เหลี่ยมทั้งรูป บนพื้นที่เพื่อดูว่าแต่ละอันใกล้กับพื้นที่ที่รู้จักของรูปหลายเหลี่ยม
PolyGeo

@SaultDon ฉันชอบรูปของคุณ;)
WhiteboxDev

1
ฉันหวังว่าอนิเมชั่นนี้จะมีเซลล์รูปสี่เหลี่ยมผืนผ้าบางส่วนในมุมมองแยกเพื่อแสดงความแตกต่างถ้าเห็นได้ชัด
ริชาร์ด

17

รูปหกเหลี่ยมเป็นรูปหลายเหลี่ยมปกติที่ซับซ้อนที่สุดที่สามารถเติมระนาบได้ (โดยไม่มีช่องว่างหรือเหลื่อมซ้อนกัน)

ฉันเห็นข้อดีสองประการ:

  • มันอยู่ใกล้กับวงกลมมากกว่าสี่เหลี่ยมจัตุรัสในรูปของรูปร่างดังนั้นคุณจะได้รับอคติน้อยลงจากการปฐมนิเทศ (anisotropy ที่ต่ำกว่าด้วยรูปหกเหลี่ยม) และมีขนาดกะทัดรัดกว่า (ดัชนีรูปร่างที่ต่ำกว่า: ปริมณฑล² / พื้นที่) ดังนั้นจึงให้การสุ่มตัวอย่างที่แม่นยำยิ่งขึ้น

  • "ความยาวของการติดต่อ" จะเหมือนกันในแต่ละด้าน (มีสี่เหลี่ยมเพื่อนบ้านรวมถึงสี่สี่เหลี่ยมที่มุม) แก้ไข: ดังที่ได้กล่าวไว้โดย @Jason ระยะห่างระหว่างเซนทรอยด์ก็เหมือนกันในทั้งหกทิศทาง ในทางตรงกันข้ามระยะทางถึงเพื่อนบ้านที่มุมของเซลล์สี่เหลี่ยมจะถูกคูณด้วยปัจจัย sqrt (2)

นอกจากนี้ยังมีข้อเสียสองประการ:

  • มีหกเพื่อนบ้านที่อยู่ติดกันแทนที่จะเป็นแปดกับสี่เหลี่ยม (ถ้าคุณคิดว่ามุม) สิ่งนี้จะลดความแม่นยำของการวิเคราะห์การเชื่อมต่อ

  • ที่สำคัญที่สุดคุณไม่สามารถแบ่งรูปหกเหลี่ยมเพื่อยกระดับหรือลดขนาดการสุ่มตัวอย่างด้วยรูปหกเหลี่ยมได้ สแควร์จึงดีกว่าสำหรับการวิเคราะห์ลำดับชั้น

ในกรณีของคุณมีข้อเสียเปรียบอื่นเนื่องจากคุณต้องการแบ่งพาร์สเตอร์แรสเตอร์ อันที่จริงเซลล์แรสเตอร์นั้นเป็นแบบสแควร์ ดังนั้นหากคุณพยายามแบ่งแรสเตอร์โดยใช้รูปหกเหลี่ยมคุณจะไม่สามารถหลีกเลี่ยงการรวมพิกเซลบางส่วนได้ คุณจะต้องใช้กลยุทธ์การสุ่มตัวอย่างใหม่ซึ่งจะส่งผลต่อคุณภาพของข้อมูลของคุณ นอกจากนี้แรสเตอร์ที่ถูกตัดใด ๆ ที่ยึดตามรูปหกเหลี่ยมจะส่งผลให้สัดส่วนของพิกเซล NoData


3
"มันอยู่ใกล้กับวงกลมมากกว่าสี่เหลี่ยมจัตุรัส" - และผลลัพธ์ที่สำคัญจุดศูนย์กลางของแต่ละรูปร่างใกล้เคียงมีระยะเท่ากันในขณะที่สี่เหลี่ยมจัตุรัสด้านบน / ล่าง / ขวา / ซ้าย / กึ่งกลางของจุดศูนย์กลางของเพื่อนบ้านคือหน่วย N และ เพื่อนบ้านในแนวทแยงอยู่ห่างจาก sqrt (2) * N units
Jason Scheirer

ทำไมการมีเพื่อนบ้านที่อยู่ติดกันหกแห่งจึงเป็นอุปสรรค หกเพื่อนบ้านช่วยให้การคำนวณน้อยลง นอกจากนี้เพื่อนบ้านทั้งหกนี้ยังมีระยะทางที่เท่ากันกับศูนย์กลางหกเหลี่ยม กริดสแควร์อาจมี 2 คำจำกัดความที่เกี่ยวข้องกับเพื่อนบ้าน 4 เพื่อนบ้านที่ใช้ขอบแบ่งปัน 8 เพื่อนบ้านแบ่งปันขอบและจุดสุดยอด ด้วยกริดสี่เหลี่ยมเพียง 4 เพื่อนบ้านที่แชร์ขอบมีระยะทางเท่ากันกับศูนย์กลางกริดในขณะที่อีก 4 คนที่แชร์จุดสุดยอดมีระยะทางที่แตกต่างกัน (อีกต่อไป) ไปยังศูนย์กริด
SoilSciGuy

@ SoilSciGuy ขอขอบคุณที่เกิดปัญหาการคำนวณ อย่างไรก็ตามมันเป็นเรื่องยากที่จะพูดคุยเกี่ยวกับเรื่องนี้เพราะการสร้างและการค้นหาด้วยตารางหกเหลี่ยมอาจใช้เวลามากกว่าสี่เหลี่ยม เกี่ยวกับเพื่อนบ้าน 6 ต่อ 8 ฉันกล่าวถึงคุณลักษณะ "ระยะทางเดียวกัน" ในข้อดี แต่ในหลาย ๆ กรณีที่มีประเทศเพื่อนบ้านมากขึ้นเป็นข้อดี (เช่นเครือข่าย)
radouxju

ทำไมการมี 6 ประเทศเสียเปรียบ มันเกี่ยวข้องกับความขัดแย้งชายแดนที่คุณมีอยู่ในสี่เหลี่ยม
Luís de Sousa

1
6 น้อยกว่า 8 ดังนั้นการวิเคราะห์การเชื่อมต่อต้นทุนด้วยรูปหกเหลี่ยมจะแม่นยำน้อยกว่า อีกครั้งนี้ขึ้นอยู่กับใบสมัครของคุณถ้าคุณจัดการกับปัจจัย sqrt (2) ของระยะทางแนวทแยงมุม ฯลฯ : สิ่งที่คุณ "ชนะ" ในค่าใช้จ่ายในการคำนวณคือ "หลงทาง" อย่างแม่นยำ ฉันได้ทดสอบกริดหกเหลี่ยมสำหรับการวิเคราะห์ระยะทางราคาและการคาดการณ์ด้วยกำลังสองจะแม่นยำยิ่งขึ้น ประเด็นของฉันคือไม่มีส่วนแบ่งที่ดีที่สุดของเครื่องบิน
radouxju

5

ข้อเสียเปรียบที่สำคัญของสี่เหลี่ยมจัตุรัสคืออัตราตัวอย่างลดลงอย่างมากตามพาหะนำโรคเส้นทแยงมุมไปสู่ด้านสี่ด้าน (จุด Jasons ด้านบน)

หากคุณมีรูปแบบเชิงเส้นปกติกับข้อมูลของคุณการวางแนวของกริดจะส่งผลต่ออัตราตัวอย่างที่มีประสิทธิภาพของแต่ละบริบท

ตัวอย่างเช่นหากคุณมีแนวสันเขาและหุบเขาหลายชุดการจัดแนวตารางตามสิ่งเหล่านี้อาจเป็นเพียงตัวอย่างหุบเขาหรือยอดเขาดังนั้นจึงเป็นชนิดของพืชหรือสัตว์ที่จะพบ มุมอื่น ๆ ที่สัมพันธ์กับหุบเขาจะให้อัตราตัวอย่างเคลื่อนที่ระหว่างสูงกับต่ำในภูมิภาค ตัวอย่างที่ดีของเวกเตอร์ที่มีปัญหาเช่นนี้ในน้ำอาจเป็นช่วงน้ำขึ้นน้ำลงความลึกของทะเลและแนวสันเขาใต้ทะเล

เห็นได้ชัดว่าผลกระทบสามารถบรรเทาหรือเลวร้ายลงโดยการเลือกความละเอียดการสุ่มตัวอย่าง แต่อุดมคติอัตราตัวอย่างต่ออัตราส่วนความแปรปรวนควรมีเสถียรภาพมากกว่าพื้นที่ Hexagons ซึ่งอยู่ใกล้กับวงกลมนั้นมีโอกาสน้อยที่จะทำให้อคติอัตราตัวอย่างแปรผันโดยไม่ได้ตั้งใจ


1

ในฐานะนักวิจัยการเปลี่ยนแปลงสภาพภูมิอากาศการใช้ระบบกริดรูปหกเหลี่ยมที่ใหญ่ที่สุดของฉันคือประโยชน์หลักสองประการ:

  1. มันแสดงถึงการเชื่อมต่อในลักษณะที่เหมือนกันซึ่งเป็นสิ่งสำคัญมากสำหรับการสร้างแบบจำลองวิทยาศาสตร์โลก ตัวอย่างเช่นโมเดลปัจจุบันของมหาสมุทรมักใช้ตารางหกเหลี่ยมเพื่อแก้สมการ ODE / PDE ที่ซับซ้อน
  2. มันสามารถครอบคลุมทรงกลมอย่างสม่ำเสมอ ระบบกริดตามละติจูด / ลองจิจูดแบบดั้งเดิมจะทำให้เกิดการบิดเบือนเชิงพื้นที่อย่างมีนัยสำคัญในตำแหน่งที่แตกต่างกัน การใช้ DGGS สามารถแก้ปัญหานี้ได้อย่างสมบูรณ์แบบ

ขอขอบคุณ.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.