การวัดความแตกต่างระหว่างการผสานและผนวกเข้ากับ ArcGIS Desktop?


12

บ่อยครั้งที่ฉันพบว่าตัวเองอยู่ในสถานการณ์ที่ฉันไม่สนใจว่าเครื่องมือของฉันจะสร้างคลาสฟีเจอร์ใหม่หรือไม่ แต่ฉันก็ต้องใส่ใจว่าจะต้องใช้เวลานานแค่ไหนในการรวมชุดข้อมูลขนาดใหญ่ทั้งหมดของฉัน ใช้เวลานานกว่าในการสร้างคลาสคุณลักษณะใหม่โดยใช้เครื่องมือผสานแทนที่จะเป็นเครื่องมือต่อท้ายหรือผสานและผนวกเข้าด้วยกันเป็นหลักในแง่ของประสิทธิภาพหรือไม่


2
หลักฐานเล็ก ๆ น้อย ๆ : ฉันพบว่าการผสานจะเร็วขึ้นโดยเฉพาะอย่างยิ่งเมื่อต้องรับมือกับคุณสมบัติจำนวนมาก
Devdatta Tengshe

แต่ผนวกจะทำงานได้ดีที่สุดเมื่อคุณมีโดเมนและประเภทย่อยที่กำหนดไว้ล่วงหน้า
Mapperz

คำตอบ:


6

การผสานจะใช้ทั้งรูปทรงเรขาคณิตและคุณลักษณะและรวม (ผสาน) ชุดข้อมูลทั้งหมดลงในชุดข้อมูลคุณลักษณะใหม่ ป้อนคำอธิบายรูปภาพที่นี่

ผนวกเป็นวิธีที่ดีในการเข้าร่วมข้อมูลพิเศษไปยังชุดข้อมูลที่มีอยู่ - สามารถมีตัวเลือกในการควบคุมชนิดย่อยของคุณสมบัติที่จะผนวกเข้า

http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000055000000

ความแตกต่างที่สำคัญคือ

หากระบุ Schema Type TESTสกีมา (คำจำกัดความของฟิลด์) ของชุดข้อมูลอินพุตจะต้องตรงกับชุดข้อมูลเป้าหมายเพื่อให้สามารถผนวกคุณสมบัติได้ หากระบุ Schema Type NO_TESTไว้ชุดข้อมูลชุดข้อมูล (คำจำกัดความของเขตข้อมูล) ไม่จำเป็นต้องตรงกับชุดข้อมูลเป้าหมาย อย่างไรก็ตามฟิลด์ใด ๆ จากชุดข้อมูลอินพุตที่ไม่ตรงกับฟิลด์ของชุดข้อมูลเป้าหมายจะไม่ถูกแมปกับชุดข้อมูลเป้าหมายเว้นแต่ว่าการแมปนั้นจะถูกตั้งค่าไว้อย่างชัดเจนในตัวควบคุม Field Map

subtype (เป็นทางเลือก) คำอธิบายประเภทย่อยเพื่อกำหนดประเภทย่อยนั้นให้กับข้อมูลใหม่ทั้งหมดที่ผนวกเข้ากับชุดข้อมูลเป้าหมาย

http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000050000000

ป้อนคำอธิบายรูปภาพที่นี่

คุณอาจสนใจใน 'การประมวลผลแบบเรียงชุดข้อมูลขนาดใหญ่'

http://resources.arcgis.com/en/help/main/10.1/index.html#//01m10000000r000000


1
ฉันตระหนักถึงความแตกต่างระหว่างเครื่องมือ แต่ฉันสงสัยว่าความแตกต่างเหล่านี้ทำให้เวลาในการประมวลผลแตกต่างกันหรือไม่ ฉันมักจะใช้ NO_TEST เมื่อใช้เครื่องมือผนวกเนื่องจากฉันตรวจสอบให้แน่ใจว่าคำจำกัดความของเขตข้อมูลของฉันตรงกับก่อนที่จะผนวก / ผสาน
MTerry

5

ใช้คำตอบนี้ตามเครื่องมือด้วยตัวเองไม่ใช่เกณฑ์มาตรฐานจริง:

เครื่องมือผสานสร้างคลาสคุณลักษณะใหม่ซึ่งต้องใช้เวลาในตัวเองก่อนที่จะยัดเยียดชุดข้อมูลสองชุดเข้าด้วยกัน

เครื่องมือต่อท้ายพร้อมตัวเลือกการทดสอบถือว่าชุดข้อมูลทั้งสองมีเขตข้อมูลเดียวกัน (ชื่อเขตข้อมูล) และบีบอัดข้อมูลเหล่านั้นเข้าด้วยกันโดยไม่ต้องสร้างคลาสคุณลักษณะใหม่ (ฟังดูเร็วขึ้น)

เครื่องมือต่อท้ายพร้อมตัวเลือก NO TEST ช่วยให้การแมปฟิลด์รวมเหมือนคลาสคุณลักษณะที่อาจมีชื่อฟิลด์ต่างกัน ต้องใช้การทดสอบตามเงื่อนไขฉากหลังซึ่งจะใช้เวลามากกว่า

เมื่อขนาดของชุดข้อมูลเพิ่มขึ้นจำนวนเวลาที่ใช้ในการสร้าง fc ใหม่นั้นไม่มีนัยสำคัญ วิธีเดียวที่จะรู้แน่ ๆ ก็คือการทำเบนช์มาร์กกับชุดข้อมูลขนาดใหญ่ของคุณและโพสต์คำตอบที่นี่!

ฉันสงสัยว่าความแตกต่างไม่มากนักเกี่ยวกับสิ่งที่คุณต้องการจากเครื่องมือในตอนท้าย (การแมปฟิลด์กับคลาสฟีเจอร์ใหม่เทียบกับคลาสฟีเจอร์ใหม่)


0

ฉันเพิ่งวิ่งทั้งสามสายพันธุ์ ฉันรวมรูปร่างที่เหมือนกันเสมอ 63 แต่ละรูปร่างไฟล์มีประมาณ 63,000 จุดที่สร้างขึ้นจากการดำเนินการ Shapefiles ทั้งหมดมีตารางแอตทริบิวต์เดียวกัน

ตัวแปรที่แตกต่างกันจำเป็นต้องใช้เวลาในการรวบรวม:

  • ผสาน: 13 นาที 57 วินาที
  • ผนวกกับ TEST: 8 นาที 34 วินาที
  • ต่อท้ายด้วย NO_TEST: 9 นาที 12 วินาที

ดูเหมือนว่าผนวกกับ TEST เนื่องจากพารามิเตอร์อินพุตเป็นพารามิเตอร์ที่เร็วที่สุด เห็นได้ชัดว่าตัวเลือกที่ใช้ผนวกจะขึ้นอยู่กับความเร็ว

หวังว่ามันจะมีประโยชน์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.