ฉันมีชุดข้อมูลหลายชุดตามคำสั่งของคะแนนหลายพัน ค่าในแต่ละชุดข้อมูลคือ X, Y, Z หมายถึงพิกัดในอวกาศ ค่า Z แสดงถึงความแตกต่างในการยกระดับที่คู่พิกัด (x, y)
โดยทั่วไปในฟิลด์ GIS ของฉันข้อผิดพลาดการยกระดับจะถูกอ้างอิงใน RMSE โดยการลบจุดความจริงภาคพื้นดินไปยังจุดวัด (จุดข้อมูล LiDAR) โดยปกติแล้วจะใช้จุดตรวจสอบข้อเท็จจริงขั้นต่ำ 20 จุด การใช้ค่า RMSE นี้ตาม NDEP (แนวทางระดับความสูงของดิจิตอลแห่งชาติ) และแนวทางของ FEMA จะสามารถคำนวณการวัดความแม่นยำได้: ความแม่นยำ = 1.96 * RMSE
ความแม่นยำนี้ถูกระบุว่า: "ความแม่นยำในแนวดิ่งพื้นฐานคือค่าที่ความแม่นยำในแนวดิ่งสามารถประเมินและเปรียบเทียบได้อย่างเท่าเทียมกันในชุดข้อมูลความแม่นยำขั้นพื้นฐานจะคำนวณที่ระดับความเชื่อมั่น 95% ในฐานะฟังก์ชันของแนวตั้ง RMSE"
ฉันเข้าใจว่า 95% ของพื้นที่ภายใต้เส้นโค้งการแจกแจงแบบปกติตั้งอยู่ภายใน 1.96 * std.deviation แต่ไม่เกี่ยวข้องกับ RMSE
โดยทั่วไปฉันถามคำถามนี้: การใช้ RMSE ที่คำนวณจาก 2 ชุดข้อมูลฉันจะเชื่อมโยง RMSE กับความถูกต้องบางประเภทได้อย่างไร (เช่น 95 เปอร์เซ็นต์ของจุดข้อมูลของฉันอยู่ในช่วง +/- X ซม.) นอกจากนี้ฉันจะทราบได้อย่างไรว่าชุดข้อมูลของฉันกระจายตามปกติโดยใช้การทดสอบที่ทำงานได้ดีกับชุดข้อมูลขนาดใหญ่เช่นนั้น "ดีพอ" สำหรับการแจกแจงแบบปกติคืออะไร p <0.05 สำหรับการทดสอบทั้งหมดหรือควรตรงกับรูปร่างของการแจกแจงแบบปกติหรือไม่
ฉันพบข้อมูลที่ดีมากในหัวข้อนี้ในเอกสารต่อไปนี้:
http://paulzandbergen.com/PUBLICATIONS_files/Zandbergen_TGIS_2008.pdf