การจัดการข้อมูลที่เกี่ยวข้องกับ GIS [ปิด]


22

ฉันมักจะทำงานเกี่ยวกับการทำแผนที่ข้อมูลระดับผู้ป่วยที่สำคัญ ในขณะที่ฉันรู้สึกว่าฉันมีความเข้าใจที่ดีของปัญหาการกำกับดูแลหลายรอบนี้ (เช่นเมื่อใช้เทคนิค binning และk-anonymity ) แต่ฉันต้องการปรับปรุงความรู้ของฉันเกี่ยวกับเรื่องนี้

นี่เป็นตัวอย่างที่ดีว่าเหตุใดจึงมีความสำคัญ: การรักษาความลับเชิงพื้นที่และ GIS: การสร้างตำแหน่งการตายใหม่จากแผนที่ที่เผยแพร่เกี่ยวกับ Hurricane Katrina

ใครบ้างมีกฎง่ายๆที่พวกเขาใช้เมื่อทำแผนที่ข้อมูลที่สำคัญ?

มีแหล่งข้อมูลที่ดีอยู่บ้างหรือไม่ซึ่งครอบคลุมวิธีการที่แตกต่างกันในการปกป้องความลับหรือให้คำแนะนำเกี่ยวกับเรื่องนี้?


2
+1 (โดยบังเอิญวิธีการลบข้อมูลที่ไม่ระบุชื่อหนึ่งวิธีที่แนะนำในเธรดก่อนหน้าจะปรากฏที่gis.stackexchange.com/questions/31236/ … ) คุณสามารถอธิบายสิ่งที่คุณหมายถึงโดย "กฎของหัวแม่มือ" หรือไม่ คุณกำลังมองหาวิธีการแก้ปัญหาทางเทคนิคเพื่อซ่อนรายละเอียดข้อมูลหรือคุณกำลังมองหาคำแนะนำเกี่ยวกับเวลาและจำนวนข้อมูลที่ควรได้รับการปกป้อง?
whuber

1
การแก้ปัญหาด้านเทคนิคเบื้องต้นแม้ว่าคำแนะนำในระดับการป้องกันก็มีประโยชน์เช่นกัน ฉันเห็นสิ่งเหล่านี้ว่ากำลังไปด้วยกัน ตัวอย่างเช่นข้อมูลที่ละเอียดอ่อนมากซึ่งประกอบด้วยตัวเลขขนาดเล็กจำนวนมากควรแสดงโดยใช้เทคนิค X หรือเทคนิค Y หากมีข้อมูลประชากรรวมอยู่ด้วย ฉันกำลังพิจารณาใช้ hex-binning สำหรับงาน แต่ทันใดนั้นแม้ว่าฉันจะไม่ทราบว่าประชากรในแต่ละรูปหกเหลี่ยม ถ้าฉันแสดงค่า 20 แล้วพบว่ามีเพียง 20 ผู้อยู่อาศัยในรูปหกเหลี่ยมนั้น เมื่อเร็ว ๆ นี้ฉันเคยได้ยินเกี่ยวกับปัญหาหน่วยแก้ไขปัญหาอากาศที่เกี่ยวข้องกับเรื่องนี้
Tumbledown

ฉันลงคะแนนให้ปิดสิ่งนี้ให้กว้างเกินไปเพราะกำลังค้นหาทั้งรายการ "กฎง่ายๆ" และรายการทรัพยากร
PolyGeo

คำตอบ:


8

การอภิปรายนี้เป็นสิ่งจำเป็นอย่างมากในอาชีพ GIS และฉันได้กล่าวโทษอย่างมากต่อการศึกษาระดับอุดมศึกษาในการละเลยหัวข้อนี้

ที่กล่าวว่านี่คือบางส่วนที่น่าสนใจถ้าไม่ล้าสมัยวรรณกรรมในหัวข้อ ฉันทามติที่แท้จริงเพียงอย่างเดียวระหว่างแหล่งข้อมูลเหล่านี้คือไม่มีความเห็นพ้องกันในวิชาชีพ GIS เกี่ยวกับความเป็นส่วนตัว แต่ควรเป็นข้อกังวลหลัก

จริยธรรมของ GIS | Jeremy Crampton

การปกป้องความเป็นส่วนตัวในการใช้ระบบสารสนเทศทางภูมิศาสตร์ Harlan J. Onsrud, Jeff P. Johnson และ Xavier Lopez | LINK UPDATED 1/11/17

ความเป็นส่วนตัวและความลับใน Health GIS | LINK UPDATED 1/11/17


1
โหวตสิ่งนี้ขึ้นเพื่อเป็นการตอกย้ำความยากลำบากที่มีอยู่ในพื้นที่นี้ แตงกวาดองจริงๆ (และโดยเจตนา) เปิดหนอนตัวโตขนาดมหึมาด้วยการสังเกตของเขาว่ามันใกล้จะเป็นไปไม่ได้ที่จะกล่าวถึงการกระทำที่เป็นไปได้ของการไม่เปิดเผย มีปัญหาที่ยุ่งยากของความรู้เชิงบริบทที่มีอิทธิพลต่อการเรียกร้องการเปิดเผยเช่นเดียวกับความรู้ที่ประยุกต์ใช้จากภายนอกทรัพยากรดั้งเดิมที่สามารถใช้เพื่อระบุตัวบุคคล ข้อมูลที่ครอบคลุมหรือการชดเชยจุดเชิงพื้นที่ไม่สามารถลบล้างปัญหาที่อาจเกิดขึ้นได้ ดังนั้นคุณเหลือไว้ค่อนข้างมากด้วยท่าทางเชิงจริยธรรมของคุณเอง!
Andrew Tice

ขั้นตอนการไม่เปิดเผยตัวแบบมาตรฐานมีแนวโน้มที่จะตั้งสมมติฐานเกี่ยวกับประชากรที่กระจายตัวตามปกติเมื่อการวิเคราะห์เชิงพื้นที่ส่วนใหญ่มีแนวโน้มที่จะห่างไกลจากการกระจายตามปกติ การสร้าง Raster เป็นวิธีการเล็กน้อยในการทำให้ความแม่นยำของผลลัพธ์ที่เบลอดังนั้นจึงสามารถนำมาพิจารณาสำหรับการนำเสนอทั่วไป คำถามเดิมกล่าวถึง MAUP และแน่นอนว่าการใช้รูปแบบบางรูปแบบของการหลอกลวงที่ระดับเชิงพื้นที่ที่แตกต่างกันสามารถช่วยได้
Andrew Tice

1
@AndrewTice ฉันจะถามว่าหลอกลวงคืออะไร? ความสามารถในการลดความจำของฉันได้ทิ้งฉันไปวันนี้!
Tumbledown

1
@ Tumbledown - ขออภัย! มันย่อมาจากวิธีการปรับเซลล์ขนาดเล็ก ถ้าคุณ Google ว่าเต็มคุณจะพบวรรณกรรมจาก ONS ในสหราชอาณาจักร เป็นหนึ่งในวิธีการที่ได้รับการทดสอบและทดสอบแล้วสำหรับการรายงานผลสำรวจสำมะโนประชากรในระดับต่ำ มันเป็นสัตว์เดรัจฉาน แต่เนื่องจาก ONS ใช้อย่างกว้างขวางจึงมีเหตุผลเล็กน้อยสำหรับการใช้วิธีนี้
Andrew Tice

1
อ๊ะ! คนเกียจคร้านเสมอเมื่ออ้างถึงเนื้อหาที่เก่ากว่า ฉันจะพยายามหาลิงค์ที่ใช้งานได้และแก้ไขโพสต์ของฉันอย่างเหมาะสม ขอบคุณ!
Sean Adkins

4

นี่คือกฎที่กำหนดโดย Eurostat เมื่อขอให้รายงานตำแหน่งของการถือครอง มีการรายงานตำแหน่งที่มีพิกัดกลมและในบางกรณีโดยใช้การชดเชยกึ่งสุ่มเพิ่มเติม ฉันไม่รู้ว่าพวกเขาให้กฎง่ายๆ แต่อย่างน้อยกฎเหล่านี้ถูกใช้โดยผู้มีอำนาจในยุโรปที่รู้จักกันดี

เกี่ยวกับสถานที่ตั้งของการถือครองสองหลักการถูกนำไปใช้: (i) พิกัดที่แม่นยำไม่จำเป็นต้องใช้; และ (ii) สถานที่ที่มีเพียงผู้ถือครองเพียงคนเดียวจะถูกบันทึกใหม่

(i) ไม่จำเป็นต้องใช้พิกัดที่แม่นยำ: ไม่จำเป็นต้องใช้พิกัดลองจิจูดและละติจูดในรูปแบบของวินาทีหรือเศษส่วนทศนิยมของนาที มันจะต้องให้สถานที่เท่านั้นที่ใกล้ที่สุด 5 นาทีซึ่งเป็นพื้นที่ประมาณ 3,000-7,000 ฮ่าขึ้นอยู่กับสถานที่ในยุโรป

ii) ตำแหน่งที่มีการถือครองเพียงครั้งเดียวจะถูกคำนวณใหม่: เป็นไปได้ว่าในพื้นที่ที่มีการถือครองจำนวนมากมากตำแหน่งที่ระบุไปยังลองจิจูด 5 นาทีที่ใกล้ที่สุดและละติจูดอาจมีเพียงการถือครองเดียวเท่านั้น เพื่อให้แน่ใจว่าไม่สามารถระบุตัวตนได้โดยตรงพื้นที่ที่มีการถือครองเพียงแห่งเดียวควรได้รับการจัดสรรไปยังจุดที่ใกล้เคียงที่สุด (เลือกโดยการสุ่ม) อย่างน้อยหนึ่งการถือครองอื่น หากสถานที่ใกล้เคียงทั้ง 8 แห่งไม่มีการถือครองอย่างน้อยหนึ่งแห่งจะต้องขยายสถานที่ใกล้เคียงจนกว่าจะมีสถานที่อื่นอยู่อย่างน้อยหนึ่งแห่ง อย่างไรก็ตามเมื่อใดก็ตามที่เป็นไปได้ควรมีการจัดสรรการถือครองทางการเกษตรในภูมิภาค NUTS 3 ที่ตั้งอยู่


3

นี่เป็นสนามที่น่าสนใจมาก

ข้อเสนอแนะแรกของฉันคือบทความเหล่านี้: http://dk-giscience.zgis.net/index.php/37-website/255-kounadi-ourania จากนักวิจัยที่มีปริญญาเอกในหัวข้อนั้น

และสิ่งนี้เกี่ยวกับการปิดบังข้อมูลทางภูมิศาสตร์ที่ละเอียดอ่อน: http://www.cartographicperspectives.org/index.php/journal/article/view/cp49-leitner-curtis

นอกจากนี้เกี่ยวกับข้อมูลด้านสุขภาพ: http://www.ij-healthgeographics.com/content/8/1/46


1

ฉันคิดว่าฉันได้ใส่เว็บไซต์ที่มีประโยชน์นี้เป็นลิงค์เพิ่มเติม: เครือข่าย Anonymisation ของสหราชอาณาจักร

ไม่ใช่เฉพาะ GIS และมีเป้าหมายที่สหราชอาณาจักร แต่ให้ข้อมูลและทรัพยากรที่มีประโยชน์เกี่ยวกับการบรรเทาความเสี่ยงของการเปิดเผย

พวกเขายังดำเนินการประชุมเชิงปฏิบัติการและคลินิกแบบไม่เปิดเผยชื่อฟรี


ลิงก์อื่นที่มีประโยชน์ซึ่งเป็นกรอบการตัดสินใจจาก UKAN: ukanon.net/ukan-resources/ukan-decision-making-framework
Tumbledown
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.