การสร้างภาพเพื่ออนุมานเวิร์กโฟลว์

ฉันให้การสนับสนุนทางสถิติสำหรับแผนกสาธารณสุข อย่างที่คุณอาจจินตนาการเรารวบรวมแผนที่เป็นจำนวนมากเป็นประจำ สำหรับผม, แผนที่เป็นเพียงชนิดของการแสดงข้อมูลอีก - มีประโยชน์ในการรับความรู้สึกสำหรับข้อมูลสำหรับการสร้างและการตรวจสอบสมมติฐาน ฯลฯ แต่เรามักจะไม่ปฏิบัติตามผ่านการสร้างแบบจำลองที่เกิดขึ้นจริงและสมมติฐานการทดสอบ

คุณ / องค์กรของคุณทำสิ่งนี้อย่างไร? เวิร์กโฟลว์ที่มีการอนุมานมีลักษณะอย่างไร ใครเกี่ยวข้องบ้าง คุณใช้เครื่องมืออะไร มันจะมีอะไรนึกคิดลักษณะเช่นถ้าคุณมีวิธีการของคุณ?

ขอบคุณ!

แก้ไข

เพื่อความชัดเจนฉันสงสัยเกี่ยวกับกลยุทธ์ที่แตกต่างกันในการเริ่มจากข้อมูลเชิงพื้นที่ไปจนถึงการทดสอบทางสถิติอย่างเป็นทางการของสมมติฐานเกี่ยวกับสิ่งที่เกิดขึ้นในโลก ตัวอย่างเช่นสมมติว่าฉันพยายามกำหนดเป้าหมายแคมเปญการศึกษาเพื่อเพิ่มการทดสอบวัณโรค ฉัน (ส่วนตัว) จะทำแผนที่กรณีของวัณโรคเทียบกับ covariates ที่น่าสนใจ (พูด, รายได้เฉลี่ยหรือร้อยละที่อาศัยอยู่ต่างประเทศเกิด) และพยายามที่จะดูว่ามีรูปแบบใด ๆ

ฉันอาจจะหรืออาจไม่พบใด ๆ ; แต่ในที่สุดฉันก็จะสร้างแบบจำลองเพื่อประเมินความสัมพันธ์ระหว่างโควาเรียตกับจำนวนประชากร นี่เป็นขั้นตอนที่สำคัญเพราะมนุษย์ดีแค่ไหนในการหารูปแบบที่ไม่มีอยู่หรือค้นหาสิ่งที่ไม่น่าสนใจ ฉันรู้วิธีที่จะทำด้วยตัวเอง แต่ฉันอยากรู้เกี่ยวกับความแตกต่างขององค์กรในเชิงสถาบัน (ถ้าทั้งหมด)

spatial-statistics workflow

— แมตต์พาร์กเกอร์
แหล่งที่มา

เป็นคำถามที่ดีมาก!

— whuber

คุณกำลังบอกว่าคุณจำเป็นต้องมีขั้นตอนการทำงานเพื่อที่ว่าหากมีการระบาดของโรคบางอย่างที่มีวัคซีนจำนวน จำกัด คุณจะต้องแสดงให้เห็นว่าคุณกระจายวัคซีนอย่างเหมาะสมหรือไม่?

— Kirk Kuykendall

ในวงกว้างฉันแค่สนใจว่าผู้คนรวมการอนุมานทางสถิติเข้ากับกระบวนการทำแผนที่ของพวกเขาอย่างไร สิ่งที่คุณอธิบายเป็นหนึ่งในสถานการณ์ที่เป็นไปได้ แต่มีคนอื่นอีกมากมายและฉันไม่สนใจแม้แต่คำตอบจากระบาดวิทยา

— Matt Parker

คำถามที่น่าสนใจมาก!

ประการแรกคำถามของคุณหมายถึงสิ่งที่ฉันเรียกว่า 'data mining' และฉันคิดว่ามันคุ้มค่าที่จะแก้ไขปัญหาอย่างชัดเจนเนื่องจากบางคนที่นี่อาจไม่ได้รับ: ด้วยชุดข้อมูลใด ๆ (ไม่จำเป็นต้องเป็นเชิงพื้นที่) เพื่อให้ได้สถิติที่ถูกต้อง ความสัมพันธ์แบบแผนคือว่าจะต้องมีความน่าจะเป็นที่หรือสูงกว่า 95% อย่างไรก็ตามหากคุณทำการทดสอบ 20 ครั้งโอกาสจะสูงซึ่งอย่างน้อยหนึ่งในผลลัพธ์ 'ที่ถูกต้องทางสถิติ' ที่คุณได้รับนั้นเป็นเพราะโอกาสที่บริสุทธิ์ ดังนั้นการปฏิบัติที่ไม่ถูกต้องในการเล่นกับชุดข้อมูล (ใน GIS จะเป็นการแมปออก) เพื่อให้เห็นภาพความสัมพันธ์ที่เป็นไปได้ระหว่างตัวแปรค้นหาสิ่งที่น่าสนใจและเสียบสถิติและพูดผลราวกับว่านี่เป็นการทดสอบเดียวที่คุณ ได้ทำ คุณยังสามารถใช้ผลลัพธ์ได้ แต่คุณต้องคำนึงถึงจำนวนการทดสอบที่คุณทำ

นั่นคือสิ่งที่คุณกำลังขับรถที่?

คำถามของคุณดูเหมือนจะถามว่าผู้คนหลีกเลี่ยงปัญหานี้ได้อย่างไร คำตอบของฉันคือตัวเลือก 'ไม่เลย' ที่คุณพูดถึงเป็นเรื่องธรรมดา นักสถิติการแพทย์ (เช่นแฟนของฉัน) ในประสบการณ์ของฉันใช้มาตรฐานความเข้มงวดสูงกว่ากระบวนการประเภทนี้มากกว่าที่พบในพื้นที่อื่นฉันสงสัยว่าการทำแผนที่ข้อมูลทุกประเภทนอกสุขภาพของประชาชนจะทำโดยไม่มีการพิจารณาอย่างเป็นทางการใด ๆ ปัญหาเกี่ยวกับสูตรสถิติที่ใช้แบบสุ่มสี่สุ่มห้าโดยไม่เข้าใจกระบวนการอย่างถูกต้อง ตัวอย่างทางธรณีวิทยาอยู่ในใจ:

ฉันอ่านบทความที่ผ่านการตรวจสอบโดยผู้เขียนว่าผู้เขียนมองว่าผลผลิตของหลุมเจาะ (ปริมาณน้ำที่สูบได้) เกี่ยวข้องกับอิทธิพลทางธรณีวิทยาและเชิงพื้นที่ในแอฟริกาเช่นความหนาของชั้นหินกรวดที่ถูกขุดขึ้นมาก่อนก้อนหินถูกกระแทก แนวคิดก็คือช่วยผู้เจาะหลุมเจาะเพื่อให้พวกเขาสามารถกำหนดเป้าหมายสถานที่ที่ดีที่สุดสำหรับหลุมเจาะ ผู้เขียนขุดข้อมูลอย่างโจ๋งครึ่มรวมตัวแปรทุกประเภทเพื่อดูว่าอันไหนมาพร้อมกับระดับความมั่นใจ 95% และ (ฉันถือว่า) ไม่มีผู้ตรวจสอบคนใดที่ตั้งคำถามถึงความถูกต้องของผลลัพธ์ ข้อสรุปของพวกเขาจึงไม่น่าเชื่อถืออย่างสมบูรณ์

หวังว่าจะเป็นที่สนใจ

— Trevesy
แหล่งที่มา

คุณช่วยอธิบายอีกเล็กน้อยได้ไหมว่าทำไมกระดาษที่คุณอธิบายไม่น่าเชื่อถือ? มันไม่ชัดเจนสำหรับฉันว่าทำไมในกรณีนี้ หากความสัมพันธ์มีอยู่ในเชิงสถิติมันสำคัญกับ 'รูปแบบจิต' ที่คุณเคยประสบความสำเร็จในการระบุตัวตนหรือไม่? ฉันเข้าใจว่ามันไม่ได้อธิบายกลไก แต่เป็นปัญหาแยกต่างหาก

— djq