พิกัด GPS (ละติจูดและลองจิจูด) สามารถใช้เป็นคุณสมบัติในตัวแบบเชิงเส้นได้หรือไม่?


10

ฉันมีชุดข้อมูลที่บรรจุพิกัด GPS (ละติจูดและลองจิจูด) ในบรรดาคุณสมบัติหลายประการ ฉันต้องการใช้ชุดข้อมูลเหล่านี้เพื่อสำรวจปัญหาเช่น: (1) การคำนวณ ETA เพื่อขับเคลื่อนระหว่างจุดเริ่มต้นและจุดสิ้นสุด; และ (2) การประเมินจำนวนอาชญากรรมสำหรับจุดเฉพาะ

ฉันต้องการใช้แบบจำลองการถดถอยเชิงเส้น อย่างไรก็ตามฉันสามารถใช้พิกัด GPS เหล่านี้โดยตรงในโมเดลเชิงเส้นได้หรือไม่

ละติจูดและลองจิจูดไม่ได้มีคุณสมบัติลำดับเช่นกับอายุของบุคคล ตัวอย่างเช่นสองจุด (40.805996, -96.681473) และ (41.226682, -95.986587) ดูเหมือนจะไม่มีคำสั่งที่มีความหมายใด ๆ พวกเขาเป็นเพียงจุดในอวกาศ ฉันคิดของการแทนที่พวกเขาด้วยเด็ดขาดรหัสไปรษณีย์ของสหรัฐอเมริกาแล้วทำเข้ารหัสร้อนแต่ที่จะส่งผลให้จำนวนมากของตัวแปร


1
คุณต้องใช้มันโดยตรงหรือไม่? คุณเคยได้ยินเกี่ยวกับเครื่องมือการแบ่งเขตเช่นอัลกอริทึม AZP ของ S. Openshaw หรือไม่ คุณสามารถกำหนดขอบเขตด้วยตนเองในแผนที่เพื่อแยกภูมิภาค / โซนหากพื้นที่นั้นค่อนข้างสอดคล้องกัน
Mephy

@Mephy: นั่นก็หมายความว่าผมจะแปลง lat / ยาวไปยังโซนใช่มั้ย? แต่ฉันจะมีโซนเด็ดขาดนับร้อยหรือพันโซนเหมือนกับรหัสไปรษณีย์ ฉันต้องเข้ารหัสร้อนแรงทั้งหมด
stackoverflowuser2010

ขึ้นอยู่กับว่าคุณตัดโซนของหลักสูตร หากคุณเลือก "ทิศใต้ของเส้นศูนย์สูตร / ทิศเหนือของเส้นศูนย์สูตร" แสดงว่ามีเพียงสองเส้นเท่านั้น อัลกอริธึมการแบ่งเขตจำนวนมากมีพารามิเตอร์ไฮเปอร์เพื่อกำหนดปริมาณเช่นจำนวนโซนหรือขนาดโซนต่ำสุด
Mephy

ฉันมีปัญหาเดียวกันฉันต้องการทำนายตำแหน่งของผู้คน ฉันได้ geohashed ทุกตำแหน่งทางภูมิศาสตร์ที่มีคุณสมบัติในข้อมูลการฝึกอบรม หลังจากนั้น LabelDecoder ถูกนำมาใช้ในการแปลงคุณลักษณะสถานที่เด็ดขาด ในที่สุดผลลัพธ์ก็แย่มาก มีความคิดที่ดีที่จะจัดการกับการทำนายเชิงพื้นที่หรือไม่?
berisfu

คำตอบ:


5

คุณไม่สามารถใช้งานได้โดยตรงเนื่องจากไม่น่าจะมีความสัมพันธ์แบบเส้นตรงที่แท้จริงเว้นแต่ว่าคุณกำลังมองหาการทำนายว่ามีคนอยู่ทางตะวันออกหรือทางเหนือ ตามที่ระบุไว้ในความคิดเห็นที่คุณจะต้องแปลงให้เป็นโซน หากคุณต้องการที่จะให้มันง่ายจริงๆคุณสามารถใช้ขั้นตอนวิธีการจัดกลุ่ม kNN มีจำนวนต่ำของกลุ่มที่มีศักยภาพและจากนั้นกำหนดเช่นกันคุณลักษณะใหม่ที่มี ID คลัสเตอร์และเข้ารหัสแล้วหนึ่งร้อนที่

นอกจากนี้คุณยังอาจต้องการที่จะอ่านเกี่ยวกับวิธีการที่คนสอดแทรกพิกัดที่จะคาดการณ์ค่าทั่วทั้งแผนที่ ตัวอย่างแรกคือสถานีที่มีอุณหภูมิ แต่คุณสามารถจินตนาการได้ว่ามันเป็น "เขตร้อน" สำหรับอาชญากรรม

( DOCS )


2

คุณสามารถทำอะไรก็ได้ตามใจปรารถนาของคุณ แต่ถ้าแบบจำลองของคุณทำนายอุณหภูมิหรือความแตกต่างของเวลาฉันไม่สามารถหาตัวแปรเป้าหมายอื่น ๆ ที่ขึ้นอยู่กับพิกัดเท่านั้น

สิ่งที่คุณอาจต้องการจะทำคือการใช้แหล่งข้อมูลภายนอกและเสริมสร้างข้อมูลของคุณกับประเทศ / Zip / / ลักษณะทางภูมิศาสตร์ภูมิอากาศรหัสอื่น ๆ ที่จะช่วยให้รูปแบบของคุณดำเนินการ


0

พิกัด GPS สามารถแปลงเป็นgeohashได้โดยตรง Geohash แบ่งโลกออกเป็น "ที่เก็บข้อมูล" ที่มีขนาดแตกต่างกันตามจำนวนหลัก (รหัส Geohash สั้น ๆ สร้างพื้นที่ขนาดใหญ่และรหัสที่ยาวขึ้นสำหรับพื้นที่ขนาดเล็ก)

geohash เป็นหมายเลขเดียวที่สามารถใช้เป็นคุณสมบัติในรูปแบบ

Geohash ใช้เฉพาะกับคนทั้งโลก zipcodes ไม่


เอาท์พุทของ geohasher เป็นสตริงไม่ใช่ตัวเลขเดียวใช่ไหม? และถ้า geohash เป็นสตริงแล้วฉันจะต้องเข้ารหัสหนึ่งร้อนซึ่งจะส่งผลในจำนวนมากของตัวแปรเช่นเดียวกับรหัสไปรษณีย์เข้ารหัสหนึ่งร้อน
stackoverflowuser2010

geohash เป็นตัวเลขเดียวเข้ารหัสในฐาน 32 ไม่มีเหตุผลใดที่จะเข้ารหัส 1-hot เลือกระดับความแม่นยำและใช้ตัวเลขที่เกี่ยวข้อง
Brian Spiering

ฉันเห็นการแทนค่าสตริงของ geohashes เท่านั้น อย่างไรก็ตามถึงแม้ว่า geohash จะแสดงเป็น int ที่ยาวมีความสัมพันธ์เชิงเส้นระหว่างพวกเขาเพื่อใช้ในแบบจำลองเชิงเส้นหรือไม่? ที่ตรงจุดของคำถามเดิมของฉัน
stackoverflowuser2010

ความสัมพันธ์ระหว่าง geohashes มีความซับซ้อนเล็กน้อย - en.wikipedia.org/wiki/Geohash#Design
ไบรอัน Spiering

1
มีวิธีการทางวิศวกรรมหลายวิธีนอกเหนือจากการเข้ารหัสแบบเชิงเส้นและแบบร้อน ตัวอย่างเช่นเคล็ดลับเคอร์เนลหรือการแปลง Helmert
Brian Spiering
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.