กำลังสร้างบริการทางเว็บ geocoding / gazetteer?


14

ฉันต้องการเขียนบริการเว็บ geocoding สำหรับลำดับวงศ์ตระกูลใน Java เนื่องจากเป็นลำดับวงศ์ตระกูลฉันไม่จำเป็นต้องลงไปที่ถนน ฉันแค่ต้องลงไปที่เคาน์ตี

ดูข้อมูลลำดับวงศ์ตระกูลชื่อที่สะกดผิดนั้นเป็นเรื่องธรรมดามาก ผู้คนยังใช้ตัวย่อที่ไม่ได้มาตรฐานจำนวนมาก ตัวอย่างเช่นเมืองบัลติมอร์อาจมีลักษณะดังนี้:

  1. บัลติมอร์
  2. บัลติมอร์
  3. บัลติมอร์ จำกัด
  4. บัลติมอร์ Cty

คำตอบ:


10

ฉันไม่คิดว่าคำถามนี้ทางภูมิศาสตร์อย่างชัดเจนเพราะคุณสนใจเฉพาะในชื่อดังนั้นคุณอาจต้องการที่จะถามมันในกองมากเกิน คุณสามารถตอบคำถามของคุณด้วยข้อมูลสองส่วน: รัฐและชื่อเขตที่แก้ไข หากต้องการทำการแก้ไขคุณอาจต้องการใช้ระยะทาง Levenshtein ( ตัวอย่าง & การนำ Java ไปใช้ ) เพื่อจับคู่ข้อมูลฟัซซี่กับค่าที่ถูกต้อง


+1 นั่นอาจเป็นจริง Levenshtein ดูเหมือนเป็นจุดเริ่มต้นที่ดีและดูเหมือนว่า Postgres จะสนับสนุน ขอบคุณ
Jay Askren

ฉันคิดว่าการรวมระยะทาง Levenshtein กับข้อมูลจาก Geonames ( geonames.org ) อาจใช้งานได้สำหรับฉัน ขอบคุณ
Jay Askren

5

บริการการเข้ารหัสทางภูมิศาสตร์ต้องการข้อมูลรูปทรงเรขาคณิตภูมิศาสตร์ตัวเชื่อมโยง (เพื่อจัดการการตั้งชื่อและตัวเลือกชื่อ) และส่วนติดต่อผู้ใช้ (เพื่อเป็นสื่อกลางในการค้นหา) สำหรับ geocoder แบบย้อนกลับคุณจะต้องเพิ่มตัวตรวจสอบความถูกต้องของโทโพโลยี สำหรับ Java แล้ว JTS Topology Suite แบบโอเพ่นซอร์สจะเป็นตัวเลือกที่เป็นธรรมชาติ: http://www.vividsolutions.com/jts/jtshome.htm

สามารถดูรูปทรงเรขาคณิตของมณฑลของสหรัฐอเมริกาได้ที่ Census: http://www.census.gov/geo/www/cob/co2000.html

ในการเริ่มต้นใช้งาน gazetteer นั้น US Board on Geographic Names มีฐานข้อมูล: http://geonames.usgs.gov/

การสร้างฐานข้อมูล gazetteer และอัลกอริธึมการทอที่ทนต่อการค้นหาโดยประมาณนั้นเป็นส่วนที่ยาก


อัลกอริทึมเป็นสิ่งที่ฉันกำลังมองหา
Jay Askren

สอบถามเกี่ยวกับอัลกอริทึมความคล้ายคลึงกันทางความหมายอาจมีผู้ตอบแบบสอบถามเพิ่มเติมในเว็บไซต์สแต็คโอเวอร์โฟลว์หลัก
ล็นนอน


1

Google มีAPI ที่ดีสำหรับการเข้ารหัสภูมิศาสตร์หากคุณสามารถปฏิบัติตามข้อกำหนดในการให้บริการ สาธิตพื้นฐานที่สามารถพบได้ที่นี่

การใช้บริการของพวกเขาขึ้นอยู่กับข้อ จำกัด บางอย่าง แต่ผลลัพธ์ที่ได้คือใช้งานง่ายรวดเร็วถูกต้องและคุ้นเคยกับผู้ใช้ส่วนใหญ่ มันจะช่วยให้คุณมุ่งเน้นการพัฒนาลำดับวงศ์ตระกูลของบริการของคุณ


ฉันต้องการโฮสต์ทุกอย่างในบ้านและไม่ได้พึ่ง api ภายนอก
Jay Askren

ดังนั้นคุณกำลังมองหาฐานข้อมูล Geocoding ที่ได้รับอนุญาตแบบโอเพนซอร์สหรือไม่?
Adam Matan
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.