สามารถใช้ฐานข้อมูลNoSQLอย่างMongoDBในการวิเคราะห์ข้อมูลได้อย่างไร คุณสมบัติอะไรบ้างที่สามารถทำการวิเคราะห์ข้อมูลได้เร็วขึ้นและมีประสิทธิภาพ
สามารถใช้ฐานข้อมูลNoSQLอย่างMongoDBในการวิเคราะห์ข้อมูลได้อย่างไร คุณสมบัติอะไรบ้างที่สามารถทำการวิเคราะห์ข้อมูลได้เร็วขึ้นและมีประสิทธิภาพ
คำตอบ:
เพื่อความซื่อสัตย์อย่างสมบูรณ์ฐานข้อมูล NoSQL ส่วนใหญ่ไม่เหมาะกับการใช้งานในข้อมูลขนาดใหญ่ สำหรับส่วนใหญ่ของทุกการใช้งานข้อมูลขนาดใหญ่, การปฏิบัติงานของMongoDBเมื่อเทียบกับฐานข้อมูลเชิงสัมพันธ์เช่นMySQLเป็นอย่างมีนัยสำคัญเพียงพอที่ยากจนใบสำคัญแสดงสิทธิอยู่ห่างจากสิ่งที่ชอบ MongoDB ทั้งหมด
จากที่กล่าวมามีคุณสมบัติที่มีประโยชน์สองสามอย่างของฐานข้อมูล NoSQL ที่คุณโปรดปรานเมื่อคุณทำงานกับชุดข้อมูลขนาดใหญ่ แต่โอกาสของผลประโยชน์เหล่านั้นมีมากกว่าประสิทธิภาพที่ไม่ดีของ NoSQL โดยทั่วไปเมื่อเปรียบเทียบกับSQLสำหรับการอ่าน - การดำเนินการอย่างเข้มข้น (ส่วนใหญ่คล้ายกับกรณีการใช้ข้อมูลขนาดใหญ่ทั่วไป) อยู่ในระดับต่ำ
โดยส่วนตัวแล้วฉันอาจแนะนำให้คุณตรวจสอบฐานข้อมูลกราฟเช่นNeo4jที่แสดงประสิทธิภาพที่ดีมากสำหรับการสืบค้นบางประเภทหากคุณกำลังมองหาแบ็กเอนด์สำหรับแอปพลิเคชั่นวิทยาศาสตร์ข้อมูลของคุณ
json
เป็นข้อมูลที่มีโครงสร้างทั้งหมด ในทางเทคนิคคุณสามารถทำการวิเคราะห์ข้อมูลประเภทใดก็ได้โดยใช้ฐานข้อมูล NOSQL นั้นไม่เกี่ยวข้องกัน มีเครื่องมือสร้างมาจากด้านบนของ mongo เช่น analytica
One benefit of the schema-free NoSQL approach is that you don't commit prematurely and you can apply the right schema at query time using an appropriate tool like Apache Drill. See this presentation for details. MySQL wouldn't be my first choice in a big data setting.
ลองใช้และอาจใช้หลายฐานข้อมูล นี่ไม่ใช่แค่ปัญหา "ประสิทธิภาพ" ที่เล่นที่นี่ มันจะลงมาตามความต้องการของคุณจริงๆ คุณพูดคุยเกี่ยวกับข้อมูลเท่าไหร่? ข้อมูลประเภทใด คุณต้องการมันเร็วแค่ไหน? คุณอ่านหนักหรือเขียนมากขึ้นหรือไม่
นี่คือสิ่งหนึ่งที่คุณไม่สามารถทำได้ในฐานข้อมูล SQL: คำนวณความเชื่อมั่น http://www.slideshare.net/shift8/mongodb-machine-learning
แน่นอนว่าความเร็วในกรณีนั้นอาจไม่เร็วพอสำหรับความต้องการของคุณ แต่เป็นสิ่งที่เป็นไปได้ ด้วยการแคชค่ารวมเฉพาะบางอย่างก็ค่อนข้างยอมรับได้ ทำไมคุณถึงทำเช่นนี้? ความสะดวกสบาย
ความสะดวกสบายเป็นสิ่งที่คุณจะได้รับการโน้มน้าวใจ นั่นเป็นเหตุผลที่ (ในความคิดของฉัน) ฐานข้อมูล NoSQL ถูกสร้างขึ้น ประสิทธิภาพเกินไปแน่นอน แต่ฉันพยายามลดมาตรฐานและเน้นประเด็นอื่น ๆ
ฐานข้อมูล MongoDB (และ NoSQL อื่น ๆ ) มีคุณสมบัติที่ทรงพลังมากเช่นแผนที่ในตัว / ลดลง ซึ่งอาจส่งผลให้ประหยัดทั้งต้นทุนและเวลาในการใช้บางอย่างเช่น Hadoop หรืออาจให้ต้นแบบหรือ MVP เพื่อเปิดธุรกิจขนาดใหญ่
แล้วฐานข้อมูลกราฟล่ะ? พวกมันคือ "NoSQL" ด้วย ดูฐานข้อมูลเช่น OrientDB ถ้าคุณต้องการโต้แย้งประสิทธิภาพ ... ฉันไม่คิดว่าคุณจะแสดงฐานข้อมูล SQL ที่เร็วกว่า =) ... และฐานข้อมูลกราฟมีแอปพลิเคชั่นที่น่าทึ่งจริง ๆ ตามที่คุณต้องทำ
กฎของเทคโนโลยี (และอินเทอร์เน็ต) ไม่สะดวกสบายเกินไปกับสิ่งหนึ่ง คุณจะถูก จำกัด และตั้งค่าตัวเองสำหรับความล้มเหลว