อะไรคือความแตกต่างระหว่างฐานข้อมูลและคลังข้อมูล?


163

อะไรคือความแตกต่างระหว่างฐานข้อมูลและคลังข้อมูล?

พวกเขาไม่ได้เป็นสิ่งเดียวกันหรืออย่างน้อยก็เขียนในสิ่งเดียวกัน (เช่น Oracle RDBMS)?

คำตอบ:


147

ลองดูสิ่งนี้สำหรับข้อมูลเพิ่มเติม

จากลิงค์ก่อนหน้า:

ฐานข้อมูล

  1. ใช้สำหรับการประมวลผลธุรกรรมออนไลน์ ( OLTP ) แต่สามารถใช้เพื่อวัตถุประสงค์อื่นเช่นคลังข้อมูล บันทึกข้อมูลจากผู้ใช้สำหรับประวัติ
  2. ตารางและตัวเชื่อมมีความซับซ้อนเนื่องจากถูกทำให้เป็นมาตรฐาน (สำหรับRDMS ) เพื่อลดข้อมูลซ้ำซ้อนและประหยัดพื้นที่จัดเก็บ
  3. เอนทิตี - เทคนิคการสร้างแบบจำลองเชิงสัมพันธ์ใช้สำหรับการออกแบบฐานข้อมูล RDMS
  4. ปรับให้เหมาะสมสำหรับการดำเนินการเขียน
  5. ประสิทธิภาพต่ำสำหรับคิวรีการวิเคราะห์

คลังข้อมูล

  1. ใช้สำหรับการประมวลผลการวิเคราะห์ออนไลน์ ( OLAP ) สิ่งนี้จะอ่านข้อมูลประวัติสำหรับผู้ใช้เพื่อการตัดสินใจทางธุรกิจ
  2. ตารางและตัวเชื่อมนั้นเรียบง่ายเนื่องจากไม่มีการทำให้เป็นมาตรฐาน สิ่งนี้ทำเพื่อลดเวลาตอบสนองสำหรับคำสั่งการวิเคราะห์
  3. ข้อมูล - ใช้เทคนิคการสร้างแบบจำลองสำหรับการออกแบบคลังข้อมูล
  4. ปรับให้เหมาะสมสำหรับการดำเนินการอ่าน
  5. ประสิทธิภาพสูงสำหรับการสืบค้นเชิงวิเคราะห์
  6. คือมักฐานข้อมูล

สิ่งสำคัญคือให้สังเกตว่าคลังข้อมูลอาจมีที่มาจากศูนย์ถึงฐานข้อมูลจำนวนมาก


3
การสร้างแบบจำลองข้อมูลเป็นศัพท์ทั่วไปและไม่เพียงนำไปใช้กับคลังข้อมูลเท่านั้น (บางทีใน # 3 ที่สองพวกเขาหมายถึง "การสร้างแบบจำลองมิติ" ตามที่เป็นอยู่ในประสบการณ์ของฉันวิธีที่นิยมที่สุดในการสร้างพวกเขา) บรรทัดสุดท้ายไม่สมเหตุสมผล: คลังข้อมูล "มี" ฐานข้อมูลได้อย่างไร ฉันอาจจะบอกว่าคลังข้อมูลนั้นมาจากฐานข้อมูล 0 ถึงหลาย (OLTP)
Patrick Marchand

2
@ Mark - มันบอกว่าอยู่ที่ฐานข้อมูลเท่านั้นสำหรับ OLTP? มันแสดงให้เห็นว่าฐานข้อมูลเกี่ยวข้องกับคลังข้อมูลอย่างไร
TheCloudlessSky

5
@Nickolay - นี่คือคำตอบอายุสองปี แก้ไขและแก้ไขหากคุณกังวล
TheCloudlessSky

1
@DataMan - ทำเครื่องหมายเป็นคำตอบที่ถูกต้อง การตอบคำถามของคุณค่อนข้างดีและยุติธรรม
sanzy

1
อะไรคือความแตกต่างระหว่างเทคนิคการสร้างแบบจำลองข้อมูลและเทคนิคการสร้างแบบจำลองเชิงสัมพันธ์เอนทิตี
QAIS

32

จากมุมมองที่ไม่ใช่ด้านเทคนิค: ฐานข้อมูลถูก จำกัด ให้กับแอปพลิเคชันหรือชุดแอปพลิเคชันเฉพาะ

คลังข้อมูลคือคลังเก็บข้อมูลระดับองค์กร มันจะมีข้อมูลจากทุกส่วน / หลายส่วนของธุรกิจ มันจะแบ่งปันข้อมูลนี้เพื่อให้ภาพระดับโลกของธุรกิจ นอกจากนี้ยังเป็นสิ่งสำคัญที่จะรวมเข้าด้วยกันระหว่างส่วนต่างๆของธุรกิจ

จากมุมมองทางเทคนิค: คำว่า "คลังข้อมูล" ไม่ได้ให้คำจำกัดความที่รู้จัก ส่วนตัวผมกำหนดคลังข้อมูลเป็นชุดของ data-marts ที่ data-mart แต่ละอันประกอบด้วยฐานข้อมูลหนึ่งฐานข้อมูลหรือมากกว่านั้นซึ่งเป็นฐานข้อมูลเฉพาะสำหรับชุดปัญหาเฉพาะ (แอปพลิเคชันชุดข้อมูลหรือกระบวนการ)

เพียงแค่ใส่ฐานข้อมูลเป็นส่วนประกอบของคลังข้อมูล มีหลายสถานที่ในการสำรวจแนวคิดนี้ แต่เนื่องจากไม่มี "คำจำกัดความ" คุณจะพบกับความท้าทายด้วยคำตอบที่คุณให้


Datamart เป็นฐานข้อมูล OLTP หรือไม่
CᴴᴀZ

@ CᴴᴀZเพื่ออะไร ดาต้ามาร์ทถูกสร้างขึ้นสำหรับ OLAP ดาต้ามาร์ทเป็น DWH ขนาดเล็กอย่างเสียงเบส (สำหรับส่วนเล็ก ๆ ของธุรกิจ) มันถูกสร้างขึ้นสำหรับการวิเคราะห์ดังนั้นหากคุณต้องการระบบ OLTP Datamart ไม่ใช่ตัวเลือกของคุณหากคุณต้องการ Data-Model สำหรับการวิเคราะห์ (เริ่มต้น Schema หรือ Snow flow) ดังนั้นคุณจะต้องการ Datamart
Enrique Benito Casado

เฮ้ @Eriri รับจุดของคุณ: Datamart มีส่วนช่วยในการ OLAP ผมเอาคิวของการเป็น OLTP Datamarts จากที่นี่ - SQL Server OLTP Datamart
CᴴᴀZ

สวัสดี @ CᴴᴀZฉันอ่านบทความและมันจะเป็นแค่วิธีการสร้าง OLTP ด้วย Datamart ตกลง . (แต่ฉันคิดว่าพวกเขาบอกว่ามันเป็นข้อยกเว้น) รับทราบว่าพวกเขาพูดอย่างไรตาราง OLTP ที่พวกเขาจะต้องถูกทำให้เป็นมาตรฐานเพื่อไม่ให้มีความไม่สอดคล้องกัน การทำให้เป็นมาตรฐานนั้นไม่ซับซ้อนนักที่จะทำใน schema ของ ER แต่มันซับซ้อนกว่าสำหรับ Star-Schema หรือ Snow-Flow นั่น Schemas เหล่านี้ถูกสร้างขึ้นเพื่อให้ง่ายต่อการอ่านในฐานข้อมูลและไม่ใช่การดำเนินการทำธุรกรรม นั่นเป็นเหตุผลที่ใช้ Datamart เช่น OLTP ไม่ควรคิดแม้ว่าจะเป็นไปได้
Enrique Benito Casado

16

คลังข้อมูลคือ TYPE ของฐานข้อมูล

นอกจากสิ่งที่ผู้คนพูดไปแล้วคลังข้อมูลมักจะเป็น OLAP พร้อมดัชนี ฯลฯ ปรับการอ่านไม่ใช่การเขียนและข้อมูลจะถูกทำให้เป็นมาตรฐาน / เปลี่ยนเป็นรูปแบบที่ง่ายต่อการอ่านและวิเคราะห์

บางคนบอกว่า "ฐานข้อมูล" นั้นเหมือนกับ OLTP ซึ่งไม่เป็นความจริง OLTP อีกครั้งคือประเภทของฐานข้อมูล

"ฐานข้อมูล" ประเภทอื่น: ไฟล์ข้อความ, XML, Excel, CSV ... , ไฟล์แบน :-)


1
นี่คือคำตอบที่ถูกต้องของพวกเขาทั้งหมด และอีกนิดเกี่ยวกับ Datamart:It is a logical subset of Data warehouse, generally based upon business functions.
C --Z

7

วิธีที่ง่ายที่สุดในการอธิบายว่าคลังข้อมูลประกอบด้วยมากกว่าฐานข้อมูล ฐานข้อมูลคือชุดของข้อมูลที่ถูกจัดเรียงในบางวิธี แต่คลังข้อมูลถูกจัดระเบียบเป็นพิเศษเพื่อ อย่างไรก็ตามนี่ไม่ใช่เรื่องราวทั้งหมดที่คลังข้อมูลมี "วิธีการดึงและวิเคราะห์ข้อมูลเพื่อแยกแปลงและโหลดข้อมูลและการจัดการพจนานุกรมข้อมูลก็ถือเป็นองค์ประกอบที่สำคัญของระบบคลังข้อมูลด้วย"

คลังข้อมูล


4

ฐานข้อมูล : - OLTP (กระบวนการทำธุรกรรมออนไลน์)

  • เป็นข้อมูลปัจจุบันข้อมูลรายละเอียดทันสมัยข้อมูลแยกเชิงสัมพันธ์แบบแบน
  • เอนทิตีความสัมพันธ์ใช้ในการออกแบบฐานข้อมูล
  • ขนาดฐาน 100MB-GB ธุรกรรมหรือ quires ง่าย ๆ

คลังข้อมูล

  • OLAP (กระบวนการวิเคราะห์ออนไลน์)
  • มันเป็นเรื่องเกี่ยวกับข้อมูลทางประวัติศาสตร์สตาร์สคีสกีหิมะและกาแล็กซี่
  • คีมาใช้ในการออกแบบคลังข้อมูล
  • ขนาดฐานข้อมูล 100GB-TB ปรับปรุงประสิทธิภาพของฐานข้อมูลแบบสอบถามสำหรับการสร้างฐานข้อมูลด้วยการแสดงข้อมูล
  • ช่วยให้ผู้ใช้งานได้รับความเข้าใจที่ลึกซึ้งยิ่งขึ้นและความรู้เกี่ยวกับแง่มุมต่าง ๆ ของข้อมูลองค์กรของพวกเขาผ่านการเข้าถึงแบบโต้ตอบที่รวดเร็วและสอดคล้องกับมุมมองที่เป็นไปได้ของข้อมูลที่หลากหลาย

4

Data Warehouse vs Database:คลังข้อมูลได้รับการออกแบบมาเป็นพิเศษสำหรับการวิเคราะห์ข้อมูลซึ่งเกี่ยวข้องกับการอ่านข้อมูลจำนวนมากเพื่อทำความเข้าใจความสัมพันธ์และแนวโน้มของข้อมูล ฐานข้อมูลใช้เพื่อรวบรวมและจัดเก็บข้อมูลเช่นบันทึกรายละเอียดของธุรกรรม

คลังข้อมูล: ปริมาณงานที่เหมาะสม - การวิเคราะห์การรายงานข้อมูลขนาดใหญ่ แหล่งข้อมูล - ข้อมูลที่รวบรวมและทำให้เป็นมาตรฐานจากหลายแหล่ง การดักจับข้อมูล - การดำเนินการเขียนเป็นกลุ่มตามกำหนดเวลาแบทช์ที่กำหนดไว้ล่วงหน้า การทำข้อมูลให้เป็นมาตรฐาน - สกีมาที่ทำให้เป็นปกติเช่นสคีตาร์หรือสคีโนเกล็ดหิมะ การจัดเก็บข้อมูล - ปรับให้เหมาะสมเพื่อความง่ายในการเข้าถึงและแบบสอบถามความเร็วสูง ประสิทธิภาพการทำงานโดยใช้การจัดเก็บคอลัมน์ การเข้าถึงข้อมูล - ปรับให้เหมาะสมเพื่อลด I / O และเพิ่มปริมาณข้อมูลสูงสุด

ฐานข้อมูลธุรกรรม: ปริมาณงานที่เหมาะสม - การประมวลผลธุรกรรม แหล่งข้อมูล - ข้อมูลที่บันทึกตามที่มาจากแหล่งเดียวเช่นระบบธุรกรรม การเก็บข้อมูล - ปรับให้เหมาะสมสำหรับการดำเนินการเขียนอย่างต่อเนื่องเนื่องจากมีข้อมูลใหม่เพื่อเพิ่มปริมาณงานสูงสุด การทำข้อมูลให้เป็นมาตรฐาน - แบบแผนที่คงที่และมีมาตรฐานสูง พื้นที่จัดเก็บข้อมูล - ปรับให้เหมาะสมสำหรับระดับสูงตลอดการดำเนินการเขียนไปยังบล็อกฟิสิคัลแถวที่มุ่งเน้นแถวเดียว การเข้าถึงข้อมูล - การดำเนินการอ่านขนาดเล็กจำนวนมาก


1

ที่เก็บข้อมูลใด ๆ สำหรับแอปพลิเคชันมักใช้ฐานข้อมูล อาจเป็นฐานข้อมูลเชิงสัมพันธ์หรือไม่มีฐานข้อมูล sql ซึ่งกำลังได้รับความนิยม

คลังข้อมูลยังเป็นฐานข้อมูล เราสามารถเรียกฐานข้อมูลคลังข้อมูลเป็นที่เก็บข้อมูลพิเศษเพื่อวัตถุประสงค์ในการรายงานการวิเคราะห์สำหรับ บริษัท ข้อมูลนี้ใช้สำหรับการตัดสินใจทางธุรกิจที่สำคัญ

ข้อมูลที่มีการจัดระเบียบนั้นช่วยในการรายงานและตัดสินใจทางธุรกิจอย่างมีประสิทธิภาพ


1

ฐานข้อมูล:

ใช้สำหรับการทำธุรกรรมออนไลน์ (OLTP)

  • การทำธุรกรรมที่มุ่งเน้น
  • แอพลิเคชันที่มุ่งเน้น
  • ข้อมูลปัจจุบัน
  • ข้อมูลรายละเอียด
  • ข้อมูลที่ปรับขนาดได้
  • ผู้ใช้หลายคนผู้ดูแลระบบ / การดำเนินงาน
  • เวลาดำเนินการ: สั้น

คลังข้อมูล:

ใช้สำหรับการประมวลผลการวิเคราะห์ออนไลน์ (OLAP)

  • การวิเคราะห์เชิง
  • วิชาที่มุ่งเน้น
  • ข้อมูลทางประวัติศาสตร์.
  • ข้อมูลรวม
  • ข้อมูลคงที่
  • มีผู้ใช้ไม่มาก, ผู้จัดการ
  • เวลาดำเนินการ: นาน

1

คลังข้อมูล (DW) เป็นกระบวนการในการรวบรวมและจัดการข้อมูลจากแหล่งต่าง ๆ เพื่อให้ข้อมูลเชิงลึกทางธุรกิจที่มีความหมาย คลังข้อมูลมักจะใช้เพื่อเชื่อมต่อและวิเคราะห์ข้อมูลทางธุรกิจจากแหล่งที่แตกต่างกัน คลังข้อมูลเป็นแกนหลักของระบบ BI ซึ่งถูกสร้างขึ้นสำหรับการวิเคราะห์ข้อมูลและการรายงาน


0

แหล่งที่มาสำหรับคลังข้อมูลสามารถเป็นกลุ่มของฐานข้อมูลได้เนื่องจากฐานข้อมูลจะใช้สำหรับกระบวนการธุรกรรมออนไลน์เช่นการเก็บบันทึกปัจจุบัน .. แต่ในคลังข้อมูลจะเก็บข้อมูลประวัติซึ่งเป็นกระบวนการวิเคราะห์ออนไลน์


0

Data Warehouse เป็นโครงสร้างข้อมูลชนิดหนึ่งซึ่งโดยปกติจะอยู่ในฐานข้อมูล Data Warehouse หมายถึงตัวแบบข้อมูลและชนิดของข้อมูลที่เก็บไว้ที่นั่น - ข้อมูลที่ถูกสร้างแบบจำลอง (ตัวแบบข้อมูล) ไปยังเซิร์ฟเวอร์เพื่อการวิเคราะห์

ฐานข้อมูลสามารถจัดเป็นโครงสร้างใด ๆ ที่เก็บข้อมูล ตามเนื้อผ้าที่จะเป็น RDBMS เช่น Oracle, SQL Server หรือ MySQL อย่างไรก็ตามฐานข้อมูลสามารถเป็นฐานข้อมูล NoSQL เช่น Apache Cassandra หรือ MPP เรียงเป็นแนวเช่น AWS RedShift

คุณเห็นฐานข้อมูลเป็นเพียงที่เก็บข้อมูล คลังข้อมูลเป็นวิธีการเฉพาะในการจัดเก็บข้อมูลและให้บริการตามวัตถุประสงค์เฉพาะซึ่งเป็นการให้บริการแบบสอบถามเชิงวิเคราะห์

OLTP กับ OLAP ไม่ได้บอกความแตกต่างระหว่าง DW และฐานข้อมูลทั้ง OLTP และ OLAP นั้นอยู่ในฐานข้อมูล พวกเขาเพียงแค่จัดเก็บข้อมูลในรูปแบบที่แตกต่างกัน (วิธีการแบบจำลองข้อมูลที่แตกต่างกัน) และให้บริการตามวัตถุประสงค์ที่แตกต่างกัน (OLTP - บันทึกการทำธุรกรรม, ปรับให้เหมาะสมสำหรับการปรับปรุง; OLAP - วิเคราะห์ข้อมูล


-1

ดูคำง่ายๆ: Dataware -> ข้อมูลขนาดใหญ่ใช้สำหรับวิเคราะห์ / จัดเก็บ / คัดลอกและวิเคราะห์ ฐานข้อมูล -> การทำงาน CRUD ด้วยข้อมูลที่ใช้บ่อย

Dataware house เป็นชนิดของการจัดเก็บข้อมูลที่คุณไม่ได้ใช้ในชีวิตประจำวันและฐานข้อมูลเป็นสิ่งที่คุณติดต่อบ่อยครั้ง

เช่น. ถ้าเราจะขอใบแจ้งยอดจากธนาคารมันจะให้เราในช่วง 3/4/6 / เดือนขึ้นไป bcoz อยู่ในฐานข้อมูล ถ้าคุณต้องการมากกว่านั้นมันเก็บไว้ในบ้าน Dataware


-1

ตัวอย่าง: บ้านมีค่า$100,000และมันแข็งค่าขึ้นที่$1000ต่อปี

ในการติดตามมูลค่าบ้านปัจจุบันคุณจะต้องใช้ฐานข้อมูลเนื่องจากมูลค่าจะเปลี่ยนแปลงทุกปี

สามปีต่อมาคุณจะสามารถเห็นคุณค่าของบ้านซึ่งก็คือ $103,000.

ในการติดตามมูลค่าบ้านในอดีตคุณจะต้องใช้คลังข้อมูลตามค่าของบ้าน

$100,000 on year 0, 
$101,000 on year 1, 
$102,000 on year 2, 
$103,000 on year 3. 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.