ฉันเป็นมือใหม่ที่พยายามโอบรอบ OLAP และฉันมีคำถามสองสามข้อ
- คำถามที่ 1: OLAP cube เก็บค่ามัธยฐาน, โหมด, เปอร์เซ็นไทล์ได้หรือไม่?
- คำถามที่ 2:แบบสอบถาม MDX ที่ผู้ใช้เขียนสามารถส่งคืนข้อมูลสรุปของข้อมูลระดับแถวได้หรือไม่ (เช่น: การทำธุรกรรม%> $ 100) หรือผู้ออกแบบคิวบ์ต้องเพิ่มสิ่งนี้ในคิวบ์หรือไม่
- คำถามที่ 3:ผลิตภัณฑ์ OLAP ใด ๆ มีกลไกสำหรับการเข้าถึงข้อมูลระดับแถวหรือไม่ ที่?
แผนกไอทีของเรากำลังค้นหาคำติชมเกี่ยวกับปัญหาที่เรามีกับคิวบ์ ROLAP MS Analsis Services เราไม่สามารถเข้าถึงฐานข้อมูลเชิงสัมพันธ์ที่อยู่ด้านหลังและจำเป็นต้องทำการคำนวณที่ไม่สามารถใช้งานได้ในปัจจุบันเป็นมาตรการในคิวบ์
ให้ฉันดูว่าฉันมีสิทธิ์นี้ไหม
- คิวบ์สามารถจัดเตรียมสถิติสำหรับการนับหมายถึงสัดส่วนการเบี่ยงเบนมาตรฐาน
- หากสถิติเฉพาะไม่ได้รับการตอบสนองในการวัดที่ได้รับจากนักออกแบบคิวบ์เราสามารถเขียนแบบสอบถาม MDX เพื่อรับมันได้หรือไม่ หรือพวกเขาจำเป็นต้องเปลี่ยนคิวบ์เพื่อคำนวณล่วงหน้าจากข้อมูลระดับแถว
- คิวบ์ไม่สามารถให้ข้อมูลสถิติเช่นค่ามัธยฐานโหมดหรือค่าร้อยละได้เนื่องจากสถิติเหล่านี้ไม่ได้ทำให้รุนแรงขึ้นอย่างเหมาะสม
ฉันกำลังอ่านไวยากรณ์ของกราฟิกของ Leland Wilkinson และในบทของเขาเกี่ยวกับ Data Mining และ OLAP เขากล่าว
[การดำเนินการคิวบ์] เหล่านี้ทำงานได้ดีกับสถิติเช่นการนับค่าเฉลี่ยสัดส่วนและส่วนเบี่ยงเบนมาตรฐาน การรวมอย่างง่าย ๆ เหนือคลาสย่อยสามารถคำนวณได้โดยการดำเนินการกับจำนวนเงินผลรวมของกำลังสองและคำอื่น ๆ ที่รวมอยู่ในฟังก์ชันเชิงเส้นเพื่อสร้างสถิติสรุปพื้นฐาน
พวกเขาทำงานไม่ถูกต้องกับสถิติเช่นค่ามัธยฐานโหมดและเปอร์เซ็นไทล์เนื่องจากการรวมสถิติเหล่านี้ไม่ได้เป็นสถิติของมวลรวมของพวกเขา เช่นค่ามัธยฐานของค่ามัธยฐานไม่ใช่ค่ามัธยฐานของมวลรวม
เขายังเพิ่ม:
อย่างไรก็ตามแบบจำลอง ROLAP ที่มีความซับซ้อนมากขึ้นได้เกิดขึ้นเมื่อเร็ว ๆ นี้ มันเป็นไปได้ที่จะใช้เทคโนโลยีหลายอย่างเพื่อให้อัลกอริทึมทางสถิติเข้าถึงข้อมูลดิบผ่านตัวแบบเชิงสัมพันธ์ในแบบเรียลไทม์ วิธีนี้มีแนวโน้มมากกว่าการรวมที่เข้มงวดที่เสนอโดยโครงสร้างเช่น data cube
ในรูปแบบที่หรูหราที่สุดของสถาปัตยกรรมนี้แอปพลิเคชันสามารถร้องขอการเชื่อมต่อระยะไกลเพื่อให้ข้อมูลเกี่ยวกับวิธีการจัดการข้อมูลและดำเนินการที่เหมาะสมขึ้นอยู่กับข้อมูลที่ส่งคืน ในรูปแบบนี้สถาปัตยกรรมส่วนประกอบสามารถบรรลุสัญญาที่แท้จริงของการคำนวณแบบกระจาย: การออกแบบและการดำเนินการที่ไม่ขึ้นกับไซต์ระบบปฏิบัติการหรือภาษา
นั่นถูกเขียนขึ้นในปี 2005 มีใครรู้บ้างไหมว่าผลิตภัณฑ์ที่ใช้วิธีการนี้อนุญาตให้เข้าถึงข้อมูลในระดับแถวได้หรือไม่?