ฉันมีการถ่ายโอนข้อมูลข้อมูล CSV ซึ่งเป็นแบนของตารางที่เกี่ยวข้องจากฐานข้อมูล sql ดังนั้นเพื่อลดความซับซ้อนดูเหมือนว่านี้
| col1 | col2 | col3 | col4 |
+------+------+------+------+
| A | Ad | B | B1 |
| A | Ad | B | B2 |
| A | Ad | B | B3 |
| A | Ad | C | C1 |
| A | Ad | C | C2 |
| X | Xx | D | D1 |
| X | Xx | D | D2 |
| X | Xx | E | E3 |
จากตารางนี้ฉันต้องสร้างกราฟและ pivots ต่าง ๆ จากส่วนย่อยของข้อมูลนี้
ดังนั้นฉันต้องการสร้าง (ลิงก์) ไปยังข้อมูลนี้และสร้างตารางที่แสดงถึงชุดข้อมูลที่สอบถามได้หลังจากนั้นเช่น
| col1 | col2 |
+------+------+
| A | Ad |
| X | Xx |
และ
| col1 | col2 | col3 |
+------+------+------+
| A | Ad | B |
| A | Ad | C |
| X | Xx | D |
| X | Xx | E |
ส่วนใหญ่ดังนั้นฉันสามารถนับการผสมผสานที่เป็นเอกลักษณ์ของข้อมูลที่แบน
เป็นสิ่งสำคัญที่เมื่อฉันรีเฟรชข้อมูลจากแหล่งข้อมูลที่ตารางเหล่านี้อัปเดตอย่างถูกต้อง
ดังนั้นฉันจะทำอย่างไร
แก้ไข
คำตอบของคุณมีประโยชน์ดูเหมือนว่าคำถามของฉันไม่ดีพอ
สำหรับตารางแรกฉันต้องการสร้างสิ่งนี้จริงๆ
| col1 | col2 | count
+------+------+------
| A | Ad | 1
| X | Xx | 1
และอันที่สอง
| col1 | col2 | col3 | count
+------+------+------+------
| A | Ad | B | 1
| A | Ad | C | 1
| X | Xx | D | 1
| X | Xx | E | 1
ดังนั้นการนับสะท้อนให้เห็นถึงการนับบันทึกที่แตกต่างกันในระดับที่กำหนดไม่ใช่ผลรวมของแถวทั้งหมด
ฉันต้องตอบคำถามเช่น "อะไรคือผลรวมของรายการที่แตกต่างใน col1"
ฉันต้องตอบคำถามนี้ "แสดงจำนวน col3 สำหรับ col1"
ฉันคาดว่าฉันจะถูกขอให้ทำกราฟและนำเสนอข้อมูลในระดับปกติต่างๆเช่นกัน
ฉันหวังว่านี่จะแม่นยำกว่าสำหรับคุณ ขอบคุณสำหรับความช่วยเหลือจนถึงตอนนี้