ฉันควรเริ่มต้นด้วยการบอกว่าฉันอาจจะซับซ้อนกว่านี้ ฉันมีไฟล์ที่มีค่าคอลัมน์บางอย่างที่ถือว่าเป็นข้อมูลที่เป็นความลับ ในกรณีส่วนใหญ่พวกเขาจะถูกลบออกจากชุดข้อมูลใด ๆ ที่จะแบ่งปันหรือวิเคราะห์ อย่างไรก็ตามมีการส่งคำขอเพื่อสร้างชุดข้อมูลที่จะช่วยให้ผู้ใช้สามารถเปรียบเทียบจำนวน ID ที่แตกต่างกันเมื่อเปรียบเทียบกับจำนวนรายการทั้งหมด ดังนั้นในบางอย่างเช่นระเบียน 140,000 รายการฉันต้องแทนที่สามคอลัมน์ที่ถือว่าได้รับการปกป้อง
ความท้าทายที่ฉันกำลังเผชิญอยู่คือวิธีการปกปิดรหัสตัวอักษรและตัวเลข 22 ตัวอักษรในลักษณะที่ไม่สามารถระบุได้อีกต่อไป แต่ยังรักษาความสัมพันธ์ที่คล้ายคลึงกันระหว่างรายการที่ซ้ำกัน
คอลัมน์อีกสองคอลัมน์ดูเหมือนจะแปลงโดยไม่เกิดอุบัติเหตุหลังจากปรับคำตอบที่ฉันพบที่นี่เพื่อทำงานกับข้อกำหนด ID ที่ยาวขึ้น แต่ด้วยเหตุผลบางอย่างทำให้สูญเสียความสมบูรณ์เมื่อฟังก์ชั่นเดียวกันถูกชี้ไปที่มัน ฉันพยายาม จำกัด จำนวนตัวละครที่ฉันเปลี่ยนไปในคราวเดียวอย่างไรก็ตามดูเหมือนจะไม่สามารถแก้ปัญหาของฉันได้
ผลลัพธ์สุดท้ายที่ฉันกำลังมองหาหรือได้รับการบอกกล่าวว่าฉันต้องผลิตเป็นเพียงชุดข้อมูลดิบ ฉันไม่สามารถจัดกลุ่มข้อมูลสำหรับผู้ใช้พวกเขาต้องได้รับเช่นนั้นแต่ละแถวบัญชีหนึ่งระเบียนและจากนั้นการวิเคราะห์สิ่งที่พวกเขาต้องการให้เสร็จสมบูรณ์จากที่นั่น
มีวิธีที่ดีกว่าในการบรรลุสิ่งที่ฉันพยายามทำมากกว่าลิงก์ด้านบน / การค้นหาและแทนที่ที่มีขนาดใหญ่จริง ๆ หรือไม่
เพิ่มเติม: เนื่องจากฉันไม่สามารถโพสต์ข้อมูลที่ฉันต้องการนำไปใช้จริงฉันไม่คิดว่าฉันควรพยายามทำซ้ำเพื่อช่วยในคำตอบที่อาจเกิดขึ้นได้
สมมติว่าฉันมีรหัสเหล่านี้:
ID VTC DTE
A8894512374516347852001 110 8/9/2016
J7763473861247762551000 1180 8/9/2016
Q4523732167498765146000 375 8/9/2016
T6348761321688873431001 703 8/9/2016
H6676314656873346615001 375 8/9/2016
A8894512374516347852001 5091 8/9/2016
T6348761321688873431001 5091 8/9/2016
S8897613515646873143168 375 8/9/2016
ตอนนี้สิ่งที่ฉันหวังว่าจะได้พบคือวิธีในการใช้อินสแตนซ์เช่นบันทึกที่เริ่มต้นด้วย "A889" และทำให้พวกเขาลงเอยด้วยกัน แต่ไม่ใช่คนอื่น ปัญหาคือจำนวนระเบียน (สูงถึง 170,000) จำนวนหมายเลข ID ที่แตกต่างกันน่าจะใกล้เคียงกับ 120,000 ที่จะต้องนำมาพิจารณา