เครื่องมือในการสร้างชุดข้อมูลขนาดใหญ่ของข้อมูลการทดสอบ [ปิด]


25

หลายครั้งเมื่อพยายามออกแบบฐานข้อมูลที่มีประสิทธิภาพแนวทางการปฏิบัติที่ดีที่สุดคือการสร้างฐานข้อมูลตัวอย่างสองแห่งเติมข้อมูลและเรียกใช้แบบสอบถามกับฐานข้อมูลเพื่อดูว่าฐานข้อมูลใดมีประสิทธิภาพดีกว่า

มีเครื่องมือที่จะสร้าง (ตรงไปยังฐานข้อมูล) ชุดข้อมูลทดสอบขนาดใหญ่ (~ 10,000 รายการ) อย่างรวดเร็วหรือไม่? ฉันกำลังมองหาบางอย่างที่ใช้งานได้กับ MySQL อย่างน้อย

คำตอบ:


12

เครื่องมือที่ดีที่สุด (หากคุณสามารถหาได้) คือ DataFactory (เศร้าจากการพิมพ์) ฉันได้สร้างชุดข้อมูล (และค่อนข้างดูเป็นของแท้) ที่น่ายินดีอย่างยิ่งจากมัน

Generatedata.com เป็น ... ที่ยอมรับได้ แต่มีขนาดไม่ดีนัก

DataGeneratorเป็นสิ่งที่ต้องจับตาดู

และในขณะที่DTM Data Generatorนั้นเป็น clunky และตัวทดแทนที่ไม่ดีสำหรับ DataFactory มันมีอยู่และกำลังถูกขายและฉันใช้มันเพื่อสร้างข้อมูลที่ยอมรับได้


9

RedGate มีเครื่องมือคล้ายกับสิ่งที่คุณกำลังมองหา แต่ปลายทางมีวัตถุประสงค์เพื่อเป็น MS SQL Server

http://www.red-gate.com/products/sql-development/sql-data-generator

คุณอาจตรวจสอบบทความต่อไปนี้:

http://www.sqlservercentral.com/articles/Advanced+Querying/jointestdata/197/


+1 สำหรับตัวสร้างข้อมูล redgate sql
Aim Kai

4

ฉันมักจะสร้างของตัวเองโดยใช้ข้อมูลที่รู้จักกันเป็นข้อมูลเข้า - ถ้ามันสุ่มเกินไปก็ไม่ใช่การทดสอบที่ดีเสมอไป ฉันต้องการข้อมูลที่จะแจกจ่ายแบบเดียวกับผลิตภัณฑ์ขั้นสุดท้ายของฉัน

ฐานข้อมูลขนาดใหญ่ทั้งหมดที่ฉันต้องปรับแต่งนั้นเป็นวิทยาศาสตร์ในธรรมชาติดังนั้นฉันจึงสามารถทำการตรวจสอบอื่น ๆ เป็นอินพุตและขายใหม่และเพิ่มความกระวนกระวายใจ (เช่นการรับข้อมูลที่จังหวะ 5 นาทีด้วยความแม่นยำมิลลิวินาทีและเปลี่ยนเป็นจังหวะ 10 วินาทีด้วยความแม่นยำ milisecond แต่วินาที +/- 100 ms กระวนกระวายใจครั้ง)

...

แต่เป็นอีกทางเลือกหนึ่งถ้าคุณไม่ต้องการเขียนของคุณเองก็คือการดูเครื่องมือเปรียบเทียบบางอย่าง - เนื่องจากพวกเขาสามารถทำซ้ำสิ่งต่าง ๆ ซ้ำแล้วซ้ำอีกตามชุดฝึกอบรมคุณสามารถใช้มันเพื่อแทรกล็อตได้ ของระเบียน (และเพียงแค่ละเว้นรายงานเกี่ยวกับความรวดเร็วของมัน) ... จากนั้นคุณสามารถใช้เครื่องมือเดียวกันนี้เพื่อทดสอบว่าฐานข้อมูลทำงานรวดเร็วเพียงใดเมื่อมีการเติมข้อมูล




2

ลองดูฟังก์ชั่นนี้ คุณสามารถสร้างชื่อ, ที่อยู่ของเครื่องรูดบัตร, รหัสไปรษณีย์ ฯลฯ ได้ซึ่งสามารถทำได้อย่างสมบูรณ์ใน MYSQL โดยไม่จำเป็นต้องมีแอปพลิเคชั่นอื่น ๆ http://moinne.com/blog/ronald/mysql/howto-generate-meaningful-test-data-using-a-mysql-function


1

วิธีที่ประหยัดต้นทุนมากที่สุดคือการใช้โอเพนซอร์ซหรือเครื่องกำเนิดข้อมูลเชิงพาณิชย์ ฉันเคยทำเช่นนั้น

ในช่วงปีทองของฉันฉันถือว่าความต้องการข้อมูลการทดสอบแต่ละครั้งเป็นเอกสารเพื่อเรียนรู้ภาษาสคริปต์อื่น


1

สำหรับใครที่กำลังมองหาทางออกที่แตกต่างสำหรับปัญหานี้ ... ฉันเขียนโปรเจค data generator สำหรับ Data Synchronization Studio มันสามารถสร้างชุดข้อมูลขนาดใหญ่ตั้งแต่ 1 ถึง 100 ล้านแถวทดสอบข้อมูลจริง นี่คือบล็อกโพสต์เกี่ยวกับมัน http://www.simego.com/Blog/2012/02/Test-Data-Generator-Download-for-Data-Syncใช้งานฟรี 15 วัน (เมื่อคุณมีข้อมูลทดสอบแล้วคุณจะได้รับมัน)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.