ที่หนึ่งสามารถรับชุดข้อมูล / ปัญหาการทดสอบที่ดีสำหรับการทดสอบอัลกอริทึม / กิจวัตร?


41

ในการประเมินคุณภาพของซอฟต์แวร์ที่คุณกำลังใช้ (ไม่ว่าจะเป็นสิ่งที่คุณเขียนหรือแพคเกจบรรจุกระป๋อง) ในการคำนวณมันมักจะเป็นความคิดที่ดีที่จะดูว่าชุดข้อมูลหรือปัญหามาตรฐานทำงานได้ดีเพียงใด ที่หนึ่งอาจได้รับการทดสอบเหล่านี้สำหรับการตรวจสอบขั้นตอนการคำนวณ?

(หนึ่งเว็บไซต์ / หนังสือต่อคำตอบโปรด)


ฉันตั้งใจจะเป็นโพสต์ของ Community Wiki และตั้งค่าสถานะนี้เพื่อการแปลง
JM

3
คำถามนี้ไม่กว้างเกินไปนั่นคือขึ้นอยู่กับอัลกอริทึม / ลักษณะของปัญหาที่ซอฟต์แวร์นี้ใช้เพื่อแก้ปัญหา
Andre Holzner

ฉันอยากให้คำถามนี้เป็นวิกิชุมชน@Andre (เป็น "รายการใหญ่" ของทรัพยากร); ฉันตั้งค่าสถานะนี้เพื่อการแปลงค่า แต่ไม่ทราบว่าเพราะเหตุใดจึงไม่แปลง
JM

@JM ฉันได้แปลงแล้ว
David Ketcheson

คำตอบ:


15

หากคุณมีความสนใจในการดำเนินการวิเคราะห์เกี่ยวกับการฝึกอบรมเบาบางฉันยังจะพิจารณามหาวิทยาลัยเดวิสฟลอริด้าเบาบางเมทริกซ์การเก็บและการตลาดเมทริกซ์


1
นอกจากนี้ยังมี Matrix Market math.nist.gov/MatrixMarket
stali

13

วิธีการแก้ปัญหาที่ผลิตขึ้นเป็นมาตรฐานสำหรับการทดสอบ PDE และตัวแก้ปัญหาอื่น ๆ ระบบพีชคณิตเชิงสัญลักษณ์ส่วนใหญ่มีระบบอำนวยความสะดวกสำหรับการสร้างรหัสซึ่งมีประโยชน์สำหรับการสร้างโซลูชันที่ผลิตขึ้น SymPy และ Maple มีโค้ดฟังก์ชั่นและอื่น ๆ เพื่อจุดประสงค์นี้


10

ชุดทดสอบ IVPs (ปัญหาค่าเริ่มต้นสำหรับแก้ ODE) จะยังคงอยู่ในขณะนี้โดยผู้คนจากมหาวิทยาลัยบารี, อิตาลี, ที่หยิบมันมาจาก CWI อัมสเตอร์ดัม


1
มีชุดทดสอบเพิ่มเติมสำหรับ IVP ในคำตอบนี้จาก JM ใน Math.StackExchange: math.stackexchange.com/a/59398
David Ketcheson


8

ในการคำนวณแม่เหล็กไฟฟ้ามีชื่อเสียง (หรือน่าอับอายเพราะความยากลำบากในบาง) ชุดทดสอบปัญหา: การทดสอบไฟฟ้าวิธีการวิเคราะห์ (ทีม)

บางคนต้องการเทคนิคการคำนวณที่ล้ำสมัยเพื่อให้ได้ผลลัพธ์การจำลองที่ถูกต้องสอดคล้องกับข้อมูลการทดลอง ยกตัวอย่างเช่นปัญหาตัวนำขดลวด

ชุดของการทดสอบปัญหาสำหรับสมการแมกซ์เวลอีกเป็นข้อมูลที่รวบรวมโดย Dauge: การคำนวณเกณฑ์มาตรฐานสำหรับสมการแมกซ์เวลสำหรับการประมาณของการแก้ปัญหาเอกพจน์สูง หนึ่งในลูกบาศก์ Fichera ที่โด่งดัง (หรือเสียชื่อ):

Fichera

ใด ๆและใช้ชีวิตบนคิวบ์นี้จะเป็นความท้าทายสำหรับรหัสตัวเลข PDE ของคุณ E = - ϕϕH1+ϵE=ϕ

สุดท้าย PDE เชิงตัวเลขมีมาตรฐานของ hpFEM ในแบบ 2D (ปัญหาเกี่ยวกับวิธีแก้ปัญหาที่ทราบอย่างแน่นอน)ฉันใช้ปัญหาการทดสอบเป็นระยะเวลานานเพื่อทดสอบรหัสองค์ประกอบ จำกัด ของฉัน ตัวอย่างเช่นชื่อเสียงที่ไม่ราบรื่นใกล้กับที่มาของโดเมนรูปตัว L ตัวอย่าง

Δu=0,where u=rαsin(αθ).

7

หากคุณมีความสนใจในขั้นตอนวิธีการเปรียบเทียบที่เกี่ยวข้องกับโครงสร้างโมเลกุลฐานข้อมูล pubchemมีการรวบรวมโมเลกุลอินทรีย์ส่วนใหญ่เป็นจำนวนมาก สิ่งนี้อาจมีประโยชน์ในการเปรียบเทียบการทำนายคุณสมบัติของโมเลกุลที่ได้จากตัวแบบ / โปรแกรมที่แตกต่างกัน ไซต์มีหลายตัวเลือกสำหรับการดาวน์โหลดชุดของโมเลกุลขนาดใหญ่ที่ตรงตามเกณฑ์ที่กำหนดไว้ล่วงหน้า (เช่นองค์ประกอบทางเคมี)


7

Arnold Neumaier รักษาเสถียรภาพของปัญหาการทดสอบสำหรับการปรับให้เหมาะสมแบบไม่มีเงื่อนไขและ จำกัด (การโปรแกรมแบบไม่เชิงเส้น) สิ่งที่รวมอยู่ในคอลเล็กชันนี้คือปัญหาการทดสอบมาตรฐานในขณะนี้สำหรับการปรับให้เหมาะสมแบบไม่ จำกัดเนื่องจากMoré, Garbow และ Hillstrom


7

น่ารักเว็บไซต์ปรับปรุงชุดทดสอบ CUTE ที่ระบุไว้บนเว็บไซต์ของอาร์โนล Neumaier กับปัญหาบางอย่างเพิ่มเติมสำหรับการเพิ่มประสิทธิภาพเชิงเส้นและแก้ นอกจากนี้ยังมีเครื่องมือซอฟต์แวร์สำหรับการทดสอบและอัปเดตพีชคณิตเชิงเส้นและเครื่องมือเพิ่มประสิทธิภาพ



6

เราใช้ชุดข้อมูลสภาพอากาศในซอฟต์แวร์จำลองพลังงานอาคารของเรา สำหรับสหรัฐอเมริกาชุดข้อมูลประกอบด้วยการสังเกตการณ์สภาพอากาศ (โดยปกติจะอยู่ที่สนามบิน) ทุก ๆ ชั่วโมงเป็นเวลาก่อนหน้า 20 ปี

ชุดข้อมูลที่สามารถดาวน์โหลดได้ คู่มือการใช้งานในการอธิบายถึงรูปแบบไฟล์




4

เว็บไซต์ของ Hans Mittelmanเป็นแหล่งข้อมูลที่ยอดเยี่ยมสำหรับการนำทางตัวเลือกซอฟต์แวร์ปัจจุบันในการเพิ่มประสิทธิภาพเชิงตัวเลข เขามีของเขามาตรฐานของตัวเองเช่นเดียวกับการเชื่อมโยงไปยังมาตรฐานอื่น ๆ สำหรับการทดสอบปัญหาในการเพิ่มประสิทธิภาพ



3

มีคอลเลกชันของปัญหาการเพิ่มประสิทธิภาพ PDE จำกัด อ้างอิงการเก็บรักษาโดย Roland Herzog ที่ TU-มนิสท์เป็นที่นี่


2

ซอฟต์แวร์ที่ดีต้องได้รับการทดสอบและควรบอกว่าผู้เขียนได้ทดสอบอย่างไรและให้ข้อมูลชุดการทดสอบด้วยตนเอง (เช่นในรูปแบบของการทดสอบการถดถอย) หรืออย่างน้อยก็ให้ลิงค์ไปยังข้อมูลที่ถูกทดสอบด้วย


ได้ยินได้ยิน เห็นการทำซ้ำ ff และทำซ้ำได้วิจัยและ IPython โน๊ตบุ๊ค
เดนิส

2

หากคุณกำลังมองหากราฟขนาดใหญ่หรือข้อมูลเครือข่ายที่จะทดสอบ โครงการวิเคราะห์ Stanford เครือข่าย (SNAP)มีหลายชุดข้อมูลกราฟขนาดใหญ่มักจะอยู่ในรูปแบบของรายการถ้อยคำที่ไม่ระบุชื่อ ตัวเลือกบางส่วนของพวกเขารวมถึง:

ข้อมูล

คุณสมบัติของข้อมูล

  • จำนวนขอบ: ที่ใดก็ได้จาก ~ 10 ถึง ~ 400 ล้าน
  • จำนวนโหนด: ที่ใดก็ได้จาก ~ 10 ถึง ~ 100 ล้าน
  • ประเภท Edge: กำกับ, ไม่ได้กำกับ, ถ่วงน้ำหนัก, ไม่ได้ใส่น้ำหนัก, ลงนามและไม่ได้ลงนาม
  • ประเภทเครือข่าย: กำกับ, ไม่ระบุทิศทาง, สองฝ่าย, การทำหลายรูปแบบ, ชั่วคราว, ระบุไว้

สถิติ Ground Ground มีอยู่ในชุดข้อมูล:

เครื่องมือ


@JM ไม่มีปัญหา! ฉันใช้ชุดข้อมูลโซเชียลเน็ตของพวกเขาเมื่อไม่นานมานี้สำหรับโปรเจ็กต์แล้วก็เจอกับการแลกเปลี่ยนสแต็คและคิดว่ามันอาจมีประโยชน์ที่นี่
ryan

-3

ข้อมูลนั้นง่าย API เพื่อให้ได้มันอาจจะยาก ผมขอแนะนำให้Quandl ไซต์นี้มีชุดข้อมูลสาธารณะกว่า 10 ล้านชุดที่เข้าถึงได้ผ่าน API ที่ง่ายและรวดเร็วส่วนที่หนึ่ง ข้อมูลทั้งหมดถูกส่งคืนใน CSV หรือ JSON หรือถ้าการเขียนโปรแกรมไม่ใช่ชุดที่รัดกุมของคุณมีวิธีง่าย ๆ ในการรับข้อมูลลงใน Excel โปรแกรมเมอร์ R, Python และ Ruby จะอยู่ที่บ้านกับห้องสมุดท้องถิ่น


1
ยินดีต้อนรับสู่ Scicomp! ฉันไม่คิดว่านี่เป็นข้อมูลที่เป็นคำถาม ในการทดสอบอัลกอริธึมคุณไม่เพียง แต่ต้องมีชุดข้อมูล แต่ยังให้ผลลัพธ์ที่สอดคล้องกัน (ขึ้นอยู่กับปัญหา / อัลกอริทึม) เพื่อเปรียบเทียบผลลัพธ์ของคุณ
Christian Clason

ขอบคุณ @ChristianClason ฉันเห็นสิ่งที่คุณหมายถึง เช่นหากซอฟต์แวร์สำหรับการถดถอยเชิงเส้นผู้เขียนมีความสนใจในชุดข้อมูลเช่นเดียวกับชุดของผลการวิเคราะห์ตรวจสอบเพื่อทดสอบว่าแพคเกจการถดถอยเชิงเส้นทำงานอย่างถูกต้อง
Brian Risk
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.