คำถามติดแท็ก genetic-algorithms

คลาสของอัลกอริทึมการเพิ่มประสิทธิภาพที่ได้รับแรงบันดาลใจจาก (หรือเลียนแบบ) วิวัฒนาการทางชีววิทยา

3
ตัวอย่าง: การถดถอย LASSO โดยใช้ glmnet สำหรับผลลัพธ์ไบนารี
ฉันเริ่มตะลุยกับการใช้งานglmnetกับการถดถอยแบบ LASSOซึ่งผลลัพธ์ของความสนใจของฉันนั้นเป็นแบบขั้วคู่ ฉันได้สร้างกรอบข้อมูลจำลองขนาดเล็กด้านล่าง: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

5
Backpropagation กับขั้นตอนวิธีเชิงพันธุกรรมสำหรับการฝึกอบรมโครงข่ายประสาทเทียม
ฉันได้อ่านบทความสองสามฉบับเกี่ยวกับข้อดีข้อเสียของแต่ละวิธีบางคนโต้แย้งว่า GA ไม่ได้ปรับปรุงการหาทางออกที่ดีที่สุดในขณะที่คนอื่น ๆ แสดงว่ามันมีประสิทธิภาพมากกว่า ดูเหมือนว่า GA เป็นที่ต้องการโดยทั่วไปในวรรณกรรม (แม้ว่าคนส่วนใหญ่จะปรับเปลี่ยนเพื่อให้ได้ผลลัพธ์ตามที่ต้องการ) ดังนั้นทำไมโซลูชันซอฟต์แวร์ส่วนใหญ่จึงใช้ backpropagation เท่านั้น มีกฎทั่วไปของหัวแม่มือเมื่อใช้อย่างใดอย่างหนึ่งหรือไม่? บางทีมันอาจขึ้นอยู่กับประเภทของ NN หรือมีวิธีการแก้ปัญหาบางอย่างที่โดยทั่วไปมีประสิทธิภาพสูงกว่าคนอื่น ถ้าเป็นไปได้ฉันกำลังมองหาคำตอบทั่วไป: เช่น "ถ้า NN มีค่ามาก GA ดีกว่า" หรือ "GA ดีกว่าเสมอ แต่มีปัญหาประสิทธิภาพการคำนวณ" ฯลฯ ...

2
วิธีเลือกระหว่างอัลกอริทึมการเรียนรู้
ฉันต้องใช้โปรแกรมที่จะจัดประเภทระเบียนเป็น 2 หมวดหมู่ (จริง / เท็จ) ขึ้นอยู่กับข้อมูลการฝึกอบรมบางอย่างและฉันสงสัยว่าอัลกอริทึม / วิธีการที่ฉันควรจะดู ดูเหมือนจะมีพวกเขาให้เลือกมากมาย - โครงข่ายประสาทเทียม, อัลกอริทึมทางพันธุกรรม, การเรียนรู้ของเครื่อง, การเพิ่มประสิทธิภาพเบย์เซียนเป็นต้นและอื่น ๆ ฉันไม่แน่ใจว่าจะเริ่มจากตรงไหน ดังนั้นคำถามของฉันคือ ฉันจะเลือกอัลกอริทึมการเรียนรู้ที่ฉันควรใช้สำหรับปัญหาของฉันได้อย่างไร หากสิ่งนี้ช่วยได้นี่คือปัญหาที่ฉันต้องแก้ไข ข้อมูลการฝึกอบรม: ข้อมูล การฝึกอบรมประกอบด้วยแถวจำนวนมากเช่นนี้: Precursor1, Precursor2, Boolean (true/false) การวิ่งที่ ฉันจะได้รับมาก่อน จากนั้น ฉันเลือกอัลกอริทึม A จากอัลกอริธึมที่แตกต่างกัน (หรือสร้างอัลกอริทึมแบบไดนามิก) และใช้กับชุดค่าผสมที่เป็นไปได้ของสารตั้งต้นเหล่านี้และรวบรวม "บันทึก" ที่ถูกปล่อยออกมา "บันทึก" ประกอบด้วยคู่ค่าคีย์หลายคู่ * ฉันใช้อัลกอริทึมที่ยอดเยี่ยมและจัดประเภทระเบียนเหล่านี้เป็น 2 หมวดหมู่ (จริง / เท็จ) ฉันจะสร้างตารางที่มีรูปแบบเดียวกับข้อมูลรถไฟ: Precursor1, Precursor2, Boolean …

3
อัลกอริทึมพันธุกรรมเป็นตัวเลือกที่ดีสำหรับการเพิ่มประสิทธิภาพเมื่อใด
อัลกอริทึมทางพันธุกรรมเป็นรูปแบบหนึ่งของวิธีการเพิ่มประสิทธิภาพ บ่อยครั้งที่การไล่ระดับสีแบบสุ่มและอนุพันธ์เป็นทางเลือกที่ดีที่สุดสำหรับการปรับฟังก์ชั่นให้ดีที่สุด แต่บางครั้งก็ยังใช้อัลกอริทึมทางพันธุกรรม ตัวอย่างเช่นเสาอากาศของยานอวกาศ ST5 ของนาซาสร้างขึ้นด้วยอัลกอริธึมทางพันธุกรรม: เมื่อใดที่การเพิ่มประสิทธิภาพทางพันธุกรรมเป็นทางเลือกที่ดีกว่าวิธีการไล่ระดับสีแบบลาดชันทั่วไป

2
ภาษาใดที่ใช้สำหรับการโปรแกรมเชิงพันธุกรรม
เป็นส่วนหนึ่งของการมอบหมายฉันจะต้องเขียนอัลกอริทึมการเขียนโปรแกรมทางพันธุกรรมที่จะทำนายระดับมลพิษในชั้นบรรยากาศ ตั้งแต่ผมเคยมีประสบการณ์ในการทำงานชี้ทุกคนสามารถฉันตัวชี้ไปยังข้อเสนอของภาษาโปรแกรมที่พัฒนาโปรแกรมจะถูกเขียน ความชัดเจน:ฉันไม่ได้ถามว่าภาษาใดที่ฉันจะเขียนอัลกอริธึมทางพันธุกรรมเอง (เนื่องจากฉันจะสามารถตัดสินใจเองได้) ฉันจะถามในภาษาโปรแกรมที่โปรแกรมที่พัฒนาขึ้นควรถูกสร้างขึ้น อาจารย์ผู้สอนของฉันแนะนำ Lisp แต่ฉันไม่ชอบความคิดนี้ --- ก่อนอื่นฉันต้องทำงานกับต้นไม้บทคัดย่อบางชนิดที่สองอย่างน่าเชื่อถือที่ทำไขว้บนโครงสร้างต้นไม้อาจเป็นเรื่องยุ่งเหยิง ฉันอยากจะใช้สิ่งที่มีความมุ่งมั่นในการเขียนโปรแกรมทางพันธุกรรมเช่นเฉือน / A SlashA ไม่ต้องการทำงานกับ AST --- โปรแกรมใน bytecode เป็นเพียงอาร์เรย์ของ ints ที่สามารถเปลี่ยนแปลงได้ใน fasion ใด ๆ ที่จำเป็นเนื่องจากทุก int array แทน slash / A บางโปรแกรม ข้อสังเกตเพิ่มเติม: ฉันต้องการหลีกเลี่ยงการจัดการ AST! ปัญหานี้เป็นเรื่องยาก (อาจไม่ยากเท่ากับการคาดการณ์มูลค่าหุ้น) นี่เป็นเพราะความจริงที่ว่า (ส่วนใหญ่) เราไม่มีข้อมูลอินพุตที่เพียงพอ (มีพารามิเตอร์ที่ซ่อนอยู่บางส่วน) การสร้างแบบจำลองที่มีประสิทธิภาพที่ดีกว่าแบบจำลองที่ให้ผลตอบแทนนั้นค่อนข้างท้าทาย (โมเดลเฉลี่ย 35% MAPE) แบบจำลองส่วนใหญ่มี MAPE ประมาณ 25% …

8
ฝึกฝน Neural Network เพื่อแยกแยะตัวเลขคู่และคู่
คำถาม: เป็นไปได้ไหมที่จะฝึก NN ให้แยกแยะระหว่างเลขคี่กับเลขคู่โดยใช้เป็นตัวเลขเท่านั้น? ฉันมีชุดข้อมูลต่อไปนี้: Number Target 1 0 2 1 3 0 4 1 5 0 6 1 ... ... 99 0 100 1 ฉันฝึก NN ด้วยเซลล์ประสาทอินพุตสองตัว (อันหนึ่งคือตัวแปรหมายเลข, อีกอันคือเซลล์ประสาทอคติ), เก้าเซลล์ประสาทในเลเยอร์ที่ซ่อนอยู่และเซลล์ประสาทเอาท์พุทหนึ่งโดยใช้อัลกอริธึมทางพันธุกรรมที่ง่ายมาก: ในแต่ละช่วงเวลา "ต่อกัน; ส่วนที่มีข้อผิดพลาดสูงที่สุดจะหายไปและจะถูกแทนที่ด้วยผู้ชนะที่ได้รับการแก้ไข สคริปต์สามารถแก้ปัญหาง่าย ๆ อย่างเช่นตัวดำเนินการ AND, OR และ XOR แต่ติดอยู่ในขณะที่พยายามจัดหมวดหมู่ตัวเลขคี่และคู่ ตอนนี้สิ่งที่ดีที่สุดที่จะจัดการคือการระบุหมายเลข 53 จาก 100 และใช้เวลาหลายชั่วโมง ไม่ว่าฉันจะทำให้ปกติหรือไม่อินพุตดูเหมือนจะไม่แตกต่างกัน หากฉันต้องการที่จะโกงฉันสามารถประมวลผลข้อมูลล่วงหน้าและป้อน% 2 …

4
ประโยชน์ของการใช้อัลกอริทึมทางพันธุกรรม
ทุกคนสามารถอธิบายถึงประโยชน์ของอัลกอริทึมทางพันธุกรรมให้ฉันเปรียบเทียบกับวิธีการค้นหาและการเพิ่มประสิทธิภาพแบบดั้งเดิมอื่น ๆ ได้หรือไม่

1
การทดสอบที่แน่นอนของฟิชเชอร์และการกระจาย hypergeometric
ฉันต้องการที่จะเข้าใจการทดสอบที่แม่นยำของฟิชเชอร์มากขึ้นดังนั้นฉันจึงคิดค้นตัวอย่างของเล่นต่อไปนี้โดยที่ f และ m สอดคล้องกับเพศชายและเพศหญิงและ n และ y สอดคล้องกับ "การบริโภคโซดา" เช่นนี้: > soda_gender f m n 0 5 y 5 0 เห็นได้ชัดว่านี่คือการทำให้เข้าใจง่ายมาก แต่ฉันไม่ต้องการให้บริบทเข้ามาขวางทาง ที่นี่ฉันเพิ่งสันนิษฐานว่าผู้ชายไม่ดื่มโซดาและหญิงดื่มโซดาและต้องการดูว่าวิธีการทางสถิติมาถึงข้อสรุปเดียวกัน เมื่อฉันทำการทดสอบฟิชเชอร์ที่แน่นอนใน R ฉันจะได้ผลลัพธ์ต่อไปนี้: > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 …

2
วิธีการเลือกตัวแปรทางพันธุกรรมขั้นตอนวิธีใน R สำหรับตัวแปรอินพุต SVM?
ฉันใช้แพคเกจkernlabใน R เพื่อสร้าง SVM สำหรับการจำแนกข้อมูล SVM ทำงานได้อย่างดีในการให้ 'คาดการณ์' ของความแม่นยำที่เหมาะสมอย่างไรก็ตามรายการตัวแปรอินพุตของฉันมีขนาดใหญ่กว่าที่ฉันต้องการและฉันไม่แน่ใจว่ามีความสำคัญสัมพัทธ์ของตัวแปรที่แตกต่างกันอย่างไร ฉันต้องการใช้อัลกอริธึมทางพันธุกรรมเพื่อเลือกชุดย่อยของตัวแปรอินพุตที่สร้าง SVM ที่ได้รับการฝึกอบรม / เหมาะสมที่สุด ฉันต้องการความช่วยเหลือในการเลือกแพ็กเกจ R ที่จะใช้เมื่อพยายามใช้งาน GA นี้ (และอาจเป็นตัวอย่างสั้น ๆ ของ psuedo) ฉันดูแพ็คเกจ R GA / P ส่วนใหญ่อยู่ที่นั่น ( RGP , genalg , subselect , GALGO ) แต่ฉันกำลังดิ้นรนในเชิงแนวคิดเพื่อดูว่าฉันจะส่งผ่านฟังก์ชัน ksvm ของฉันเป็นส่วนหนึ่งของฟังก์ชั่นการออกกำลังกายและใส่ข้อมูลของฉันได้อย่างไร อาเรย์ตัวแปรเป็นกลุ่มประชากร ... ความช่วยเหลือความคิดหรือการผลักไปในทิศทางที่ถูกต้องได้รับสุดซึ้ง ขอบคุณ รหัสที่แก้ปัญหานี้เพิ่มด้านล่างในการแก้ไขในภายหลัง # Prediction function to …

2
เปรียบเทียบสองอัลกอริทึมทางพันธุกรรม
ฉันมีการใช้งานของอัลกอริทึมทางพันธุกรรมสองอย่างซึ่งควรจะทำงานอย่างเท่าเทียมกัน อย่างไรก็ตามเนื่องจากข้อ จำกัด ทางเทคนิคที่ไม่สามารถแก้ไขผลลัพธ์ของพวกเขาไม่เหมือนกันได้รับการป้อนข้อมูลเดียวกัน ฉันยังต้องการแสดงให้เห็นว่าไม่มีความแตกต่างด้านประสิทธิภาพที่สำคัญ ฉันมีการวิ่ง 20 ครั้งโดยมีการกำหนดค่าเดียวกันสำหรับอัลกอริทึมแต่ละตัวโดยใช้การสุ่มหมายเลขเริ่มต้นแตกต่างกัน สำหรับการวิ่งและการสร้างแต่ละครั้งการออกกำลังกายข้อผิดพลาดขั้นต่ำ ของบุคคลที่ดีที่สุดในประชากรนั้นถูกบันทึกไว้ อัลกอริทึมใช้กลไกการรักษาแบบชนชั้นสูงดังนั้นความแข็งแรงของบุคคลที่ดีที่สุดจึงลดลงแบบซ้ำซาก การวิ่งประกอบด้วย 1000 รุ่นดังนั้นฉันมี 1,000 ค่าต่อการรัน ฉันไม่สามารถรับข้อมูลเพิ่มเติมได้เนื่องจากการคำนวณมีราคาแพงมาก ฉันควรใช้การทดสอบแบบไหน วิธีง่าย ๆ น่าจะเป็นการเปรียบเทียบข้อผิดพลาดในรุ่นสุดท้าย (อีกครั้งฉันจะใช้แบบทดสอบแบบใด) แต่ก็อาจคิดเปรียบเทียบพฤติกรรมการคอนเวอร์เจนซ์โดยทั่วไป
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.