คำถามติดแท็ก machine-learning

3
ระยะทางแบบยุคลิดใน Octave
ฉันอยากรู้ว่ามีวิธีที่รวดเร็วในการคำนวณระยะทางแบบยุคลิดของเวกเตอร์สองตัวใน Octave หรือไม่ ดูเหมือนว่าไม่มีฟังก์ชั่นพิเศษสำหรับสิ่งนั้นดังนั้นฉันควรใช้สูตรด้วยsqrtหรือไม่

3
Python OSS ทางเลือกสำหรับ Matlab Neural Network Toolbox มี intercomparisons ใด?
ฉันต้องการเป็นอิสระจากซอฟต์แวร์เชิงพาณิชย์สำหรับงานทางวิทยาศาสตร์ของฉัน ฉันพบว่าการพึ่งพาแพคเกจเชิงพาณิชย์เช่น Matlab และกล่องเครื่องมือของมันไม่น่าพอใจเพราะฉันไม่รู้ว่าฉันจะสามารถเข้าถึง Matlab ในอนาคตได้หรือไม่และเพราะฉันไม่ชอบภาษา ดังนั้นฉันกำลังมองหาทางเลือก โชคดีที่ฉันใช้ภาษา Python ได้อย่างคล่องแคล่ว (และฉันชอบภาษานี้) และด้วย NumPy, SciPy, Matplotlib, Basemap และ NetCDF การอ่านและการเขียนตามปกติมันตอบสนองความต้องการส่วนใหญ่ของฉันได้ ส่วนใหญ่ - ฉันยังคงกลับไปที่ Matlab เมื่อฉันต้องการฝึกการดึงข้อมูลดาวเทียมโดยใช้ตัวรับส่งข้อมูลหลายเลเยอร์เช่นฟีดใช้เครือข่ายประสาทเทียม ไม่ผิดปกติกับซอฟต์แวร์โอเพนซอร์ซมีมากกว่าหนึ่งแพ็คเกจที่ทำเครือข่ายประสาทเทียม มากกว่าหนึ่งอย่างมาก: เมื่อไม่นานมานี้ฉันลองPyBrain "มีดทหารชาวสวิสสำหรับการสร้างเครือข่ายประสาท" แต่ฉันไม่ประสบความสำเร็จในการได้รับผลลัพธ์ที่น่าพอใจในช่วงเวลาสั้น ๆ (ทั้งเวลาพัฒนาและเวลาทำงาน) บางทีฉันอาจจะพยายามไม่มากพอหรือบางทีมันอาจจะไม่ตรงกับความต้องการของฉัน เพียงแค่ตอนนี้ผมค้นพบว่ามีเป็นแพคเกจที่เรียกว่าneurolabซึ่งดูแนวโน้ม: ที่ง่ายและมีประสิทธิภาพเครือข่ายห้องสมุดประสาทสำหรับงูหลามกับAPI เช่นโครงข่ายประสาทเทียม Toolbox (NNT) จาก MATLAB มีFFnetซึ่งเป็นโซลูชั่นการฝึกอบรมเครือข่ายนิวรัลฟีดไปข้างหน้าที่ง่ายและรวดเร็วสำหรับ python มีแบบง่าย ๆ มีพีชเป็นห้องสมุดสำหรับการคำนวณทางปัญญาและการเรียนรู้ของเครื่อง มีการเชื่อมโยง Python กับFANNซึ่งเป็นไลบรารีเครือข่ายประสาทเทียมด่วนซึ่งอธิบายว่าเป็นมาตรฐานจริงในโพสต์ StackOverflowนี้ อาจมีคนอื่น ๆ …

5
ใช้ PCA กับเมทริกซ์เบาบางขนาดใหญ่มาก
ฉันกำลังทำงานจัดหมวดหมู่ข้อความด้วย R และฉันได้รับเมทริกซ์คำศัพท์เอกสารที่มีขนาด 22490 คูณ 120,000 (เฉพาะรายการที่ไม่เป็นศูนย์ 4 ล้านรายการน้อยกว่า 1%) ตอนนี้ฉันต้องการลดขนาดโดยใช้ PCA (การวิเคราะห์องค์ประกอบหลัก) น่าเสียดายที่ R ไม่สามารถจัดการเมทริกซ์ขนาดใหญ่นี้ได้ดังนั้นฉันจึงจัดเก็บเมทริกซ์แบบกระจัดกระจายในไฟล์ใน "รูปแบบตลาดเมทริกซ์" หวังว่าจะใช้เทคนิคอื่นเพื่อทำ PCA ใครก็ตามสามารถให้คำแนะนำแก่ฉันเกี่ยวกับห้องสมุดที่มีประโยชน์ (ไม่ว่าจะเป็นภาษาการเขียนโปรแกรม) ซึ่งสามารถทำ PCA กับเมทริกซ์ขนาดใหญ่นี้ได้อย่างง่ายดายหรือทำ PCA แบบยาวด้วยตัวเองในคำอื่น ๆคำนวณเมทริกซ์ความแปรปรวนร่วม แล้วคำนวณเวกเตอร์ลักษณะเฉพาะสำหรับเมทริกซ์ความแปรปรวนร่วม สิ่งที่ผมต้องการคือการคำนวณเครื่องคอมพิวเตอร์ทั้งหมด (120,000) และเลือกเฉพาะด้านบน N พีซีที่บัญชีสำหรับ 90% แปรปรวน เห็นได้ชัดว่าในกรณีนี้ฉันต้องให้ค่าเกณฑ์เบื้องต้นเพื่อตั้งค่าความแปรปรวนเล็ก ๆ ให้เป็น 0 (ในเมทริกซ์ความแปรปรวนร่วม) มิฉะนั้นเมทริกซ์ความแปรปรวนร่วมจะไม่กระจัดกระจายและขนาดจะเท่ากับ 120,000 โดย 120,000 ซึ่งเป็น เป็นไปไม่ได้ที่จะจัดการด้วยเครื่องเดียว นอกจากนี้การโหลด (eigenvectors) จะมีขนาดใหญ่มากและควรเก็บไว้ในรูปแบบเบาบาง ขอบคุณมากสำหรับความช่วยเหลือใด …

2
การคำนวณสัมประสิทธิ์ลากรองจ์สำหรับ SVM ใน Python
ฉันกำลังพยายามเขียนการใช้งานSVMแบบเต็มใน Python และฉันมีปัญหาเล็กน้อยในการคำนวณสัมประสิทธิ์ลากรองจ์ ก่อนอื่นให้ฉันใช้ถ้อยคำใหม่สิ่งที่ฉันเข้าใจจากอัลกอริทึมเพื่อให้แน่ใจว่าฉันอยู่บนเส้นทางที่ถูกต้อง ถ้าx1, x2, . . . , xnx1,x2,...,xnx_1, x_2, ..., x_nเป็นชุดข้อมูลและYผม∈ { - 1 , 1 }yi∈{−1,1}y_i \in \{-1, 1\}เป็นคลาสป้ายกำกับของxผมxix_iจากนั้น∀ i , yผม( ด้วยTxผม+ b ) ≥ 1∀i,yi(wTxi+b)≥1\forall i, y_i(w^Tx_i + b) \geq 1 ดังนั้นเราเพียงแค่ต้องแก้ปัญหาการเพิ่มประสิทธิภาพให้ ∥ w ∥2‖w‖2\|w\|^2 ขึ้นอยู่กับYผม( ด้วยTxผม+ b ) ≥ 1yi(wTxi+b)≥1y_i(w^Tx_i + b) \geq …

2
เมทริกซ์เคอร์เนล RBF มีแนวโน้มว่าจะไม่ดีหรือไม่?
ฉันใช้ฟังก์ชั่นเคอร์เนล RBF เพื่อใช้อัลกอริทึมการเรียนรู้ของเคอร์เนล (KLPP) หนึ่งตัวเคอร์เนลผลลัพธ์ แสดงว่ามีสภาพที่ไม่ดีอย่างยิ่งจำนวนเงื่อนไขของ L2-norm มาKKK K( i , j ) = exp(- (xผม-xJ)2σ2ม.)K(i,j)=exp⁡(−(xi−xj)2σm2)K(i,j)= \exp\left({\frac{-(x_{i}-x_{j})^2}{ \sigma_{m}^2}}\right)1017-10641017−106410^{17}-10^{64} มีวิธีใดบ้างที่จะทำให้ห้องปรับอากาศมีสภาพดี? ฉันเดาว่าต้องมีการปรับพารามิเตอร์แต่ฉันไม่ทราบว่าจะต้องทำอย่างไรσσ \sigma ขอบคุณ!

2
การใช้การเรียนรู้ของเครื่องในการคำนวณพลศาสตร์ของไหล
ความเป็นมา: ฉันได้สร้างโซลูชันตัวเลขที่ใช้งานได้หนึ่งตัวสำหรับ Navier-Stokes 2d เท่านั้นสำหรับหลักสูตร มันเป็นทางออกสำหรับการไหลของโพรงที่ขับเคลื่อนด้วยฝา อย่างไรก็ตามหลักสูตรดังกล่าวได้พูดคุยเกี่ยวกับสกีมาจำนวนหนึ่งสำหรับการแยกเชิงพื้นที่และการแยกเวลา ฉันใช้หลักสูตรการจัดการสัญลักษณ์มากขึ้นที่นำไปใช้กับ NS ด้วย แนวทางตัวเลขเพื่อจัดการการแปลงสมการวิเคราะห์ / สัญลักษณ์จาก PDE เป็นผลต่างที่แน่นอน ได้แก่ : ออยเลอร์ FTFS, FTCS, BTCS หละหลวม การเล่นต้องเตจุดกึ่งกลาง หละหลวม-Wendroff MacCormack ออฟเซ็ตกริด (การกระจายเชิงพื้นที่ช่วยให้ข้อมูลสามารถแพร่กระจายได้) TVD สำหรับฉันในเวลาเหล่านี้ดูเหมือนว่า "ชื่อแทรกพบรูปแบบและมันเกิดขึ้นในการทำงาน" หลายสิ่งเหล่านี้มาจากก่อนเวลา "ซิลิคอนที่อุดมสมบูรณ์" พวกเขาทั้งหมดประมาณ ในวงเงินที่พวกเขา ในทางทฤษฎีนำไปสู่การ PDE ในขณะที่ Direct Numerical Simulation ( DNS ) คือความสนุกและ Reynolds Averaged Navier-Stokes ( RANS ) …

2
ทำนายค่ารันไทม์ของพีชคณิตเชิงเส้นหนาแน่น
ฉันต้องการทำนาย runtimes สำหรับการดำเนินการพีชคณิตเชิงเส้นหนาแน่นบนสถาปัตยกรรมเฉพาะโดยใช้ไลบรารีเฉพาะ ฉันต้องการเรียนรู้รูปแบบที่ใกล้เคียงกับฟังก์ชั่น Fo หน้า: :Fop::F_{op} \;::\; ขนาดอินพุต→→ \rightarrow รันไทม์ สำหรับการดำเนินการเช่นเมทริกซ์ทวีคูณการเพิ่มองค์ประกอบที่ชาญฉลาดการแก้ปัญหารูปสามเหลี่ยม ฯลฯ ฉันสงสัยว่า runtimes เหล่านี้ส่วนใหญ่สามารถคาดการณ์ได้เนื่องจากความสม่ำเสมอของการทำงานเมื่อคุณมีขนาดเกินกว่าปัญหาที่พอดีกับแคช คำถาม: สมมติฐานนี้เป็นจริงหรือไม่? ฟังก์ชั่นรันไทม์มีแนวโน้มที่จะเกือบจะกำหนด? ฉันสามารถสันนิษฐานได้ว่าฟังก์ชั่นนี้จะเป็นพหุนามในขนาดของอินพุตหรือไม่ (เช่นฉันคาดหวังเมทริกซ์หนาแน่นคูณให้มีลักษณะเหมือนα n × k × mαn×k×m\alpha n\times k\times m สำหรับ An k×Bk เมตรAnk×BkmA_{nk}\times B_{km} และ αα\alpha ค่าสัมประสิทธิ์สเกลาร์บางค่า) มีงานก่อนหน้านี้ที่นี่ไหม? แผนปัจจุบันของฉันคือทำสี่เหลี่ยมกำลังถดถอยอย่างน้อย L1L1L_1regularizer ข้อเสนอแนะอื่น ๆ ? แก้ไข: เพื่อความชัดเจนฉันกำลังมองหา runtimes ไม่ใช่ FLOPs หรือตัวชี้วัดประสิทธิภาพทั่วไปอื่น ๆ …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.