คำถามติดแท็ก tensorflow

TensorFlow เป็นไลบรารีโอเพนซอร์ซสำหรับการเรียนรู้ของเครื่องและความฉลาดของเครื่องจักร TensorFlow ใช้กราฟการไหลของข้อมูลที่มีเทนเซอร์ไหลไปตามขอบ สำหรับรายละเอียดโปรดดู https://www.tensorflow.org TensorFlow เผยแพร่ภายใต้ Apache 2.0 License

1
ทำไม TensorFlow ไม่พอดีกับโมเดลเชิงเส้นอย่างง่ายถ้าฉันลดข้อผิดพลาดค่าเฉลี่ยสัมบูรณ์แทนข้อผิดพลาดกำลังสองเฉลี่ย?
ในบทนำฉันเพิ่งจะเปลี่ยน loss = tf.reduce_mean(tf.square(y - y_data)) ถึง loss = tf.reduce_mean(tf.abs(y - y_data)) และโมเดลไม่สามารถเรียนรู้การสูญเสียที่ยิ่งใหญ่ขึ้นตามกาลเวลา ทำไม?

1
ทำไมโมเดล Keras ของฉันเรียนรู้ที่จะจำพื้นหลัง
ฉันพยายามฝึกอบรมการใช้งาน Keras ของ Deeplabv3 +บน Pascal VOC2012 โดยใช้แบบจำลองที่ได้รับการฝึกอบรม (ซึ่งได้รับการฝึกฝนในชุดข้อมูลนั้นด้วย) ฉันได้ผลลัพธ์แปลก ๆ ด้วยความแม่นยำที่บรรจบกันอย่างรวดเร็วเป็น 1.0: 5/5 [==============================] - 182s 36s/step - loss: 26864.4418 - acc: 0.7669 - val_loss: 19385.8555 - val_acc: 0.4818 Epoch 2/3 5/5 [==============================] - 77s 15s/step - loss: 42117.3555 - acc: 0.9815 - val_loss: 69088.5469 - val_acc: 0.9948 Epoch …

2
ทำไมอัตราการเรียนรู้ทำให้น้ำหนักของเครือข่ายประสาทเทียมสูงขึ้น?
ฉันใช้เทนเซอร์โฟลว์เพื่อเขียนโครงข่ายประสาทอย่างง่ายสำหรับการวิจัยนิดหน่อยและฉันมีปัญหามากมายเกี่ยวกับน้ำหนักของ 'น่าน' ในขณะฝึกอบรม ฉันลองวิธีแก้ไขปัญหาที่แตกต่างกันมากมายเช่นการเปลี่ยนเครื่องมือเพิ่มประสิทธิภาพการเปลี่ยนแปลงการสูญเสียขนาดข้อมูลเป็นต้น แต่ไม่มีประโยชน์ ในที่สุดฉันสังเกตเห็นว่าการเปลี่ยนแปลงของอัตราการเรียนรู้ทำให้น้ำหนักของฉันแตกต่างอย่างไม่น่าเชื่อ ใช้อัตราการเรียนรู้. 001 (ซึ่งฉันคิดว่าค่อนข้างอนุรักษ์นิยม) ฟังก์ชั่นย่อเล็กสุดจะเพิ่มความสูญเสียอย่างมาก หลังจากยุคหนึ่งความสูญเสียอาจเพิ่มขึ้นจากจำนวนในหลักพันไปเป็นล้านล้านและจากนั้นไปสู่อนันต์ ('น่าน') เมื่อฉันลดอัตราการเรียนรู้เป็น. 0001 ทุกอย่างก็ใช้ได้ดี 1) เหตุใดลำดับความสำคัญเดียวจึงมีผลเช่นนี้? 2) ทำไมฟังก์ชั่นย่อเล็กสุดทำหน้าที่ตรงข้ามกับฟังก์ชั่นของมันและเพิ่มการสูญเสียสูงสุด? สำหรับฉันแล้วดูเหมือนว่าจะไม่เกิดขึ้นไม่ว่าจะเรียนรู้อะไรก็ตาม

2
ข้อผิดพลาดของหน่วยความจำเมื่อใช้เลเยอร์เพิ่มเติมในรุ่น CNN
ใน dell core i7 ของฉัน - RAM 16GB - แล็ปท็อป GPU ความจุ 4 ล้าน 960m ฉันกำลังทำงานในโครงการเพื่อจัดประเภทภาพปอด CT โดยใช้ 3d CNN ฉันใช้ซีพียูรุ่น tensorflow ภาพถูกจัดทำขึ้นเป็นขนาดอาร์เรย์แบบ numpy (25,50,50) โมเดล CNN ของฉันมี 2 Conv ชั้น, maxpool สองชั้น, หนึ่งชั้น FC และชั้นผลลัพธ์ ด้วยสถาปัตยกรรมนี้ฉันสามารถฝึกฝนโมเดลด้วยตัวอย่างประมาณ (5,000 ถึง 6,000) หลังจากเพิ่มเลเยอร์มากขึ้นแบบจำลองของฉันตอนนี้มีชั้นความเชื่อมั่น 6 ชั้น, เลเยอร์พูลสูงสุด 3 ชั้น, FC และชั้นผลลัพธ์ ปัญหาของฉันคือหลังจากเปลี่ยนสถาปัตยกรรมที่มีตัวอย่างมากกว่า 1,000 …

2
ควรใช้ sklearn หรือ tensorflow สำหรับเครือข่ายประสาท
ฉันเพิ่งเริ่มเรียนรู้ Neural Networks สำหรับการเรียนรู้อย่างลึกซึ้งจาก cs231 ฉันพยายามใช้ Neural Network ใน Python ฉันกำลังดูที่ใช้ Tensorflow หรือ scikit-learn ข้อดีและข้อเสียของห้องสมุดเหล่านี้สำหรับแอปพลิเคชันนี้คืออะไร
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.