คำถามติดแท็ก machine-learning

สำหรับคำถามที่เกี่ยวข้องกับการเรียนรู้ของเครื่องจักร (ML) ซึ่งเป็นชุดของวิธีการที่สามารถตรวจจับรูปแบบข้อมูลโดยอัตโนมัติแล้วใช้รูปแบบที่ไม่เปิดเผยเพื่อคาดการณ์ข้อมูลในอนาคตหรือทำการตัดสินใจประเภทอื่น ๆ ภายใต้ความไม่แน่นอน (เช่นการวางแผน เพื่อรวบรวมข้อมูลเพิ่มเติม) ML มักจะถูกแบ่งออกเป็นการเรียนรู้แบบมีผู้สอนไม่มีผู้ดูแลและเสริมกำลัง การเรียนรู้อย่างลึกซึ้งเป็นส่วนย่อยของ ML ที่ใช้โครงข่ายประสาทเทียมแบบลึก

17
ความแตกต่างระหว่างปัญญาประดิษฐ์กับการเรียนรู้ของเครื่องคืออะไร?
คำสองคำนี้มีความเกี่ยวข้องโดยเฉพาะอย่างยิ่งในการประยุกต์ใช้ในสาขาวิทยาศาสตร์คอมพิวเตอร์และวิศวกรรมซอฟต์แวร์ เป็นเซตย่อยของอีกชุดหรือไม่? เป็นเครื่องมือหนึ่งที่ใช้ในการสร้างระบบให้กับอีกระบบหนึ่งหรือไม่? ความแตกต่างของพวกเขาคืออะไรและทำไมพวกเขาถึงสำคัญ?

8
ทำไม Python เป็นภาษายอดนิยมในฟิลด์ AI
ก่อนอื่นฉันเป็นมือใหม่ที่เรียน AI และนี่ไม่ใช่คำถามเชิงความคิดเห็นหรือคำถามเพื่อเปรียบเทียบภาษาการเขียนโปรแกรม ฉันไม่ได้พูดว่านั่นเป็นภาษาที่ดีที่สุด แต่ความจริงก็คือกรอบ AI ที่มีชื่อเสียงส่วนใหญ่มีการสนับสนุนหลักสำหรับ Python พวกเขาสามารถรองรับหลายภาษาเช่น TensorFlow ที่รองรับ Python, C ++ หรือ CNTK จาก Microsoft ที่สนับสนุน C # และ C ++ แต่ที่ใช้มากที่สุดคือ Python (ฉันหมายถึงเอกสารเพิ่มเติมตัวอย่างชุมชนที่ใหญ่กว่าการสนับสนุน ฯลฯ ) แม้ว่าคุณจะเลือก C # (พัฒนาโดย Microsoft และภาษาการเขียนโปรแกรมหลักของฉัน) คุณต้องมีการตั้งค่าสภาพแวดล้อม Python ฉันอ่านในฟอรั่มอื่น ๆ ว่า Python เหมาะสำหรับ AI เพราะรหัสนั้นง่ายและสะอาดขึ้นเหมาะสำหรับการสร้างต้นแบบอย่างรวดเร็ว ฉันกำลังดูภาพยนตร์ที่มีเนื้อหา AI (Ex_Machina) ในบางฉากตัวละครหลักจะแฮ็กอินเทอร์เฟซของระบบอัตโนมัติในบ้าน เดาภาษาใดในฉากนี้? หลาม …

3
เครือข่ายประสาทสามารถจัดการกับขนาดอินพุตที่แตกต่างกันอย่างไร
เท่าที่ฉันจะบอกได้เครือข่ายประสาทมีจำนวนเซลล์ประสาทคงที่ในชั้นข้อมูลเข้า หากใช้โครงข่ายประสาทในบริบทเช่น NLP ประโยคหรือบล็อกข้อความที่มีขนาดแตกต่างกันจะถูกป้อนเข้าเครือข่าย ขนาดอินพุตที่แตกต่างกันอย่างไรจะกระทบยอดกับขนาดคงที่ของเลเยอร์อินพุตของเครือข่าย กล่าวอีกนัยหนึ่งเครือข่ายเช่นนี้มีความยืดหยุ่นเพียงพอที่จะจัดการกับอินพุตที่อาจอยู่ที่ใดก็ได้ตั้งแต่หนึ่งคำไปจนถึงหลายหน้าของข้อความ หากสมมติฐานของฉันเกี่ยวกับจำนวนเซลล์ประสาทนำเข้าที่กำหนดไม่ถูกต้องและมีการเพิ่มเซลล์ประสาทขาเข้าใหม่เข้า / ออกจากเครือข่ายเพื่อให้ตรงกับขนาดอินพุตฉันไม่เห็นว่าจะสามารถฝึกอบรมสิ่งเหล่านี้ได้อย่างไร ฉันยกตัวอย่าง NLP แต่ปัญหามากมายมีขนาดอินพุตที่คาดเดาไม่ได้ ฉันสนใจวิธีการทั่วไปในการจัดการกับสิ่งนี้ สำหรับรูปภาพมันชัดเจนว่าคุณสามารถขึ้น / ลงตัวอย่างเป็นขนาดคงที่ แต่สำหรับข้อความดูเหมือนว่าจะเป็นวิธีที่เป็นไปไม่ได้เนื่องจากการเพิ่ม / ลบข้อความเปลี่ยนความหมายของอินพุตต้นฉบับ

4
เครือข่ายประสาทมีแนวโน้มที่จะลืมความหายนะหรือไม่?
ลองนึกภาพคุณแสดงภาพสิงโตที่มีโครงข่ายประสาทเป็น 100 เท่าและติดป้ายว่า "อันตราย" ดังนั้นมันจึงเรียนรู้ว่าสิงโตนั้นมีอันตราย ทีนี้ลองนึกภาพว่าก่อนหน้านี้คุณได้แสดงภาพสิงโตจำนวนหลายล้านภาพและระบุว่ามันเป็น "อันตราย" และ "ไม่อันตราย" ดังนั้นความน่าจะเป็นที่สิงโตจะเป็นอันตราย 50% แต่ในช่วง 100 ครั้งที่ผ่านมาได้ผลักเครือข่ายประสาทเทียมให้เป็นบวกมากเกี่ยวกับสิงโตว่า "อันตราย" จึงเพิกเฉยต่อบทเรียนล้านครั้งสุดท้าย ดังนั้นจึงดูเหมือนว่ามีข้อบกพร่องในเครือข่ายประสาทในการที่พวกเขาสามารถเปลี่ยนความคิดของพวกเขาเร็วเกินไปจากหลักฐานล่าสุด โดยเฉพาะอย่างยิ่งหากหลักฐานก่อนหน้านั้นอยู่ตรงกลาง มีโมเดลโครงข่ายประสาทเทียมที่ติดตามหลักฐานว่ามีการเห็นมากแค่ไหน? (หรือนี่จะเท่ากับการปล่อยให้อัตราการเรียนรู้ลดลง1/T1/T1/Tโดยที่TTTคือจำนวนการทดลอง)

3
เหตุใด Lisp จึงเป็นภาษาที่ดีสำหรับ AI
ฉันเคยได้ยินมาก่อนจากนักวิทยาศาสตร์คอมพิวเตอร์และนักวิจัยในพื้นที่ของ AI ว่า Lisp เป็นภาษาที่ดีสำหรับการวิจัยและพัฒนาปัญญาประดิษฐ์ สิ่งนี้ยังใช้ได้หรือไม่กับการเพิ่มจำนวนของโครงข่ายประสาทและการเรียนรู้ที่ลึก อะไรคือเหตุผลของพวกเขาสำหรับเรื่องนี้? ระบบการเรียนรู้แบบลึกในปัจจุบันมีภาษาอะไรในปัจจุบัน

4
วิธีการเลือกจำนวนเลเยอร์ที่ซ่อนอยู่และจำนวนของเซลล์หน่วยความจำใน LSTM
ฉันกำลังพยายามหางานวิจัยที่มีอยู่เกี่ยวกับวิธีเลือกจำนวนเลเยอร์ที่ซ่อนอยู่และขนาดของ RNN ที่ใช้ LSTM มีบทความที่ตรวจสอบปัญหานี้หรือไม่เช่นเซลล์หน่วยความจำควรใช้เท่าไร? ฉันคิดว่ามันทั้งหมดขึ้นอยู่กับแอปพลิเคชันและในบริบทที่มีการใช้แบบจำลอง แต่งานวิจัยบอกว่าอย่างไร

2
โครงข่ายประสาทลึกนั้นแตกต่างจากโครงข่ายประสาทอื่นอย่างไร
เครือข่ายประสาทเทียมมีคำคุณศัพท์ที่ "ลึก" แตกต่างจากเครือข่ายอื่นที่คล้ายคลึงกันอย่างไร

2
เป็นไปได้ไหมที่จะฝึกโครงข่ายประสาทแบบเพิ่มหน่วย?
ฉันต้องการฝึกโครงข่ายประสาทเทียมที่คลาสเอาต์พุตไม่ได้ถูกกำหนดไว้ตั้งแต่ต้น คลาสที่มากขึ้นจะถูกนำมาใช้ในภายหลังตามข้อมูลที่เข้ามา ซึ่งหมายความว่าทุกครั้งที่ฉันแนะนำคลาสใหม่ฉันจะต้องฝึกฝน NN ใหม่ ฉันจะฝึกอบรม NN แบบเพิ่มหน่วยได้นั่นคือโดยไม่ลืมข้อมูลที่ได้มาก่อนหน้านี้ในระหว่างขั้นตอนการฝึกอบรมครั้งก่อน


4
จะจัดการกับการเคลื่อนไหวที่ไม่ถูกต้องในการเรียนรู้การเสริมแรงได้อย่างไร?
ฉันต้องการสร้าง AI ซึ่งสามารถเล่นห้าในแถว / gomoku ดังที่ฉันพูดถึงในชื่อเรื่องฉันต้องการใช้การเรียนรู้เสริมแรงสำหรับสิ่งนี้ ฉันใช้วิธีการไล่ระดับสีนโยบายคือ REINFORCE ที่มีพื้นฐาน สำหรับการประมาณค่าและนโยบายการทำงานของผมใช้โครงข่ายประสาทเทียม มันมีเลเยอร์ convolutional และเชื่อมต่ออย่างเต็มที่ เลเยอร์ทั้งหมดยกเว้นการส่งออกจะถูกแชร์ ชั้นผลผลิตของนโยบายมี8 × 8 = 648×8=648 \times 8=64 (ขนาดของคณะกรรมการ) หน่วยส่งออกและsoftmaxกับพวกเขา ดังนั้นมันจึงสุ่ม แต่ถ้าเครือข่ายสร้างความน่าจะเป็นสูงมากสำหรับการย้ายที่ไม่ถูกต้อง การย้ายที่ไม่ถูกต้องคือเมื่อตัวแทนต้องการตรวจสอบสี่เหลี่ยมที่มีหนึ่ง "X" หรือ "O" ฉันคิดว่ามันสามารถติดอยู่ในสถานะเกมนั้น คุณช่วยแนะนำวิธีแก้ปัญหาสำหรับปัญหานี้ได้ไหม? ฉันเดาว่าจะใช้วิธีการของนักวิจารณ์ สำหรับการย้ายที่ไม่ถูกต้องเราควรให้รางวัลเป็นค่าลบและส่งต่อให้ฝ่ายตรงข้าม

7
หากค่าดิจิตอลเป็นเพียงการประมาณการทำไมไม่กลับไปใช้อะนาล็อกสำหรับ AI
แรงผลักดันที่อยู่เบื้องหลังการเปลี่ยนศตวรรษที่ยี่สิบจากอนาล็อกเป็นวงจรดิจิตอลขับเคลื่อนด้วยความต้องการความแม่นยำและเสียงรบกวนที่ต่ำกว่า ตอนนี้เรากำลังพัฒนาซอฟต์แวร์ซึ่งผลลัพธ์เป็นค่าประมาณและเสียงรบกวนมีค่าเป็นบวก ในเครือข่ายประดิษฐ์เราใช้การไล่ระดับสี (จาโคเบียน) หรือแบบจำลองระดับที่สอง (Hessian) เพื่อประเมินขั้นตอนถัดไปในอัลกอริธึมคอนเวอร์เจนซ์และกำหนดระดับที่ไม่ถูกต้องและสงสัย 1 ในกลยุทธ์การคอนเวอร์เจนซ์เราจงใจเพิ่มเสียงรบกวนโดยการฉีดการรบกวนแบบสุ่มหรือการหลอกแบบสุ่มเพื่อปรับปรุงความน่าเชื่อถือโดยการกระโดดข้ามมินิมาในพื้นที่ผิวการปรับให้เหมาะสมระหว่างการคอนเวอร์เจนซ์ 2 สิ่งที่เรายอมรับและแนะนำโดยเจตนาในระบบ AI ปัจจุบันคือสิ่งเดียวกันกับที่ผลักอิเล็กทรอนิกส์ไปสู่วงจรดิจิตอล ทำไมไม่กลับไปใช้วงจรอะนาล็อกสำหรับอวนประสาทและนำไปใช้กับเมทริกซ์แอมพลิฟายเออร์แทนเมทริกซ์ขององค์ประกอบการประมวลผลสัญญาณดิจิตอล ค่าของพารามิเตอร์การเรียนรู้เครือข่ายประดิษฐ์สามารถคงไว้ได้โดยใช้ตัวเก็บประจุแบบรวมที่ชาร์จผ่านตัวแปลง D-to-A ซึ่งรัฐที่เรียนรู้จะได้รับประโยชน์จากความแม่นยำแบบดิจิตอลและความสะดวกสบายในขณะเดียวกัน ความเร็วที่มากกว่า3 คำสั่งของขนาดทรานซิสเตอร์น้อยลงเพื่อแสดงเซลล์เครือข่าย เสียงความร้อนตามธรรมชาติ4 บทความวิชาการหรือการค้นหาสิทธิบัตรสำหรับเครือข่ายประดิษฐ์แบบอะนาล็อกเผยให้เห็นงานจำนวนมากในช่วงสี่สิบปีที่ผ่านมาและแนวโน้มการวิจัยได้รับการปรับปรุง วงจรอนาล็อกเชิงคำนวณได้รับการพัฒนามาอย่างดีและให้พื้นฐานสำหรับอาร์เรย์ประสาท ความลุ่มหลงในปัจจุบันด้วยการคำนวณแบบดิจิตอลอาจทำให้มุมมองทั่วไปของตัวเลือกสถาปัตยกรรม AI สับสนหรือไม่? ไฮบริดแอนะล็อกเป็นสถาปัตยกรรมที่เหนือกว่าสำหรับเครือข่ายประดิษฐ์หรือไม่? เชิงอรรถ [1] PAC (อาจจะถูกต้องโดยประมาณ) การเรียนรู้กรอบเกี่ยวข้องกับข้อผิดพลาดที่ยอมรับεε\epsilonและไม่ต้องสงสัยยอมรับδδ\deltaขนาดตัวอย่างที่จำเป็นสำหรับการเรียนรู้สำหรับประเภทรูปแบบเฉพาะ (โปรดทราบว่า1 - ϵ1-ε1 - \epsilonหมายถึงความถูกต้องและ1 - δ1-δ1 - \deltaหมายถึงความมั่นใจในกรอบนี้) [2] Stochastic gradient descent จะแสดงขึ้นเมื่อมีการใช้กลยุทธ์ที่เหมาะสมและใช้พารามิเตอร์มากเกินไปเพื่อรวมเข้าด้วยกันอย่างรวดเร็วยิ่งขึ้นในระหว่างการเรียนรู้ [3] โปรเซสเซอร์ Intel Core i9-7960X …

3
ทำความเข้าใจกับฟังก์ชั่นการสูญเสียของ GAN
ฉันกำลังพยายามทำความเข้าใจเกี่ยวกับฟังก์ชั่นการสูญเสีย GAN ตามที่ระบุไว้ในการทำความเข้าใจกับเครือข่ายผู้ให้คำปรึกษาทั่วไป (โพสต์บล็อกที่เขียนโดย Daniel Seita) ในการสูญเสียข้ามเอนโทรปีมาตรฐานเรามีเอาต์พุตที่ทำงานผ่านฟังก์ชั่น sigmoid และการจำแนกเลขฐานสองเป็นผลลัพธ์ เซียต้าระบุ ดังนั้นสำหรับ [แต่ละจุดข้อมูลและป้ายกำกับเราจะได้ฟังก์ชันการสูญเสียต่อไปนี้ ...x1x1x_1 H( ( x1, y1) , D ) = - y1เข้าสู่ระบบD ( x1) - ( 1 - y1) บันทึก( 1 - D ( x1) )H((x1,Y1),D)=-Y1เข้าสู่ระบบ⁡D(x1)-(1-Y1)เข้าสู่ระบบ⁡(1-D(x1)) H((x_1, y_1), D) = -y_1 \log D(x_1) - (1 - y_1) \log (1 …

1
ความแตกต่างระหว่างเทคนิคการ backpropagation
เพื่อความสนุกฉันพยายามพัฒนาโครงข่ายประสาทเทียม ตอนนี้สำหรับ backpropagation ฉันเห็นสองเทคนิค ตัวแรกใช้ที่นี่และที่อื่น ๆ อีกมากมาย มันคืออะไร: มันคำนวณข้อผิดพลาดสำหรับแต่ละเซลล์ประสาทออก มัน backpropates มันลงในเครือข่าย (การคำนวณข้อผิดพลาดสำหรับแต่ละเซลล์ประสาทภายใน) มันอัปเดตน้ำหนักด้วยสูตร: (ซึ่งการเปลี่ยนแปลงของน้ำหนัก, ความเร็วในการเรียนรู้, ข้อผิดพลาดของเซลล์ประสาทที่รับอินพุตจากไซแนปส์และเป็นเอาต์พุตที่ส่งในไซแนปส์) มันซ้ำสำหรับแต่ละรายการของชุดข้อมูลหลาย ๆ ครั้งตามที่ต้องการ อย่างไรก็ตามเครือข่ายประสาทที่เสนอในบทช่วยสอนนี้ (มีอยู่ใน GitHub ด้วย) ใช้เทคนิคที่แตกต่าง: มันใช้ฟังก์ชั่นข้อผิดพลาด (วิธีอื่นไม่มีฟังก์ชั่นข้อผิดพลาด แต่ไม่ได้ใช้สำหรับการฝึกอบรม) มันมีฟังก์ชั่นอื่นที่สามารถคำนวณข้อผิดพลาดสุดท้ายที่เริ่มต้นจากน้ำหนัก มันลดฟังก์ชั่นนั้น (ผ่านทางลาดลง) ตอนนี้ควรใช้วิธีใด ฉันคิดว่าอันแรกเป็นอันที่ใช้บ่อยที่สุด (เพราะฉันเห็นตัวอย่างที่แตกต่างจากการใช้มัน) แต่มันก็ใช้ได้ดีเช่นกัน? โดยเฉพาะอย่างยิ่งฉันไม่รู้: มันขึ้นอยู่กับค่าต่ำสุดในท้องถิ่น (เนื่องจากไม่ได้ใช้ฟังก์ชั่นสมการกำลังสอง)? เนื่องจากความแปรผันของน้ำหนักแต่ละตัวนั้นได้รับอิทธิพลจากค่าเอาท์พุทของเซลล์ประสาทเอาท์พุทของมันไม่ใช่รายการของชุดข้อมูลที่เพิ่งเกิดขึ้นเพื่อสร้างค่าที่สูงขึ้นในเซลล์ประสาท ตอนนี้ฉันชอบเทคนิคแรกเพราะฉันคิดว่ามันง่ายกว่าในการนำไปใช้และคิดง่ายกว่า แม้ว่าหากมีปัญหาที่ฉันกล่าวถึง (ซึ่งฉันหวังว่าจะไม่) มีเหตุผลจริงที่จะใช้มันมากกว่าวิธีที่สอง?

3
ความซับซ้อนของเวลาสำหรับการฝึกอบรมเครือข่ายประสาทเทียมโดยใช้การเผยแพร่กลับเป็นอย่างไร
สมมติว่ามี NN nnnชั้นซ่อนmmmตัวอย่างการฝึกอบรมxxxคุณสมบัติและninin_iโหนดในแต่ละชั้น ความซับซ้อนของเวลาในการฝึกอบรม NN นี้โดยใช้การเผยแพร่กลับเป็นอย่างไร ฉันมีความคิดพื้นฐานเกี่ยวกับวิธีที่พวกเขาค้นหาความซับซ้อนของเวลาของอัลกอริทึม แต่ที่นี่มีปัจจัยต่าง ๆ 4 ข้อที่ต้องพิจารณาที่นี่เช่นการทำซ้ำเลเยอร์โหนดในแต่ละชั้นตัวอย่างการฝึกอบรมและปัจจัยอื่น ๆ ฉันพบคำตอบที่นี่แต่มันไม่ชัดเจนพอ มีปัจจัยอื่น ๆ นอกเหนือจากที่ฉันได้กล่าวถึงข้างต้นหรือไม่ที่มีอิทธิพลต่อความซับซ้อนของเวลาในการฝึกอัลกอริทึมของ NN?

1
เครื่องมือค้นหาถือว่าเป็น AI หรือไม่
เครื่องมือค้นหาได้รับการพิจารณา AI เนื่องจากวิธีที่พวกเขาวิเคราะห์สิ่งที่คุณค้นหาและจดจำหรือไม่ หรือพวกเขาส่งโฆษณาถึงสิ่งที่คุณค้นหาเมื่อเร็ว ๆ นี้ นี่ถือว่าเป็น AI หรือฉลาดแค่ไหน?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.