คำถามติดแท็ก machine-learning

คำถามเกี่ยวกับอัลกอริทึมของคอมพิวเตอร์ที่ค้นพบรูปแบบข้อมูลโดยอัตโนมัติและทำการตัดสินใจที่ดีตามพวกเขา

1
ใครเป็นคนบัญญัติศัพท์คำว่า“ การเรียนรู้ของเครื่อง”?
ฉันพยายามที่จะคิดออกว่าใครเป็นคนบัญญัติศัพท์คำว่า "การเรียนรู้ของเครื่อง" คำถามขึ้นอยู่กับว่าอาร์เธอร์ซามูเอลอ้างถึงการกำหนดเขตข้อมูลของ "การเรียนรู้ของเครื่อง" ในปี 1959 เป็น: สาขาวิชาที่ให้คอมพิวเตอร์สามารถเรียนรู้ได้โดยไม่ต้องตั้งโปรแกรมอย่างชัดเจน ? คุณสามารถค้นหาการอ้างอิงจำนวนมากตามคำจำกัดความนี้บนอินเทอร์เน็ตได้ แต่ฉันไม่สามารถติดตามแหล่งที่มาได้ บางคนให้มันเป็นกระดาษ 1959 ของเขาบนตัวตรวจสอบแต่ฉันไม่พบคำนิยามดังกล่าวที่นั่น

3
เส้นแบ่งคะแนนสองชุด
หากมีวิธีการระบุว่าจุดสองชุดสามารถคั่นด้วยเส้นได้หรือไม่? เรามีสองชุดของจุดAAAและBBBหากมีเส้นที่แยกAAAและBBBเช่นนั้นจุดทั้งหมดของAAAและเท่านั้นAAAที่ด้านหนึ่งของเส้นและจุดทั้งหมดของBBBและเพียงBBBด้านอื่น ๆ อัลกอริธึมที่ไร้เดียงสาที่สุดที่ฉันพบคือการสร้างรูปหลายเหลี่ยมนูนสำหรับAAAและBBBและทดสอบเพื่อหาจุดตัด ดูเวลาที่ความซับซ้อนของเวลาสำหรับสิ่งนี้ควรเป็นO(nlogh)O(nlog⁡h)O(n\log h)สำหรับการสร้างรูปหลายเหลี่ยมนูน จริงๆแล้วฉันไม่ได้คาดหวังการปรับปรุงใด ๆ ในเรื่องความซับซ้อนของเวลาฉันไม่แน่ใจว่ามันจะสามารถปรับปรุงได้เลย แต่อย่างน้อยก็ควรมีวิธีที่สวยงามกว่านี้ในการพิจารณาว่ามีเส้นดังกล่าวหรือไม่

1
การคำนวณอย่างมีประสิทธิภาพหรือใกล้เคียงกับมิติ VC ของเครือข่ายประสาทเทียม
เป้าหมายของฉันคือการแก้ปัญหาต่อไปนี้ซึ่งฉันได้อธิบายไว้โดยอินพุตและเอาต์พุต: การป้อนข้อมูล: กราฟรอบทิศทางกับโหนดm , แหล่งที่มาnและ1อ่างล้างจาน ( m > n ≥ 1 )GGGม.ม.mnnn111m > n ≥ 1ม.>n≥1m > n \geq 1 เอาท์พุท: VC-มิติ (หรือประมาณของมัน) สำหรับเครือข่ายประสาทกับโครงสร้างGGGG เฉพาะเจาะจงมากขึ้น : แต่ละโหนดในเป็นเซลล์ประสาท sigmoid โทโพโลยีได้รับการแก้ไขแล้ว แต่น้ำหนักบนขอบสามารถเปลี่ยนแปลงได้โดยอัลกอริทึมการเรียนรู้GGG อัลกอริทึมการเรียนรู้ได้รับการแก้ไข (พูดการถ่ายทอดย้อนกลับ) โหนดต้นทางเซลล์ป้อนข้อมูลและสามารถใช้สตริงจาก{ - 1 , 1 } nเป็น inputnnn{ - 1 , 1 }n{-1,1}n\{-1,1\}^n โหนด sink เป็นหน่วยเอาต์พุต มันออกค่าจริงจากที่เรารอบขึ้นไป1หรือลงเพื่อ- 1ถ้ามันเป็นมากกว่าเกณฑ์บางอย่างคงที่δห่างจาก0[ …

1
Perceptron สามารถลืมได้หรือไม่?
ฉันต้องการสร้างระบบการเรียนรู้ด้วยเครื่องบนเว็บออนไลน์ที่ผู้ใช้สามารถเพิ่มตัวอย่างที่เป็นความลับได้อย่างต่อเนื่องและมีรูปแบบการอัพเดทออนไลน์ ฉันต้องการใช้ perceptron หรืออัลกอริทึมการเรียนรู้ออนไลน์ที่คล้ายกัน แต่ผู้ใช้อาจทำผิดพลาดและแทรกตัวอย่างที่ไม่เกี่ยวข้อง ในกรณีนี้ฉันต้องการให้ตัวเลือกในการลบตัวอย่างที่เฉพาะเจาะจงโดยไม่ต้องฝึก perceptron อีกครั้งในตัวอย่างทั้งหมด (ซึ่งอาจมีขนาดใหญ่มาก) เป็นไปได้ไหม

2
เครือข่ายประสาทต้องมาบรรจบกันเสมอหรือไม่
บทนำ ขั้นตอนแรก ฉันเขียนเครือข่ายนิวรัล backpropegating และเพื่อทดสอบฉันตัดสินใจที่จะทำแผนที่ XOR เป็นเครือข่าย 2-2-1 (พร้อมฟังก์ชั่นเปิดใช้ tanh) X1 M1 O1 X2 M2 B1 B2 เพื่อจุดประสงค์ในการทดสอบฉันตั้งค่าเซลล์ประสาทกลางด้านบน (M1) ด้วยตนเองให้เป็นประตูเกทและเซลล์ประสาทส่วนล่าง (M2) ให้เป็นเกทหรือประตู ตอนนี้ฉันยังตั้งค่าการเชื่อมต่อด้วยตนเอง M1-O1 เป็น -.5, M2-O1 เป็น 1 และ B2 เป็น -.75 ดังนั้นถ้า M1 = 1 และ M2 = 1 ผลรวมคือ (-0.5 +1 -0.75 = -.25) tanh (0.25) = …

1
วิธีการประเมินระบบของกฎที่เป็นลายลักษณ์อักษร
ฉันพยายามหาระบบที่จะประเมินข้อบังคับสำหรับองค์กรเพื่อพิจารณาตรรกะพื้นฐานขององค์กร ฉันคิดว่าระบบเพรดิเคตลำดับที่หนึ่งจะทำงานเพื่อแสดงกฎซึ่งสามารถแปลจากข้อความผ่านการติดแท็กบางส่วนของคำพูดและเทคนิค NLP อื่น ๆ มีวิธีที่เป็นระบบในการตีความกฎลอจิกลำดับที่หนึ่งโดยรวมหรือสถาปัตยกรรม ML บางประเภทที่จะทำงานเป็นเลเยอร์ที่สองเพื่อค้นหาความคล้ายคลึงกันระหว่างองค์ประกอบ ตัวอย่างเช่น, รายการกิจกรรมสนุก ๆ : กอล์ฟ ช่วงพักดื่มกาแฟ พิซซ่า ข้อบังคับ: ในวันศุกร์เราเล่นกอล์ฟ ในวันศุกร์หรือวันเสาร์เราพักทานกาแฟด่วนและถ้าเป็นวันเสาร์เราจะได้รับพิซซ่า สรุป: กลุ่มของเราสนุกในวันหยุดสุดสัปดาห์ ฟังดูเหมือนไกล แต่ฉันอยากรู้ว่าเป็นไปได้ไหม ฉันยังรู้ด้วยว่าตรรกะอันดับหนึ่งอาจจะเหมาะสมกว่าสำหรับการขับข้อสรุปของเลเยอร์ที่สอง

4
วิธีประดิษฐ์อัลกอริทึมที่แนะนำสูตรการทำอาหารที่เป็นไปได้?
ฉันเคยมีประสบการณ์ในหลักสูตรที่สร้างอัลกอริทึมที่จะแนะนำสูตรการทำอาหาร ตอนแรกสูตรอาหารบ้าทุกประเภทจะออกมา จากนั้นเธอจะฝึกอัลกอริทึมการปรุงอาหารด้วยสูตรอาหารจริงและในที่สุดก็จะแนะนำสูตรอาหารที่ดีมาก ฉันเชื่อว่าเธอใช้บางสิ่งที่เกี่ยวข้องกับทฤษฎีบทของเบย์หรือการทำคลัสเตอร์ แต่เธอหายไปนานและเป็นอัลกอริทึม ฉันค้นหาทางอินเทอร์เน็ต แต่กำลังมองหาสูตรการทำอาหารจะให้ผลลัพธ์แบบใดก็ได้ แต่ไม่ใช่สิ่งที่ฉันกำลังมองหา ดังนั้นคำถามของฉันคือ: เทคนิคใดที่สามารถใช้ในการคิดอัลกอริทึมที่ (สุ่ม) แนะนำสูตรที่เป็นไปได้ (โดยไม่ต้องใช้ฐานข้อมูลของสูตรคงที่) ทำไมฉันถึงต้องมองหาอัลกอริทึมการทำอาหาร? มันเป็นตัวอย่างที่ดีมากของการประยุกต์ใช้แนวคิดพื้นฐานจริง ๆ ในโลกและอัลกอริธึมดังกล่าวอาจมีประโยชน์ในการตั้งค่าต่าง ๆ ที่ใกล้เคียงกับโลกแห่งความเป็นจริงมากขึ้น

6
การหาค่า XOR สูงสุดของตัวเลขสองตัวในช่วงเวลาหนึ่ง: เราจะทำได้ดีกว่าสมการกำลังสองหรือไม่?
สมมติว่าเรากำลังได้รับสองหมายเลขและและที่เราต้องการที่จะหาสำหรับL \ le i, \, J \ le Rlllrrrmax(i⊕j)max(i⊕j)\max{(i\oplus j)}l≤i,j≤rl≤i,j≤rl\le i,\,j\le r อัลกอริทึมnaïveเพียงตรวจสอบคู่ที่เป็นไปได้ทั้งหมด เช่นในทับทิมเรามี: def max_xor(l, r) max = 0 (l..r).each do |i| (i..r).each do |j| if (i ^ j > max) max = i ^ j end end end max end ฉันรู้สึกว่าเราสามารถทำได้ดีกว่าสมการกำลังสอง มีอัลกอริทึมที่ดีกว่าสำหรับปัญหานี้หรือไม่?

2
อัลกอริทึมการเรียนรู้ของเครื่องเพื่อเล่น Connect Four
ฉันกำลังอ่านเกี่ยวกับการเรียนรู้ของเครื่องและสงสัยว่าจะนำไปใช้กับการเล่นConnect Fourได้อย่างไร ความพยายามในปัจจุบันของฉันคือตัวแยกประเภทมัลติคลาสแบบง่ายโดยใช้โมเดลฟังก์ชัน sigmoid และวิธี one-vs-all ในความคิดของฉันฟีเจอร์อินพุตจะต้องเป็นสถานะ (แผ่นดิสก์ของผู้เล่น 1 แผ่นดิสก์ของผู้เล่น 2 ว่าง) ของเขตข้อมูลตาราง 7x6 = 42 ผลลัพธ์จะเป็นจำนวนของแถวที่ใส่ดิสก์เข้าไป เนื่องจากนั่นเป็นตัวเลขที่ไม่ต่อเนื่องระหว่าง 1 ถึง 7 ฉันจึงคิดว่านี่เป็นปัญหาการจำแนกประเภทหลายคลาสได้ แต่ฉันจะสร้างตัวอย่างการฝึกอบรมที่ใช้งานได้ในการเรียนรู้แบบมีผู้สอนได้อย่างไร เป้าหมายหลักคือการชนะเกม แต่ผลลัพธ์ไม่ชัดเจนเมื่อทำทุกอย่างยกเว้นเทิร์นสุดท้าย หากฉันให้ผู้เล่นสองคนที่ตัดสินใจสุ่มว่าจะเล่นอย่างไรกับคนอื่นเป็นพัน ๆ ครั้งมันจะเพียงพอหรือไม่ที่จะได้ผลัดกันโดยผู้ชนะในแต่ละเกมเป็นตัวอย่างการฝึกซ้อม? หรือฉันต้องทำสิ่งนี้ในวิธีที่แตกต่างอย่างสิ้นเชิง? แก้ไข: ตามที่แนะนำในความคิดเห็นที่ฉันอ่านเพียงเล็กน้อยเกี่ยวกับการเรียนรู้การเสริมแรง จากสิ่งที่ฉันรู้เข้าใจ Q-Learning ควรทำเคล็ดลับเช่นฉันต้องประมาณฟังก์ชั่น Q ของสถานะปัจจุบันและการดำเนินการเพื่อให้เป็นรางวัลสะสมสูงสุดที่เริ่มต้นในรัฐนั้น จากนั้นแต่ละขั้นตอนจะต้องเลือกการกระทำที่ส่งผลให้มีค่าสูงสุดของ Q อย่างไรก็ตามเกมนี้มีสถานะมากเกินไปในการทำเช่นในตารางการค้นหา ดังนั้นวิธีที่มีประสิทธิภาพในการจำลอง Q-Function นี้คืออะไร?

4
อะไรคือความสัมพันธ์ระหว่างสหสัมพันธ์และสาเหตุในการเรียนรู้ของเครื่อง?
มันเป็นความจริงที่รู้จักกันดีว่า "ความสัมพันธ์ไม่ได้เป็นสาเหตุที่เท่าเทียมกัน" แต่การเรียนรู้ของเครื่องดูเหมือนจะเกือบทั้งหมดขึ้นอยู่กับสหสัมพันธ์ ฉันกำลังทำงานกับระบบเพื่อประเมินประสิทธิภาพของนักเรียนตามคำถามตามผลงานที่ผ่านมา ไม่เหมือนกับงานอื่น ๆ เช่นการค้นหาโดย Google สิ่งนี้ไม่เหมือนกับระบบที่สามารถหาได้ง่าย - ดังนั้นสาเหตุไม่เกี่ยวข้องกับเรื่องนั้น เห็นได้ชัดว่าถ้าเราต้องการทำการทดลองเพื่อปรับระบบให้เหมาะสมเราจะต้องใส่ใจกับความแตกต่างของความสัมพันธ์ / สาเหตุ แต่จากมุมมองของการสร้างระบบเพื่อเลือกคำถามที่น่าจะเป็นระดับความยากที่เหมาะสมความแตกต่างนี้มีความสำคัญหรือไม่?

1
ปรับให้เรียบในโมเดลไร้เดียงสา
ตัวทำนายไร้เดียงสาทำการทำนายโดยใช้สูตรนี้: P(Y=y|X=x)=αP(Y=y)∏iP(Xi=xi|Y=y)P(Y=y|X=x)=αP(Y=y)∏iP(Xi=xi|Y=y)P(Y=y|X=x) = \alpha P(Y=y)\prod_i P(X_i=x_i|Y=y) โดยที่เป็นปัจจัยทำให้ปกติ สิ่งนี้ต้องการประมาณพารามิเตอร์จากข้อมูล ถ้าเราทำเช่นนี้กับ -smoothing เราก็จะได้ค่าประมาณαα\alphaP(Xi=xi|Y=y)P(Xi=xi|Y=y)P(X_i=x_i|Y=y)kkk P^(Xi=xi|Y=y)=#{Xi=xi,Y=y}+k#{Y=y}+nikP^(Xi=xi|Y=y)=#{Xi=xi,Y=y}+k#{Y=y}+nik\hat{P}(X_i=x_i|Y=y) = \frac{\#\{X_i=x_i,Y=y\} + k}{\#\{Y=y\}+n_ik} ที่มีค่าเป็นไปได้สำหรับx_iฉันสบายดีกับสิ่งนี้ อย่างไรก็ตามก่อนหน้านี้เรามีninin_iXiXiX_i P^(Y=y)=#{Y=y}NP^(Y=y)=#{Y=y}N\hat{P}(Y=y) = \frac{\#\{Y=y\}}{N} โดยที่มีตัวอย่างในชุดข้อมูล ทำไมเราไม่ทำให้เรียบก่อนหน้านี้ด้วย? หรือค่อนข้างไม่เราเรียบก่อน? ถ้าเป็นเช่นนั้นเราเลือกพารามิเตอร์การปรับให้เรียบอะไร ดูเหมือนโง่เล็กน้อยที่จะเลือกเนื่องจากเราทำการคำนวณที่แตกต่างกัน มีฉันทามติหรือไม่? หรือมันไม่สำคัญมากเกินไป?NNNkkk

2
วิธีเข้ารหัสวันที่เป็นอินพุตในเครือข่ายประสาทเทียม
ฉันกำลังใช้โครงข่ายประสาทเทียมเพื่อทำนายอนุกรมเวลา คำถามที่ฉันกำลังเผชิญอยู่ในขณะนี้คือฉันจะเข้ารหัสวันที่ / เวลา / หมายเลขซีเรียลได้อย่างไร ของแต่ละอินพุตกำหนดให้เป็นอินพุตไปยังเครือข่ายประสาทเทียมหรือไม่ ฉันควรใช้การเข้ารหัส 1 จาก C (ใช้สำหรับการเข้ารหัสหมวดหมู่) ตามที่อธิบายไว้ที่นี่หรือไม่ หรือฉันควรจะให้อาหารเวลา (ในมิลลิวินาทีตั้งแต่ 1-1-1970)? หรือกำลังป้อนเวลาที่ไม่จำเป็นตราบใดที่ฉันป้อนส่วนที่เหลือของข้อมูลตามลำดับเวลา?

4
การเรียนรู้ของเครื่องเทียบกับการระบุระบบ?
ใครช่วยอธิบายความแตกต่าง & ความคล้ายคลึงกันระหว่างการเรียนรู้ของเครื่องและการระบุระบบ? นี่เป็นเพียงสองชื่อในสิ่งเดียวกันหรือไม่ ในหน้านี้พวกเขาพูดว่า: ชุมชนการเรียนรู้ของเครื่องและระบบการระบุตัวตนต้องเผชิญกับปัญหาที่คล้ายกันซึ่งต้องสร้างแบบจำลองจากการสังเกตแบบ จำกัด หรือมีเสียงดัง ฉันยังได้อ่านบทแรก ๆ ของการจดจำรูปแบบหนังสือที่มีชื่อเสียงและการเรียนรู้ของเครื่องโดย Christopher M. Bishop จนถึงตอนนี้ข้อสรุปของฉันคือปัญหาที่การระบุระบบกำลังพยายามแก้ไขเป็นส่วนย่อยของสิ่งที่การเรียนรู้ของเครื่องพยายามแก้ไข

1
Google DeepDream อธิบายแล้ว
ฉันเคยเห็นคำถามสองสามข้อเกี่ยวกับ Deep Dream ในเว็บไซต์นี้ แต่ดูเหมือนว่าไม่มีใครพูดถึง DeepDream ได้ว่าทำอะไรโดยเฉพาะ เท่าที่ฉันรวบรวมพวกเขาดูเหมือนจะเปลี่ยนฟังก์ชั่นวัตถุประสงค์และยังเปลี่ยน backpropagation เพื่อให้แทนที่จะอัปเดตตุ้มน้ำหนักที่พวกเขาอัพเดทภาพอินพุต ฉันสงสัยว่าถ้าใครรู้ว่าสิ่งที่ Google ทำ พวกเขากล่าวถึงหนึ่งในบทความของพวกเขาที่เรียกว่านักบวชชาวเบย์เมื่อพวกเขาทำการหาค่าเหมาะที่สุดและด้วยเหตุนี้ฉันสามารถจินตนาการได้ว่าการใช้โครงข่ายประสาทเทียมเพื่อพ่นภาพสำหรับแต่ละฉลากนั้นไม่ใช่เรื่องยาก - เราสามารถกำหนดป้ายแล้ว ปรับเวกเตอร์อินพุตให้เหมาะสม อย่างไรก็ตามส่วนที่น่าสนใจของความฝันที่ลึกล้ำก็คือมันทำแบบนี้ต่อเลเยอร์และในเรื่องนี้ฉันไม่ค่อยแน่ใจว่ามันจะเน้นรายละเอียดอย่างไรต่อเลเยอร์ แน่นอนว่าการป้อนภาพจะให้คุณค่ากับคุณในแต่ละเซลล์ประสาท แต่ถ้าเช่นนั้นเราจะใช้ข้อมูลนั้นเพื่ออธิบายรายละเอียดที่เกินจริงในภาพต้นฉบับได้อย่างไร ฉันพยายามหารายละเอียดเพิ่มเติมเกี่ยวกับเรื่องนี้ การอ้างอิง: ที่นี่ vzn ตอบคำถามที่คล้ายกัน: https://cs.stackexchange.com/a/44857/49671 จากลิงก์นั้นมีการนำ Deepdream มาใช้ที่นี่: http://auduno.com/post/125362849838/visualizing-googlenet-classes ยกเว้นว่ามันจะไม่มีคุณสมบัติที่พูดเกินจริงตามที่กล่าวไว้ที่นี่: http://googleresearch.blogspot.com/2015/06/inceptionism-going-deeper-into-neural.html ที่ซึ่งทั้งคู่แสดงการสร้างภาพข้อมูลของคลาสเฉพาะและเลเยอร์เฉพาะและพูดว่า: แทนที่จะกำหนดคุณสมบัติที่เราต้องการให้เครือข่ายขยายแน่นอนเราสามารถปล่อยให้เครือข่ายตัดสินใจได้ ในกรณีนี้เราเพียงแค่ป้อนรูปภาพหรือรูปภาพตามอำเภอใจของเครือข่ายและให้เครือข่ายวิเคราะห์รูปภาพ จากนั้นเราเลือกเลเยอร์และขอให้เครือข่ายปรับปรุงสิ่งที่ตรวจพบ

1
คำว่า“ ก่อนหน้า” มีความหมายอย่างไรในการเรียนรู้ของเครื่อง
ฉันยังใหม่กับการเรียนรู้ของเครื่อง ฉันได้อ่านเอกสารหลายฉบับที่พวกเขาใช้การเรียนรู้อย่างลึกซึ้งสำหรับการใช้งานที่หลากหลายและได้ใช้คำว่า "ก่อนหน้า" ในกรณีส่วนใหญ่ของแบบจำลองการออกแบบ ใครสามารถอธิบายสิ่งที่มันหมายถึงจริง ฉันสามารถหาสูตรทางคณิตศาสตร์ของก่อนและหลังในบทเรียน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.