วิทยาศาสตร์ข้อมูล

ถามตอบสำหรับผู้เชี่ยวชาญด้านข้อมูลวิทยาศาสตร์ผู้เชี่ยวชาญด้านการเรียนรู้ของเครื่องจักรและผู้ที่สนใจเรียนรู้เพิ่มเติมเกี่ยวกับสาขานี้

1
การสร้างข้อมูลใหม่เพื่อการเรียนรู้อย่างลึกโดยใช้ Keras
ฉันเป็นผู้เริ่มต้นของ Keras และฉันได้เริ่มต้นด้วยตัวอย่าง MNIST เพื่อทำความเข้าใจว่าไลบรารีใช้งานได้จริงอย่างไร ข้อมูลโค้ดของปัญหา MNIST ในโฟลเดอร์ตัวอย่างของ Keras นั้นได้รับเป็น: import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Dropout, Activation, Flatten from keras.layers import Convolution2D, MaxPooling2D from keras.utils import np_utils batch_size = 128 nb_classes = 10 nb_epoch = …

3
เมื่อใดที่เราควรพิจารณาชุดข้อมูลว่าไม่สมดุล
ฉันกำลังเผชิญสถานการณ์ที่จำนวนตัวอย่างบวกและลบในชุดข้อมูลนั้นไม่สมดุลกัน คำถามของฉันคือมีกฎของหัวแม่มือที่บอกเราเมื่อเราควร subsample หมวดหมู่ขนาดใหญ่เพื่อบังคับสมดุลบางประเภทในชุดข้อมูล ตัวอย่าง: หากจำนวนตัวอย่างที่เป็นบวกคือ 1,000 และจำนวนตัวอย่างเชิงลบคือ 10,000 ฉันควรไปฝึกลักษณนามลักษณนามของฉันในชุดข้อมูลแบบเต็มหรือฉันควรตัวอย่างตัวอย่างเชิงลบหรือไม่ คำถามเดียวกันสำหรับตัวอย่างบวก 1,000 ข้อและลบ 100,000 ข้อ คำถามเดียวกันสำหรับ 10,000 บวกและ 1,000 ลบ ฯลฯ ...

3
Word2Vec และ Doc2Vec เป็นทั้งการกระจายแบบเป็นตัวแทนและแบบกระจายหรือไม่?
ฉันได้อ่านว่าการเป็นตัวแทนแบบกระจายขึ้นอยู่กับสมมติฐานการกระจายที่คำที่เกิดขึ้นในบริบทที่คล้ายกันมีแนวโน้มที่จะมีความหมายที่คล้ายกัน Word2Vec และ Doc2Vec ทั้งสองมีรูปแบบตามสมมติฐานนี้ แต่ในกระดาษเดิมแม้พวกเขาจะมีบรรดาศักดิ์เป็นและDistributed representation of words and phrases Distributed representation of sentences and documentsดังนั้นอัลกอริทึมเหล่านี้อยู่บนพื้นฐานของการเป็นตัวแทนแบบกระจายหรือเป็นตัวแทนแบบกระจาย แล้วรุ่นอื่น ๆ เช่น LDA และ LSA

2
เครื่องมือสำหรับการตรวจจับความผิดปกติอัตโนมัติในตาราง SQL?
ฉันมีตาราง SQL ขนาดใหญ่ที่เป็นบันทึก ข้อมูลค่อนข้างซับซ้อนและฉันพยายามค้นหาวิธีการระบุความผิดปกติโดยที่ฉันไม่เข้าใจข้อมูลทั้งหมด ฉันพบเครื่องมือมากมายสำหรับการตรวจจับความผิดปกติ แต่ส่วนใหญ่ต้องการเครื่องมือ "คนกลาง" ประเภทต่าง ๆ เช่น Elastic Search, Splunk เป็นต้น ไม่มีใครรู้เครื่องมือที่สามารถทำงานกับตาราง SQL ที่สร้างพื้นฐานและการแจ้งเตือนของความผิดปกติโดยอัตโนมัติ? สิ่งนี้อาจฟังดูขี้เกียจ แต่ฉันใช้เวลาหลายสิบชั่วโมงในการเขียนสคริปต์การรายงานแต่ละรายการเนื่องจากฉันเรียนรู้ว่าแต่ละประเภทเหตุการณ์หมายถึงอะไรและฟิลด์อื่น ๆ ไปกับแต่ละกิจกรรมและฉันไม่รู้สึกใกล้ชิดกับความสามารถในการเตือนปัญหาจริง ๆ วิธีที่มีความหมาย ตารางมี 41 คอลัมน์และมีจำนวนถึง 500 ล้านแถว (3 ปีของข้อมูล)

2
โครงสร้างโครงการโครงงานการเรียนรู้เครื่องหลาม / วิทยาศาสตร์ข้อมูล
ฉันกำลังมองหาข้อมูลเกี่ยวกับวิธีการจัดโครงการการเรียนรู้ของเครื่องหลาม สำหรับงูหลามโครงการปกติมีcookiecutterและ R ProjectTemplate นี่คือโครงสร้างโฟลเดอร์ปัจจุบันของฉัน แต่ฉันกำลังผสม Jupyter Notebooks กับรหัส Python จริง ๆ และดูเหมือนจะไม่ชัดเจน . ├── cache ├── data ├── my_module ├── logs ├── notebooks ├── scripts ├── snippets └── tools ฉันทำงานในโฟลเดอร์สคริปต์และปัจจุบันเพิ่มฟังก์ชั่นทั้งหมดในไฟล์ภายใต้ my_module แต่นั่นทำให้เกิดข้อผิดพลาดในการโหลดข้อมูล (สัมพัทธ์ / พา ธ สัมบูรณ์) และปัญหาอื่น ๆ ฉันไม่สามารถหาแนวทางปฏิบัติที่เหมาะสมหรือตัวอย่างที่ดีในหัวข้อนี้นอกเหนือจากโซลูชันการแข่งขัน kaggle และโน้ตบุ๊คบางรุ่นที่มีฟังก์ชั่นทั้งหมดย่อในตอนเริ่มต้นของโน้ตบุ๊กดังกล่าว
10 python 

2
ggvis vs. ggplot2 + Shiny; สิ่งที่หนึ่งที่เลือกสำหรับการสร้างภาพเชิงโต้ตอบ?
มีคำถามที่คล้ายกันใน CrossValidated และฉันได้อ่านคำตอบแล้ว คำถามของฉันแตกต่างกันเล็กน้อย ฉันไม่ต้องการเพียงแค่เห็นภาพข้อมูลของฉันและแน่นอนสิ่งที่ฉันต้องการเห็นภาพไม่ใช่เรื่องง่ายที่จะเห็นภาพด้วยแพคเกจทั้งสอง ฉันมีจุดสองชุด ( พิกัด ) ในแผนของฉัน ฉันต้องการเพิ่มขอบและทำให้มันคล้ายกับกราฟ หากฉันมีจำนวนคะแนนจากนั้นขึ้นอยู่กับลักษณะของปัญหาของฉันฉันต้องเพิ่มขอบลงในพล็อตx , yx,Yx,ynnn( n / 2 )2(n/2)2(n/2)^2 จากนั้นฉันต้องการเพิ่มฟีเจอร์แบบโต้ตอบลงในพล็อตของฉัน ตัวอย่างเช่นโดยการคลิกที่จุดหนึ่ง (จุดยอด) จุดยอดอื่น ๆ ทั้งหมดที่ไม่ได้เชื่อมต่อกับจุดสุดยอดที่ถูกคลิกนี้จะต้องหายไปเพื่อให้มีพล็อตที่ชัดเจนและมุ่งเน้นมากขึ้น ฉันพยายามค้นหาแพ็คเกจการสร้างภาพเครือข่ายที่เหมาะกับโครงการของฉัน แต่ดูเหมือนว่าพวกเขาทั้งหมดใช้ข้อมูลเกี่ยวกับการเชื่อมต่อของขอบหรือโหนดและจัดหาเครือข่ายตามอัลกอริทึมโครงร่างเฉพาะบางอย่าง ข้อมูลของฉันแตกต่าง ฉันมีพิกัดของโหนดและฉันต้องการสร้างขอบระหว่างบางส่วนของพวกเขา ในข้อมูลของฉันโหนดมีตำแหน่งคงที่ของตัวเองและต้องไม่ย้ายไปมา สุดท้ายฉันแคบลงแพคเกจไปและggvis ใหม่และสดใหม่นอกเหนือจากการออกแบบโดยเจตนาเพื่อสร้างแปลงแบบโต้ตอบ แต่ฉันพบว่ายังสามารถสร้างแปลงแบบโต้ตอบได้ (ถูกต้องหรือไม่) นอกจากนี้ฉันคิดว่าความสามารถของมันนั้นหลากหลายและสมบูรณ์กว่า: ตัวอย่างเช่นมีคุณสมบัติการซูมในขณะที่ไม่มี ที่สำคัญกว่านั้นคือฉันกำลังเติบโตและเปลี่ยนแปลงฉันไม่ต้องการลงทุนเวลามากกับงานที่ล้าสมัยทางเทคนิคหรือบั๊กกี้ในหนึ่งปีหรือมากกว่านั้น ผมคิดว่าเป็นกรณีนี้ถ้าฉันรหัสอยู่บนพื้นฐานของggplot2ggvisggplot2+Shinyggplot2ggvisggplot2ggvisggvisggvis ตอนนี้คุณช่วยประเมินทางเลือกของฉัน ( ggplot2+shiny) และแนะนำฉันเกี่ยวกับความเป็นไปได้ที่จะทำสิ่งที่ฉันต้องการจะทำอย่างไร? เนื่องจากฉันไม่รู้จักแพ็คเกจที่กล่าวมาฉันได้เริ่มเรียนรู้ggplot2จากหนังสือของ Wickham และฉันรักมัน! Shinyแต่ผมกลัวของการใช้จ่ายไม่กี่สัปดาห์ที่ผ่านมาและพบว่าแพคเกจที่น่าตื่นตาตื่นใจนี้ไม่สามารถทำในสิ่งที่ฉันต้องการจะทำแม้จะมีความช่วยเหลือของ PS: ฉันต้องการที่จะใส่รหัสสุดท้ายใน GitHub เพื่อให้ผู้ใช้ที่น่าจะเป็นสามารถดาวน์โหลดและเรียกใช้มัน ดังนั้นฉันไม่จำเป็นต้องสร้างเว็บแอปพลิเคชันไม่จำเป็นต้องมีเว็บไซต์หรือวางแผนที่แบบโต้ตอบออนไลน์ …

3
ทิศทางของขอบในเครือข่าย Bayes ไม่เกี่ยวข้องหรือไม่?
วันนี้ในการบรรยายมันอ้างว่าทิศทางของขอบในเครือข่าย Bayes นั้นไม่สำคัญ พวกเขาไม่จำเป็นต้องเป็นตัวแทนของเวรกรรม เห็นได้ชัดว่าคุณไม่สามารถสลับขอบเดียวในเครือข่าย Bayes ตัวอย่างเช่นสมมติกับและ\} หากคุณจะเปลี่ยนเป็นดังนั้นจะไม่เป็นอีกต่อไปดังนั้นจึงไม่ใช่เครือข่าย Bayes นี่น่าจะเป็นปัญหาที่เกิดขึ้นจริงในทางปฏิบัติแล้วจะประเมินความน่าจะเป็นได้อย่างไร กรณีนี้ดูเหมือนจะตอบยากกว่าดังนั้นฉันจะข้ามไปG=(V,E)G=(V,E)G = (V, E)V={v1,v2,v3}V={v1,v2,v3}V = \{v_1, v_2, v_3\}E={(v1,v2),(v1,v3),(v2,v3)}E={(v1,v2),(v1,v3),(v2,v3)}E=\{(v_1, v_2), (v_1, v_3), (v_2, v_3)\}(v1,v3)(v1,v3)(v_1, v_3)(v3,v1)(v3,v1)(v_3, v_1)GGG นี่ทำให้ฉันถามคำถามต่อไปนี้ซึ่งฉันหวังว่าจะได้คำตอบที่นี่: เป็นไปได้หรือไม่ที่กราฟเชิงเส้นกำกับ (DAG) จะกลับขอบทั้งหมดและยังมี DAG อยู่? สมมติว่าได้รับ DAGและข้อมูล ตอนนี้เราสร้างผกผัน DAG ข้อความ g _ \ {} สำหรับ DAG ทั้งสองเราพอดีข้อมูลกับเครือข่าย Bayes ที่เกี่ยวข้อง ตอนนี้เรามีชุดข้อมูลที่เราต้องการใช้เครือข่าย Bayes เพื่อทำนายคุณสมบัติที่ขาดหายไป อาจมีผลลัพธ์ที่แตกต่างกันสำหรับ DAG …

2
การทดสอบซอฟต์แวร์สำหรับวิทยาศาสตร์ข้อมูลในอาร์
ฉันมักจะใช้Nose, Tox หรือ Unittestเมื่อทดสอบโค้ดไพ ธ อนของฉันโดยเฉพาะเมื่อต้องรวมเข้ากับโมดูลอื่นหรือโค้ดอื่น ๆ อย่างไรก็ตามตอนนี้ฉันพบว่าตัวเองใช้ R มากกว่า python สำหรับ ML model และการพัฒนา ฉันรู้ว่าฉันไม่ได้ทดสอบโค้ด R ของฉัน (และที่สำคัญกว่านั้นคือฉันไม่รู้ว่าจะทำอย่างไรดี) ดังนั้นคำถามของฉันคืออะไรแพ็คเกจที่ดีที่ให้คุณทดสอบรหัส R ในลักษณะที่คล้ายกับ Nose, Tox หรือ Unittest ใน Python การอ้างอิงเพิ่มเติมเช่นบทเรียนจะได้รับการชื่นชมอย่างมากเช่นกัน คะแนนโบนัสสำหรับแพ็คเกจใน R คล้ายกับ สมมติฐาน หรือ คุณสมบัติปลอม พูดคุยที่เกี่ยวข้อง: Trey Causey: การทดสอบสำหรับนักวิทยาศาสตร์ข้อมูล

1
การบรรจบกันของวิธีการ Hartigan-Wong k-mean และอัลกอริธึมอื่น ๆ
ฉันพยายามทำความเข้าใจเกี่ยวกับอัลกอริธึมการจัดกลุ่ม k-mean ต่าง ๆ ซึ่งส่วนใหญ่นำไปใช้ในstatsแพ็คเกจRภาษา ฉันเข้าใจอัลกอริทึมของ Lloyd และอัลกอริทึมออนไลน์ของ MacQueen วิธีที่ฉันเข้าใจพวกเขามีดังนี้: อัลกอริทึมของ Lloyd: การสำรวจแบบสุ่ม 'k' ในขั้นต้นจะถูกเลือกซึ่งจะทำหน้าที่เป็น centroids ของกลุ่ม 'k' จากนั้นขั้นตอนต่อไปนี้เกิดขึ้นในการทำซ้ำจนกว่าเซนทรอยด์จะบรรจบกัน ระยะทางแบบยุคลิดระหว่างการสังเกตแต่ละครั้งและเซนทรอยด์ที่เลือกจะถูกคำนวณ การสังเกตที่ใกล้เคียงกับเซนทรอยด์แต่ละตัวจะถูกติดแท็กไว้ภายในที่เก็บข้อมูล 'k' ค่าเฉลี่ยของการสังเกตทั้งหมดในถังแต่ละใบทำหน้าที่เป็นเซนทรอยด์ใหม่ เซนทรอยด์ใหม่จะแทนที่เซนทรอยด์เก่าและการทำซ้ำจะกลับไปที่ขั้นตอนที่ 1 หากเซนทรอยด์เก่าและใหม่ไม่ได้แปรสภาพ เงื่อนไขที่จะมาบรรจบกันมีดังต่อไปนี้: เซนทรอยด์เก่าและใหม่นั้นเหมือนกันทุกประการความแตกต่างระหว่างเซนทรอยด์นั้นเล็ก (จากลำดับที่ 10 ^ -3) หรือถึงจำนวนสูงสุดของการทำซ้ำ (10 หรือ 100) อัลกอริทึมของ MacQueen: นี่เป็นเวอร์ชั่นออนไลน์ที่อินสแตนซ์ 'k' ตัวแรกถูกเลือกเป็น centroids จากนั้นแต่ละอินสแตนซ์จะถูกวางในถังขึ้นอยู่กับเซนทรอยด์ที่ใกล้เคียงกับอินสแตนซ์นั้น เซนทรอยด์ที่เกี่ยวข้องจะถูกคำนวณใหม่ ทำซ้ำขั้นตอนนี้จนกระทั่งแต่ละอินสแตนซ์ถูกวางในที่ฝากข้อมูลที่เหมาะสม อัลกอริทึมนี้มีการวนซ้ำเพียงครั้งเดียวและการวนซ้ำดำเนินต่อไปสำหรับอินสแตนซ์ 'x' อัลกอริทึม Hartigan-Wong: กำหนดคะแนน …
10 r  clustering  k-means 

2
AI เรียนรู้ที่จะลงมือทำอย่างไรเมื่อพื้นที่ปัญหาใหญ่เกินไป
ฉันเรียนรู้ได้ดีที่สุดผ่านการทดลองและตัวอย่าง ฉันเรียนรู้เกี่ยวกับเครือข่ายประสาทและมี (สิ่งที่ฉันคิดว่า) เป็นความเข้าใจที่ดีของการจัดหมวดหมู่และการถดถอยและการเรียนรู้แบบมีผู้สอนและไม่ได้ดูแล แต่ฉันก็สะดุดกับบางสิ่งที่ฉันไม่สามารถเข้าใจได้ ถ้าฉันต้องการฝึก AI ให้เล่นเกมที่ซับซ้อน ฉันกำลังคิดบางอย่างเช่น RTS (เช่น Age of Empires, Empire Earth และอื่น ๆ ) ในเกมประเภทนี้โดยทั่วไปจะมีจำนวนเอนทิตีที่ควบคุมโดยผู้เล่น (หน่วยอาคาร) แต่ละแห่งมีความสามารถแตกต่างกัน ดูเหมือนว่าปัญหาของ AI จะเป็นการจำแนก (เช่นเลือกหน่วยนั้นและการกระทำนั้น) อย่างไรก็ตามเนื่องจากจำนวนหน่วยเป็นตัวแปรหนึ่งจะจัดการกับปัญหาการจำแนกประเภทด้วยวิธีนี้ได้อย่างไร สิ่งเดียวที่ฉันนึกได้ก็คือเครือข่ายหลายเครือข่ายที่มีหลายขั้นตอน (หนึ่งสำหรับกลยุทธ์โดยรวมหนึ่งสำหรับการควบคุมหน่วยประเภทนี้หนึ่งสำหรับอาคารประเภทนั้น ฯลฯ ); แต่ดูเหมือนว่าฉันกำลังทำให้ปัญหาซับซ้อนขึ้น มีตัวอย่างที่ดีของการเรียนรู้ของเครื่อง / เครือข่ายประสาทเทียมในการเรียนรู้เกมที่ซับซ้อน (ไม่ใช่เฉพาะ RTS แต่ซับซ้อนกว่าMario )?

1
การจัดประเภทข้อความ - ปัญหา: Word2Vec / NN เป็นวิธีที่ดีที่สุดหรือไม่?
ฉันกำลังมองหาที่จะออกแบบระบบที่ให้ย่อหน้าของข้อความจะสามารถจัดหมวดหมู่มันและระบุบริบท: ได้รับการฝึกฝนกับย่อหน้าข้อความที่ผู้ใช้สร้างขึ้น (เช่นความเห็น / คำถาม / คำตอบ) แต่ละรายการในชุดการฝึกจะถูกติดแท็กด้วย ดังนั้นสำหรับเช่น ("หมวดหมู่ 1", "ย่อหน้าข้อความ") จะมีหลายร้อยหมวดหมู่ อะไรจะเป็นวิธีที่ดีที่สุดในการสร้างระบบเช่นนี้? ฉันได้ดูตัวเลือกที่แตกต่างกันเล็กน้อยและต่อไปนี้เป็นรายการของวิธีแก้ปัญหาที่เป็นไปได้ ตอนนี้ Word2Vec / NN เป็นทางออกที่ดีที่สุดหรือไม่? Recensive Neural Tensor Network เลี้ยงด้วยข้อมูล Word2Vec เฉลี่ย RNTN และเวกเตอร์ย่อหน้า ( https://cs.stanford.edu/~quocle/paragraph_vector.pdf )? TF-IDF ใช้ในเครือข่าย Deep Belief TF-IDF และ Logistic Regression กระเป๋าของคำและการจำแนก Naive Bayes

1
การวิเคราะห์บันทึกเซิร์ฟเวอร์โดยใช้การเรียนรู้ของเครื่อง
ฉันได้รับมอบหมายงานนี้เพื่อวิเคราะห์บันทึกเซิร์ฟเวอร์ของแอปพลิเคชันของเราซึ่งมีบันทึกข้อยกเว้นบันทึกบันทึกเหตุการณ์ฐานข้อมูล ฯลฯ ฉันยังใหม่กับการเรียนรู้ของเครื่องเราใช้ Spark พร้อมการค้นหาแบบยืดหยุ่นและ Sparks MLlib (หรือ PredictionIO) ตัวอย่างที่ต้องการ ผลลัพธ์จะสามารถทำนายตามบันทึกข้อยกเว้นที่รวบรวมเพื่อให้สามารถคาดการณ์ได้ว่าผู้ใช้คนใดมีแนวโน้มที่จะทำให้เกิดข้อยกเว้นต่อไปและคุณลักษณะใด (และสิ่งอื่น ๆ เพื่อติดตามและปรับปรุงการเพิ่มประสิทธิภาพของแอปพลิเคชัน) ฉันสามารถนำเข้าข้อมูลจาก ElasticSearch มาเป็นประกายและสร้าง DataFrames และแมปข้อมูลที่ต้องการได้สำเร็จ สิ่งที่ฉันอยากรู้คือฉันจะเข้าหาด้านการเรียนรู้ของการใช้งานเครื่องได้อย่างไร ฉันเคยผ่านบทความและเอกสารที่พูดคุยเกี่ยวกับการเตรียมข้อมูลล่วงหน้าฝึกอบรมตัวแบบข้อมูลและสร้างป้ายกำกับ คำถามที่ฉันมี ฉันจะเข้าใกล้การแปลงข้อมูลบันทึกการออกเป็นเวกเตอร์ตัวเลขซึ่งสามารถใช้กับชุดข้อมูลที่จะฝึกอบรมได้อย่างไร ฉันใช้อัลกอริทึมในการฝึกอบรมชุดข้อมูลของฉัน (ด้วยความรู้ที่ จำกัด ฉันได้รวบรวมสองสามวันที่ผ่านมาฉันกำลังคิดเกี่ยวกับการแข่งขันการถดถอยเชิงเส้นโปรดแนะนำการใช้งานที่จะดีที่สุด) เพียงมองหาข้อเสนอแนะเกี่ยวกับวิธีแก้ไขปัญหานี้ ขอบคุณ.

2
การเรียนรู้การเสริมแรงแบบมีส่วนร่วม
ฉันมีการใช้งานสำหรับตัวแทนเดียวที่ทำงานเกี่ยวกับปัญหาราคาแบบไดนามิกโดยมีเป้าหมายในการเพิ่มรายได้ให้สูงสุด อย่างไรก็ตามปัญหาที่ฉันทำงานด้วยเกี่ยวข้องกับผลิตภัณฑ์ที่แตกต่างกันหลายอย่างซึ่งเป็นการทดแทนกันดังนั้นการกำหนดราคาแบบไดนามิกทั้งหมดกับผู้เรียนอิสระดูเหมือนจะไม่ถูกต้องเนื่องจากราคาหนึ่งมีผลต่อรางวัลของอีกคนหนึ่ง เป้าหมายคือการกำหนดราคาแบบไดนามิกทั้งหมดเพื่อเพิ่มผลรวมของรายได้ของแต่ละบุคคลให้ได้มากที่สุดQ(λ)Q(λ)Q(\lambda) ฉันได้ทำการวิจัยเพื่อค้นหาสิ่งที่ประยุกต์ใช้การเรียนรู้การเสริมแรงด้วยวิธีนี้ แต่การใช้หลายเอเจนต์ที่ฉันพบเน้นไปที่เกมการแข่งขันมากกว่าการร่วมมือกันหรือพวกเขาคิดว่าความรู้ที่ไม่สมบูรณ์ของตัวแทนอื่น ความรู้ของแต่ละตัวแทนในสถานการณ์นี้) มีแอปพลิเคชันที่มีการวิจัย / จัดทำเป็นเอกสารที่ดีเกี่ยวกับการเรียนแบบร่วมมือในลักษณะนี้หรือไม่?

1
กำลังแปลง AutoEncoders
ฉันเพิ่งอ่านบทความของ Geoff Hinton เกี่ยวกับการเปลี่ยนระบบอ่านรหัสอัตโนมัติ Hinton, Krizhevsky และ Wang: กำลังเปลี่ยนรูปตัวเข้ารหัสอัตโนมัติ ในเครือข่ายประสาทเทียมและการเรียนรู้ของเครื่อง, 2011 และอยากจะเล่นกับอะไรแบบนี้ แต่เมื่ออ่านมันฉันไม่ได้รับรายละเอียดเพียงพอจากบทความเกี่ยวกับวิธีการใช้งานจริง ไม่มีใครรู้ว่าการทำแผนที่ระหว่างพิกเซลอินพุตกับแคปซูลควรทำงานอย่างไร สิ่งที่ควรเกิดขึ้นในหน่วยการรู้จำ? ควรฝึกอบรมอย่างไร มันเป็นแค่เสาหลังมาตรฐานระหว่างการเชื่อมต่อทุกครั้งหรือไม่ ยิ่งไปกว่านั้นจะเป็นลิงค์ไปยังซอร์สโค้ดบางตัวสำหรับสิ่งนี้หรือสิ่งที่คล้ายกัน

5
LSTM หรือแพ็คเกจ RNN อื่น ๆ สำหรับ R
ฉันเห็นผลลัพธ์ที่น่าประทับใจจากโมเดล LSTM ที่ผลิตเช็คสเปียร์เหมือนตำรา ฉันสงสัยว่ามีแพ็คเกจ LSTM สำหรับ R. I googled แต่พบแพ็คเกจสำหรับ Python และ Julia เท่านั้น (อาจมีปัญหาประสิทธิภาพการทำงานบางอย่างซึ่งอธิบายว่าทำไมโปรแกรมเหล่านี้จึงเป็นที่นิยมมากกว่า R) คุณรู้จักแพ็คเกจ LSTM (หรืออย่างน้อย RNN) สำหรับ R หรือไม่? หากมีบทเรียนใดบ้างสำหรับการใช้งาน
10 r  neural-network  rnn 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.