คำถามติดแท็ก machine-learning

คำถามการนำไปใช้เกี่ยวกับอัลกอริทึมการเรียนรู้ของเครื่อง คำถามทั่วไปเกี่ยวกับการเรียนรู้ของเครื่องควรโพสต์ในชุมชนเฉพาะของพวกเขา

5
เหตุใด F-Measure จึงเป็นค่าเฉลี่ยฮาร์มอนิกและไม่ใช่ค่าเฉลี่ยเลขคณิตของหน่วยวัดความแม่นยำและการเรียกคืน
เมื่อเราคำนวณ F-Measure โดยพิจารณาจากทั้งความแม่นยำและการเรียกคืนเราจะใช้ค่าเฉลี่ยฮาร์มอนิกของการวัดทั้งสองแทนค่าเฉลี่ยเลขคณิตอย่างง่าย อะไรคือเหตุผลโดยสัญชาตญาณที่อยู่เบื้องหลังการใช้ค่าเฉลี่ยฮาร์มอนิกไม่ใช่ค่าเฉลี่ยธรรมดา

12
การวิเคราะห์ความเชื่อมั่นของ Twitter ใน Python [ปิด]
ปิด. คำถามนี้ไม่เป็นไปตามหลักเกณฑ์กองมากเกิน ขณะนี้ยังไม่ยอมรับคำตอบ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Stack Overflow ปิดให้บริการใน5 ปีที่ผ่านมา ปรับปรุงคำถามนี้ ฉันกำลังมองหาการใช้งานโอเพนซอร์สโดยเฉพาะอย่างยิ่งใน python ของTextual Sentiment Analysis ( http://en.wikipedia.org/wiki/Sentiment_analysis ) มีใครคุ้นเคยกับการใช้งานโอเพนซอร์สที่ฉันสามารถใช้ได้ไหม ฉันกำลังเขียนแอปพลิเคชันที่ค้นหาทวิตเตอร์สำหรับคำค้นหาบางคำพูดว่า "youtube" และนับทวีตที่ "มีความสุข" เทียบกับทวีต "เศร้า" ฉันใช้ appengine ของ Google ดังนั้นมันจึงอยู่ใน python ฉันต้องการแยกประเภทผลการค้นหาที่ส่งคืนจาก twitter และฉันต้องการทำใน python ฉันยังไม่พบตัววิเคราะห์ความรู้สึกเช่นนี้โดยเฉพาะไม่ได้อยู่ใน python คุณคุ้นเคยกับการใช้งานโอเพนซอร์สที่ฉันสามารถใช้ได้หรือไม่? โดยเฉพาะอย่างยิ่งสิ่งนี้มีอยู่แล้วใน python แต่ถ้าไม่เป็นเช่นนั้นหวังว่าฉันจะแปลเป็น python ได้ หมายเหตุข้อความที่ฉันกำลังวิเคราะห์สั้นมากเป็นทวีต ดังนั้นลักษณนามนี้จึงเหมาะสำหรับข้อความสั้น ๆ ดังกล่าว BTW, twitter รองรับโอเปอเรเตอร์ …

5
สาเหตุทั่วไปของ nans ในระหว่างการฝึกอบรม
ฉันพบว่าเกิดขึ้นบ่อยในช่วงการฝึกอบรมNANs ได้รับการแนะนำ บ่อยครั้งที่น้ำหนักในผลิตภัณฑ์ด้านใน / ชั้นที่เชื่อมต่อเต็มหรือ Convolution ถูกนำมาใช้ สิ่งนี้เกิดขึ้นเนื่องจากการคำนวณการไล่ระดับสีกำลังระเบิดหรือไม่? หรือเป็นเพราะน้ำหนักเริ่มต้น (ถ้าเป็นเช่นนั้นทำไมการเริ่มต้นน้ำหนักจึงมีผลเช่นนี้) หรือน่าจะเกิดจากลักษณะของข้อมูลเข้าหรือไม่ คำถามที่สรุปคือ: อะไรคือสาเหตุส่วนใหญ่ที่ทำให้ NAN เกิดขึ้นในระหว่างการฝึกอบรม? และประการที่สองมีวิธีใดบ้างในการต่อสู้กับสิ่งนี้ (และทำไมถึงได้ผล)?

13
ฉันจะสร้างแบบจำลองเพื่อแยกแยะทวีตเกี่ยวกับ Apple (Inc. ) จากทวีตเกี่ยวกับแอปเปิ้ล (ผลไม้) ได้อย่างไร
ดูด้านล่างสำหรับ 50 ทวีตเกี่ยวกับ "apple" ฉันติดป้ายกำกับการจับคู่เชิงบวกเกี่ยวกับ Apple Inc. ไว้ด้วยมือโดยมีเครื่องหมาย 1 ด้านล่าง สองสามบรรทัดมีดังนี้ 1|“@chrisgilmer: Apple targets big business with new iOS 7 features http://bit.ly/15F9JeF ”. Finally.. A corp iTunes account! 0|“@Zach_Paull: When did green skittles change from lime to green apple? #notafan” @Skittles 1|@dtfcdvEric: @MaroneyFan11 apple inc is searching for people to …

1
ทำความเข้าใจเกี่ยวกับนโยบายการไล่ระดับสี
ฉันพยายามที่จะสร้างตัวอย่างง่ายๆนโยบายการไล่โทนสีจากมันทรัพยากรกำเนิดAndrej Karpathy บล็อก ในบทความนั้นคุณจะพบตัวอย่างกับ CartPole และ Policy Gradient พร้อมรายการน้ำหนักและการเปิดใช้งาน Softmax นี่คือตัวอย่างการสร้างและง่ายมากของฉัน CartPole ลาดนโยบายซึ่งทำงานที่สมบูรณ์แบบ import gym import numpy as np import matplotlib.pyplot as plt from sklearn.preprocessing import PolynomialFeatures import copy NUM_EPISODES = 4000 LEARNING_RATE = 0.000025 GAMMA = 0.99 # noinspection PyMethodMayBeStatic class Agent: def __init__(self): self.poly = PolynomialFeatures(1) self.w = …

9
ทำไมเครือข่ายประสาทคาดการณ์ผิดกับข้อมูลการฝึกอบรมของตัวเอง?
โปรดปรานหมดอายุใน 8 ชั่วโมง คำตอบสำหรับคำถามนี้มีสิทธิ์ได้รับ150 ค่าชื่อเสียง sirjayกำลังมองหาคำตอบจากแหล่งที่เชื่อถือได้ ฉันสร้างเครือข่ายประสาท LSTM (RNN) ด้วยการเรียนรู้แบบมีผู้สอนสำหรับการทำนายสต็อกข้อมูล ปัญหาคือสาเหตุที่มันทำนายผิดกับข้อมูลการฝึกอบรมของตัวเอง? (หมายเหตุ: ตัวอย่างที่ทำซ้ำได้ด้านล่าง) ฉันสร้างแบบจำลองง่าย ๆ เพื่อทำนายราคาหุ้น 5 วันถัดไป: model = Sequential() model.add(LSTM(32, activation='sigmoid', input_shape=(x_train.shape[1], x_train.shape[2]))) model.add(Dense(y_train.shape[1])) model.compile(optimizer='adam', loss='mse') es = EarlyStopping(monitor='val_loss', patience=3, restore_best_weights=True) model.fit(x_train, y_train, batch_size=64, epochs=25, validation_data=(x_test, y_test), callbacks=[es]) ผลลัพธ์ที่ถูกต้องอยู่ในy_test(5 ค่า) ดังนั้นโมเดลรถไฟมองย้อนกลับไป 90 วันก่อนหน้าจากนั้นเรียกคืนน้ำหนักจากval_loss=0.0030ผลลัพธ์ที่ดีที่สุด ( ) ด้วยpatience=3: Train on …

3
การใช้ YOLO หรือเทคนิคการจดจำภาพอื่น ๆ เพื่อระบุข้อความตัวอักษรและตัวเลขทั้งหมดที่ปรากฏในภาพ
ฉันมีแผนภาพรูปภาพหลายภาพซึ่งทั้งหมดมีป้ายกำกับเป็นตัวอักษรและตัวเลขแทนที่จะเป็นเพียงป้ายข้อความเท่านั้น ฉันต้องการให้แบบจำลอง YOLO ของฉันเพื่อระบุตัวเลขและตัวอักษรและตัวเลขทั้งหมดที่มีอยู่ในนั้น ฉันจะฝึกโมเดล YOLO ของฉันให้ทำเช่นเดียวกันได้อย่างไร ชุดข้อมูลสามารถพบได้ที่นี่ https://drive.google.com/open?id=1iEkGcreFaBIJqUdAADDXJbUrSj99bvoi ตัวอย่างเช่น: ดูกล่อง จำกัด ฉันต้องการให้ YOLO ตรวจพบทุกที่ที่มีข้อความ อย่างไรก็ตามในปัจจุบันไม่จำเป็นต้องระบุข้อความภายใน นอกจากนี้ยังจำเป็นต้องทำสิ่งเดียวกันสำหรับรูปภาพประเภทนี้ สามารถดาวน์โหลดภาพได้ที่นี่ นี่คือสิ่งที่ฉันได้ลองใช้โดยใช้ opencv แต่มันใช้ไม่ได้กับภาพทั้งหมดในชุดข้อมูล import cv2 import numpy as np import pytesseract pytesseract.pytesseract.tesseract_cmd = r"C:\Users\HPO2KOR\AppData\Local\Tesseract-OCR\tesseract.exe" image = cv2.imread(r'C:\Users\HPO2KOR\Desktop\Work\venv\Patent\PARTICULATE DETECTOR\PD4.png') gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1] clean = …

1
การพยากรณ์อนุกรมเวลาหลายตัวแปรพร้อมชุดข้อมูล 3 เดือน
ฉันมีข้อมูล 3 เดือน (แต่ละแถวสอดคล้องกับในแต่ละวัน) ที่สร้างขึ้นและฉันต้องการทำการวิเคราะห์อนุกรมเวลาหลายตัวแปรในลักษณะเดียวกัน: คอลัมน์ที่มีอยู่คือ - Date Capacity_booked Total_Bookings Total_Searches %Variation Each Date มี 1 รายการในชุดข้อมูลและมีข้อมูล 3 เดือนและฉันต้องการให้พอดีกับตัวแบบอนุกรมหลายตัวแปรเพื่อคาดการณ์ตัวแปรอื่น ๆ เช่นกัน จนถึงตอนนี้เป็นความพยายามของฉันและฉันพยายามที่จะบรรลุเดียวกันโดยการอ่านบทความ ฉันทำเช่นเดียวกัน - df['Date'] = pd.to_datetime(Date , format = '%d/%m/%Y') data = df.drop(['Date'], axis=1) data.index = df.Date from statsmodels.tsa.vector_ar.vecm import coint_johansen johan_test_temp = data coint_johansen(johan_test_temp,-1,1).eig #creating the train and …

4
จะปรับปรุงการจดจำตัวเลขของแบบจำลองที่ได้รับการฝึกฝนเกี่ยวกับ MNIST ได้อย่างไร?
ฉันทำงานเกี่ยวกับการรับรู้ด้วยตัวเลขหลายหลักด้วยมือJavaโดยใช้OpenCVห้องสมุดสำหรับการประมวลผลล่วงหน้าและการแบ่งส่วนและKerasรูปแบบการฝึกอบรมเกี่ยวกับ MNIST (ด้วยความแม่นยำ 0.98) สำหรับการรับรู้ การรับรู้ดูเหมือนจะทำงานได้ค่อนข้างดีนอกเหนือจากสิ่งหนึ่ง เครือข่ายค่อนข้างบ่อยครั้งที่จะจำสิ่งที่ไม่ได้ (หมายเลข "หนึ่ง") ฉันไม่สามารถทราบได้ว่าเกิดขึ้นเนื่องจากการดำเนินการแบ่งเซกเมนต์ล่วงหน้า / ไม่ถูกต้องหรือหากเครือข่ายที่ได้รับการฝึกอบรมเกี่ยวกับ MNIST มาตรฐานเพิ่งไม่เห็นหมายเลขหนึ่งซึ่งดูเหมือนว่ากรณีทดสอบของฉัน นี่คือสิ่งที่ตัวเลขที่เป็นปัญหามีลักษณะเหมือนหลังการประมวลผลล่วงหน้าและการแบ่งส่วน: กลายเป็นและจัดเป็น4 กลายเป็นและจัดเป็น7 กลายเป็นและจัดเป็น 4และอื่น ๆ ... นี่เป็นสิ่งที่สามารถแก้ไขได้โดยการปรับปรุงกระบวนการแบ่งส่วนหรือไม่ หรือโดยการเพิ่มชุดฝึกอบรม แก้ไข: การปรับปรุงชุดฝึกอบรม (การเพิ่มข้อมูล) จะช่วยได้อย่างแน่นอนซึ่งฉันได้ทำการทดสอบแล้วคำถามของการประมวลผลที่ถูกต้องยังคงอยู่ การประมวลผลล่วงหน้าของฉันประกอบด้วยการปรับขนาดการแปลงเป็นโทนสีเทาการแปลงแบบสองทางการหมุนและการขยาย นี่คือรหัส: Mat resized = new Mat(); Imgproc.resize(image, resized, new Size(), 8, 8, Imgproc.INTER_CUBIC); Mat grayscale = new Mat(); Imgproc.cvtColor(resized, grayscale, Imgproc.COLOR_BGR2GRAY); Mat …

3
รับตำแหน่งของข้อความทั้งหมดที่อยู่ในภาพโดยใช้ opencv
ฉันมีภาพนี้ที่มีข้อความ (ตัวเลขและตัวอักษร) อยู่ในนั้น ฉันต้องการรับตำแหน่งของข้อความและตัวเลขทั้งหมดที่อยู่ในภาพนี้ นอกจากนี้ฉันต้องการแยกข้อความทั้งหมดด้วย ฉันจะรับลูกสมุนตลอดจนข้อความทั้งหมด (ตัวเลขและตัวอักษร) ในภาพของฉันได้อย่างไร เช่น 10B, 44, 16, 38, 22B เป็นต้น

4
ModuleNotFoundError: ไม่มีโมดูลชื่อ 'numpy.testing.nosetester'
ฉันใช้ต้นไม้ตัดสินใจและข้อผิดพลาดนี้เกิดขึ้น สถานการณ์เดียวกันปรากฏขึ้นเมื่อฉันใช้ Back Propagation ฉันจะแก้มันได้อย่างไร (ขออภัยสำหรับภาษาอังกฤษที่ไม่ดีของฉัน) import pandas as pd import numpy as np a = np.test() f = open('E:/lgdata.csv') data = pd.read_csv(f,index_col = 'id') x = data.iloc[:,10:12].as_matrix().astype(int) y = data.iloc[:,9].as_matrix().astype(int) from sklearn.tree import DecisionTreeClassifier as DTC dtc = DTC(criterion='entropy') dtc.fit(x,y) x=pd.DataFrame(x) from sklearn.tree import export_graphviz with open('tree.dot','w') as f1: …

1
R: การใช้อัลกอริทึมการเร่งการไล่ระดับสีของฉันเอง
ฉันพยายามเขียนอัลกอริทึมการไล่ระดับสีของฉันเอง ผมเข้าใจว่ามีแพคเกจที่มีอยู่เช่นgbmและxgboost,แต่ฉันต้องการที่จะเข้าใจว่าขั้นตอนวิธีการทำงานโดยการเขียนของตัวเอง ฉันกำลังใช้irisชุดข้อมูลและผลลัพธ์ของฉันคือSepal.Length(ต่อเนื่อง) ฟังก์ชั่นการสูญเสียของฉันคือmean(1/2*(y-yhat)^2)(พื้นข้อผิดพลาดยกกำลังสองเฉลี่ย 1/2 ในหน้า) y - yhatดังนั้นการไล่ระดับสีที่สอดคล้องกันของฉันเป็นเพียงที่เหลือ ฉันกำลังเริ่มต้นการทำนายที่ 0 library(rpart) data(iris) #Define gradient grad.fun <- function(y, yhat) {return(y - yhat)} mod <- list() grad_boost <- function(data, learning.rate, M, grad.fun) { # Initialize fit to be 0 fit <- rep(0, nrow(data)) grad <- grad.fun(y = data$Sepal.Length, yhat = fit) …

2
หนึ่งจะมีพารามิเตอร์ในรูปแบบ pytorch ไม่ใบไม้และอยู่ในกราฟการคำนวณได้อย่างไร
ฉันกำลังพยายามที่จะปรับปรุง / เปลี่ยนแปลงพารามิเตอร์ของแบบจำลองโครงข่ายประสาทเทียมแล้วมีการส่งต่อของโครงข่ายประสาทที่ได้รับการปรับปรุงให้อยู่ในกราฟการคำนวณ (ไม่ว่าเราจะทำการเปลี่ยนแปลง / อัปเดตจำนวนเท่าใดก็ตาม) ฉันลองความคิดนี้ แต่เมื่อใดก็ตามที่ฉันทำมัน pytorch จะตั้งค่าเทนเซอร์ที่ปรับปรุงใหม่ของฉัน (ภายในตัวแบบ) เป็นใบไม้ซึ่งจะฆ่าการไล่ระดับสีของการไล่ระดับสีไปยังเครือข่ายที่ฉันต้องการรับการไล่ระดับสี มันฆ่าการไหลของการไล่ระดับสีเนื่องจากโหนดใบไม้ไม่ได้เป็นส่วนหนึ่งของกราฟการคำนวณในแบบที่ฉันต้องการให้มันเป็น (เพราะมันไม่ใช่ใบไม้จริง ๆ ) ฉันลองหลายอย่างแล้วแต่ดูเหมือนว่าจะไม่ทำงาน ฉันสร้างรหัสจำลองที่มีอยู่ในตัวซึ่งพิมพ์การไล่ระดับสีของเครือข่ายที่ฉันต้องการให้มีการไล่ระดับสี: import torch import torch.nn as nn import copy from collections import OrderedDict # img = torch.randn([8,3,32,32]) # targets = torch.LongTensor([1, 2, 0, 6, 2, 9, 4, 9]) # img = torch.randn([1,3,32,32]) # …

1
RuntimeError: ประเภทอินพุต (torch.FloatTensor) และประเภทน้ำหนัก (torch.cuda.FloatTensor) ควรเหมือนกัน
ฉันพยายามฝึก CNN ต่อไปนี้ แต่ฉันได้รับข้อผิดพลาดเดียวกันกับ. cuda () และฉันไม่แน่ใจว่าจะแก้ไขได้อย่างไร นี่คือโค้ดของฉันตอนนี้ import matplotlib.pyplot as plt import numpy as np import torch from torch import nn from torch import optim import torch.nn.functional as F import torchvision from torchvision import datasets, transforms, models from torch.utils.data.sampler import SubsetRandomSampler data_dir = "/home/ubuntu/ML2/ExamII/train2/" valid_size = .2 # Normalize …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.