คำถามติดแท็ก xgboost

สำหรับคำถามที่เกี่ยวข้องกับอัลกอริทึม eXtreme Gradient Boosting

1
ฉันควรใช้เซลล์ LSTM กี่เซลล์
มีกฎของหัวแม่มือ (หรือกฎจริง) ที่เกี่ยวข้องกับจำนวน LSTM ขั้นต่ำ, สูงสุดและ "สมเหตุสมผล" ที่ฉันควรใช้หรือไม่? โดยเฉพาะฉันเกี่ยวข้องกับBasicLSTMCellจาก TensorFlow และnum_unitsคุณสมบัติ โปรดสมมติว่าฉันมีปัญหาการจำแนกที่กำหนดโดย: t - number of time steps n - length of input vector in each time step m - length of output vector (number of classes) i - number of training examples ตัวอย่างจริงหรือไม่ที่จำนวนตัวอย่างการฝึกอบรมควรมากกว่า: 4*((n+1)*m + m*m)*c ที่cเป็นจำนวนของเซลล์? ฉันใช้สิ่งนี้: จะคำนวณจำนวนพารามิเตอร์ของเครือข่าย …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 

3
มีรูปแบบภาษาที่ดีนอกกรอบสำหรับงูใหญ่หรือไม่?
ฉันกำลังสร้างต้นแบบแอปพลิเคชันและฉันต้องการโมเดลภาษาเพื่อคำนวณความงุนงงในประโยคที่สร้างขึ้น มีรูปแบบภาษาที่ผ่านการฝึกอบรมในภาษาไพ ธ อนที่ฉันสามารถใช้ได้หรือไม่? บางสิ่งที่เรียบง่ายเช่น model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < p2 ฉันดูบางกรอบ แต่ไม่สามารถค้นหาสิ่งที่ฉันต้องการ ฉันรู้ว่าฉันสามารถใช้สิ่งที่ชอบ: from nltk.model.ngram import NgramModel lm = NgramModel(3, brown.words(categories='news')) สิ่งนี้ใช้การแจกแจงความน่าจะเป็นที่ดีใน Brown Corpus แต่ฉันกำลังมองหาโมเดลที่สร้างขึ้นอย่างดีในชุดข้อมูลขนาดใหญ่เช่นชุดข้อมูลคำ 1b สิ่งที่ฉันสามารถเชื่อถือได้จริง ๆ ผลลัพธ์สำหรับโดเมนทั่วไป (ไม่เพียงข่าว)
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

1
ต้นไม้ไล่ระดับสีไล่ระดับสี:“ ยิ่งตัวแปรยิ่งดี”
จากบทช่วยสอนของ XGBoost ฉันคิดว่าเมื่อแต่ละต้นโตขึ้นตัวแปรทั้งหมดจะถูกสแกนเพื่อเลือกให้แยกปมและเลือกอันที่มีการแยกเกนสูงสุด ดังนั้นคำถามของฉันคือถ้าฉันเพิ่มตัวแปรเสียงลงในชุดข้อมูลตัวแปรเสียงเหล่านี้จะมีผลต่อการเลือกตัวแปร (สำหรับการปลูกต้นไม้แต่ละต้น) หรือไม่ เหตุผลของฉันคือเพราะตัวแปรเสียงเหล่านี้ไม่ได้ให้ผลประโยชน์สูงสุดเลยพวกเขาจะไม่ถูกเลือกดังนั้นพวกเขาจึงไม่ส่งผลต่อการเติบโตของต้นไม้ ถ้าคำตอบคือใช่มันเป็นความจริงหรือไม่ที่ "ยิ่งตัวแปรยิ่งดีสำหรับ XGBoost มากขึ้น" อย่ามาพิจารณาเวลาฝึก นอกจากนี้หากคำตอบคือใช่ก็เป็นความจริงที่ว่า "เราไม่จำเป็นต้องกรองตัวแปรที่ไม่สำคัญออกจากตัวแบบ" ขอบคุณ!

1
XGBoost เอาต์พุตการถดถอยเชิงเส้นไม่ถูกต้อง
ฉันเป็นมือใหม่ที่จะ XGBoost เพื่อให้อภัยความไม่รู้ของฉัน นี่คือรหัสหลาม: import pandas as pd import xgboost as xgb df = pd.DataFrame({'x':[1,2,3], 'y':[10,20,30]}) X_train = df.drop('y',axis=1) Y_train = df['y'] T_train_xgb = xgb.DMatrix(X_train, Y_train) params = {"objective": "reg:linear"} gbm = xgb.train(dtrain=T_train_xgb,params=params) Y_pred = gbm.predict(xgb.DMatrix(pd.DataFrame({'x':[4,5]}))) print Y_pred ผลลัพธ์คือ: [ 24.126194 24.126194] ในขณะที่คุณสามารถดูข้อมูลอินพุตเป็นเพียงเส้นตรง [40,50]ดังนั้นการส่งออกที่ผมคาดหวัง ฉันทำอะไรผิดที่นี่

3
XGboost - ตัวเลือกทำโดยรุ่น
ฉันใช้XGboostเพื่อทำนายตัวแปรเป้าหมาย 2 คลาสในการเคลมประกัน ฉันมีรูปแบบ (การฝึกอบรมกับการตรวจสอบข้ามการปรับพารามิเตอร์ไฮเปอร์ ฯลฯ .. ) ฉันทำงานในชุดข้อมูลอื่น คำถามของฉันคือ: มีวิธีที่จะรู้หรือไม่ว่าเหตุใดการอ้างสิทธิ์ที่ได้รับจึงส่งผลกระทบต่อหนึ่งคลาสเช่นคุณลักษณะที่อธิบายการเลือกของรุ่น จุดประสงค์คือเพื่อให้สามารถพิสูจน์ความถูกต้องของตัวเลือกที่เครื่องทำกับมนุษย์บุคคลที่สาม ขอบคุณสำหรับคำตอบ.
10 xgboost 

1
อะไรคือความหมายของการแจกจ่ายให้กับห้องสมุดที่มีการไล่ระดับสี
ฉันกำลังตรวจสอบเอกสาร XGBoost และมีการระบุว่า XGBoost เป็นไลบรารีการไล่ระดับสีแบบกระจายที่ปรับให้เหมาะสม การกระจายความหมายคืออะไร ขอให้มีความสุขมาก ๆ ในวันนี้นะ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.