คำถามติดแท็ก pca

2
มีกี่มิติที่จะลดลงเมื่อทำ PCA
จะเลือก K สำหรับ PCA ได้อย่างไร? K คือจำนวนมิติที่จะฉายภาพลงไป ข้อกำหนดเพียงอย่างเดียวคือการไม่สูญเสียข้อมูลมากเกินไป ฉันเข้าใจว่ามันขึ้นอยู่กับข้อมูล แต่ฉันกำลังมองหาภาพรวมทั่วไปอย่างง่าย ๆ เกี่ยวกับคุณสมบัติที่ต้องพิจารณาเมื่อเลือก K
12 pca 

3
มีรูปแบบภาษาที่ดีนอกกรอบสำหรับงูใหญ่หรือไม่?
ฉันกำลังสร้างต้นแบบแอปพลิเคชันและฉันต้องการโมเดลภาษาเพื่อคำนวณความงุนงงในประโยคที่สร้างขึ้น มีรูปแบบภาษาที่ผ่านการฝึกอบรมในภาษาไพ ธ อนที่ฉันสามารถใช้ได้หรือไม่? บางสิ่งที่เรียบง่ายเช่น model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < p2 ฉันดูบางกรอบ แต่ไม่สามารถค้นหาสิ่งที่ฉันต้องการ ฉันรู้ว่าฉันสามารถใช้สิ่งที่ชอบ: from nltk.model.ngram import NgramModel lm = NgramModel(3, brown.words(categories='news')) สิ่งนี้ใช้การแจกแจงความน่าจะเป็นที่ดีใน Brown Corpus แต่ฉันกำลังมองหาโมเดลที่สร้างขึ้นอย่างดีในชุดข้อมูลขนาดใหญ่เช่นชุดข้อมูลคำ 1b สิ่งที่ฉันสามารถเชื่อถือได้จริง ๆ ผลลัพธ์สำหรับโดเมนทั่วไป (ไม่เพียงข่าว)
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

3
ฉันจะสร้าง Scatterplan แบบ PCA เชิงโต้ตอบใน Python ได้อย่างไร
matplotlibห้องสมุดที่มีความสามารถมาก แต่ขาด interactiveness โดยเฉพาะอย่างยิ่งภายใน Jupyter โน๊ตบุ๊ค ฉันต้องการที่ดีออฟไลน์เครื่องมือวางแผนเหมือนplot.ly

4
PCA ถือว่าเป็นขั้นตอนวิธีการเรียนรู้ของเครื่องหรือไม่
ฉันเข้าใจว่าการวิเคราะห์องค์ประกอบหลักคือเทคนิคการลดขนาดเช่นได้รับคุณสมบัติการป้อนข้อมูล 10 ประการมันจะสร้างฟีเจอร์อิสระจำนวนน้อยซึ่งเป็นการเปลี่ยนมุมฉากและเชิงเส้นของคุณสมบัติดั้งเดิม คือPCAด้วยตัวเองถือเป็นขั้นตอนวิธีการเรียนรู้หรือมันเป็นขั้นตอนข้อมูลก่อนการประมวลผล

4
จำแนกอนุกรมเวลาหลายตัวแปร
ฉันมีชุดข้อมูลที่ประกอบด้วยอนุกรมเวลา (8 คะแนน) ที่มีประมาณ 40 มิติ (ดังนั้นแต่ละชุดเวลาคือ 8 คูณ 40) ouput ที่สอดคล้องกัน (ผลลัพธ์ที่เป็นไปได้สำหรับหมวดหมู่) คือ eitheir 0 หรือ 1 อะไรจะเป็นวิธีที่ดีที่สุดในการออกแบบลักษณนามสำหรับอนุกรมเวลาที่มีหลายมิติ กลยุทธ์เริ่มต้นของฉันคือการดึงคุณสมบัติต่างๆจากอนุกรมเวลาเหล่านั้น: หมายถึงมาตรฐานรูปแบบสูงสุดสำหรับแต่ละมิติ ฉันได้รับชุดข้อมูลที่ฉันใช้ในการฝึกซ้อม RandomTreeForest การตระหนักถึงความไร้เดียงสาทั้งหมดของเรื่องนี้และหลังจากได้รับผลลัพธ์ที่ไม่ดีตอนนี้ฉันกำลังมองหาโมเดลที่ปรับปรุงมากขึ้น โอกาสในการขายของฉันมีดังนี้จัดหมวดหมู่ซีรีส์สำหรับแต่ละมิติ (โดยใช้อัลกอริธึม KNN และ DWT) ลดมิติด้วย PCA และใช้ลักษณนามสุดท้ายตามหมวดหมู่หลายมิติ การเป็น ML ค่อนข้างใหม่ฉันไม่รู้ว่าฉันผิดทั้งหมดหรือเปล่า
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.