คำถามติดแท็ก lda

4
การจัดสรร Dirichlet แฝงเทียบกับกระบวนการ Dirichlet ตามลำดับชั้น
Latent Dirichlet Allocation (LDA)และHierarchical Dirichlet Process (HDP)เป็นทั้งกระบวนการสร้างแบบจำลองหัวข้อ ข้อแตกต่างที่สำคัญคือ LDA ต้องการข้อมูลจำเพาะจำนวนหัวข้อและ HDP ไม่ต้องการ เหตุผลที่เป็นเช่นนั้น? และอะไรคือความแตกต่างข้อดีและข้อเสียของวิธีการสร้างแบบจำลองหัวข้อทั้งสอง
49 nlp  topic-model  lda 

2
พารามิเตอร์อัลฟาและเบต้ามีส่วนช่วยอะไรในการจัดสรร Latent Dirichlet
LDA มีพารามิเตอร์หลายตัวสองค่าการปรับเปลี่ยนหัวข้อที่ถูกชักจูง พารามิเตอร์อัลฟาและเบต้ามีส่วนร่วมใน LDA อย่างไร หัวข้อเปลี่ยนไปอย่างไรหากพารามิเตอร์อย่างใดอย่างหนึ่งหรือพารามิเตอร์อื่น ๆ เพิ่มขึ้นหรือลดลง? ทำไมถึงเป็น hyperparamters และไม่ใช่แค่พารามิเตอร์?

5
ทำให้แผนที่ความร้อนของทะเลใหญ่ขึ้น
ฉันสร้างcorr()df จาก df ดั้งเดิม corr()DF ออก 70 X 70 มาและมันเป็นไปไม่ได้ที่จะเห็นภาพ heatmap ส sns.heatmap(df)... ถ้าฉันพยายามที่จะแสดงcorr = df.corr()ตารางที่ไม่พอดีกับหน้าจอและฉันสามารถดูความสัมพันธ์ทั้งหมด มันเป็นวิธีที่จะพิมพ์ทั้งdfโดยไม่คำนึงถึงขนาดของมันหรือเพื่อควบคุมขนาดของ heatmap หรือไม่?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

2
การจัดกลุ่มเอกสารโดยใช้หัวข้อที่ได้มาจากการจัดสรร Dirichlet แฝง
ฉันต้องการใช้ Latent Dirichlet Allocation สำหรับโครงการและฉันใช้ Python กับไลบรารี gensim หลังจากค้นหาหัวข้อที่ฉันต้องการจัดกลุ่มเอกสารโดยใช้อัลกอริทึมเช่น k-mean (โดยหลักแล้วฉันต้องการใช้ดีสำหรับการซ้อนกลุ่มเพื่อให้คำแนะนำยินดีต้อนรับ) ฉันจัดการเพื่อให้ได้หัวข้อ แต่อยู่ในรูปแบบของ: 0.041 * รัฐมนตรี + 0.041 * สำคัญ + 0.041 * ช่วงเวลา + 0.041 * แย้ง + 0.041 * นายกรัฐมนตรี เพื่อที่จะใช้อัลกอริทึมการจัดกลุ่มและแก้ไขให้ฉันถ้าฉันผิดฉันเชื่อว่าฉันควรหาวิธีที่จะเป็นตัวแทนของแต่ละคำเป็นตัวเลขโดยใช้ tfidf หรือ word2vec คุณมีความคิดว่าฉันจะ "ตัด" ข้อมูลที่เป็นข้อความจากเช่นรายการเพื่อทำเช่นนั้นแล้วนำมันกลับมาอีกครั้งเพื่อทำการคูณที่เหมาะสมหรือไม่ เช่นวิธีที่ฉันเห็นถ้าคำว่ารัฐมนตรีมีน้ำหนัก tfidf 0.042 และอื่น ๆ สำหรับคำอื่น ๆ ในหัวข้อเดียวกันฉันควรจะคำนวณสิ่งที่ชอบ: 0.041 * 0.42 …

5
แบบฝึกหัดเกี่ยวกับแบบจำลองหัวข้อและ LDA
ฉันต้องการทราบว่าคนของคุณมีแบบฝึกหัดที่ดี (รวดเร็วและตรงไปตรงมา) เกี่ยวกับแบบจำลองหัวข้อและ LDA สอนวิธีการตั้งค่าพารามิเตอร์บางอย่างโดยสังเขปว่าพวกเขาหมายถึงอะไรและเป็นไปได้ด้วยตัวอย่างจริง ๆ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.