3 
 
        
      
      มีรูปแบบภาษาที่ดีนอกกรอบสำหรับงูใหญ่หรือไม่?
      
  ฉันกำลังสร้างต้นแบบแอปพลิเคชันและฉันต้องการโมเดลภาษาเพื่อคำนวณความงุนงงในประโยคที่สร้างขึ้น มีรูปแบบภาษาที่ผ่านการฝึกอบรมในภาษาไพ ธ อนที่ฉันสามารถใช้ได้หรือไม่? บางสิ่งที่เรียบง่ายเช่น model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < p2 ฉันดูบางกรอบ แต่ไม่สามารถค้นหาสิ่งที่ฉันต้องการ ฉันรู้ว่าฉันสามารถใช้สิ่งที่ชอบ: from nltk.model.ngram import NgramModel lm = NgramModel(3, brown.words(categories='news')) สิ่งนี้ใช้การแจกแจงความน่าจะเป็นที่ดีใน Brown Corpus แต่ฉันกำลังมองหาโมเดลที่สร้างขึ้นอย่างดีในชุดข้อมูลขนาดใหญ่เช่นชุดข้อมูลคำ 1b สิ่งที่ฉันสามารถเชื่อถือได้จริง ๆ ผลลัพธ์สำหรับโดเมนทั่วไป (ไม่เพียงข่าว)
      
        
          
                   11
                
        
        
          
                  
                    python 
                  
                    nlp 
                  
                    language-model 
                  
                    r 
                  
                    statistics 
                  
                    linear-regression 
                  
                    machine-learning 
                  
                    classification 
                  
                    random-forest 
                  
                    xgboost 
                  
                    python 
                  
                    sampling 
                  
                    data-mining 
                  
                    orange 
                  
                    predictive-modeling 
                  
                    recommender-system 
                  
                    statistics 
                  
                    dimensionality-reduction 
                  
                    pca 
                  
                    machine-learning 
                  
                    python 
                  
                    deep-learning 
                  
                    keras 
                  
                    reinforcement-learning 
                  
                    neural-network 
                  
                    image-classification 
                  
                    r 
                  
                    dplyr 
                  
                    deep-learning 
                  
                    keras 
                  
                    tensorflow 
                  
                    lstm 
                  
                    dropout 
                  
                    machine-learning 
                  
                    sampling 
                  
                    categorical-data 
                  
                    data-imputation 
                  
                    machine-learning 
                  
                    deep-learning 
                  
                    machine-learning-model 
                  
                    dropout 
                  
                    deep-network 
                  
                    pandas 
                  
                    data-cleaning 
                  
                    data-science-model 
                  
                    aggregation 
                  
                    python 
                  
                    neural-network 
                  
                    reinforcement-learning 
                  
                    policy-gradients 
                  
                    r 
                  
                    dataframe 
                  
                    dataset 
                  
                    statistics 
                  
                    prediction 
                  
                    forecasting 
                  
                    r 
                  
                    k-means 
                  
                    python 
                  
                    scikit-learn 
                  
                    labels 
                  
                    python 
                  
                    orange 
                  
                    cloud-computing 
                  
                    machine-learning 
                  
                    neural-network 
                  
                    deep-learning 
                  
                    rnn 
                  
                    recurrent-neural-net 
                  
                    logistic-regression 
                  
                    missing-data 
                  
                    deep-learning 
                  
                    autoencoder 
                  
                    apache-hadoop 
                  
                    time-series 
                  
                    data 
                  
                    preprocessing 
                  
                    classification 
                  
                    predictive-modeling 
                  
                    time-series 
                  
                    machine-learning 
                  
                    python 
                  
                    feature-selection 
                  
                    autoencoder 
                  
                    deep-learning 
                  
                    keras 
                  
                    tensorflow 
                  
                    lstm 
                  
                    word-embeddings 
                  
                    predictive-modeling 
                  
                    prediction 
                  
                    machine-learning-model 
                  
                    machine-learning 
                  
                    classification 
                  
                    binary 
                  
                    theory 
                  
                    machine-learning 
                  
                    neural-network 
                  
                    time-series 
                  
                    lstm 
                  
                    rnn 
                  
                    neural-network 
                  
                    deep-learning 
                  
                    keras 
                  
                    tensorflow 
                  
                    convnet 
                  
                    computer-vision