1, 需求描述
類別:對Yelp(美國的類似大眾點評的軟件)上的店家評論進行分類。主要是要區分出用戶有沒有抱怨等位已經有沒有抱怨服務慢。(難點主要在兩個都是等,但等的東西不一樣)。
進度和目標:現在手動給1200個數據做了標簽,還會添加更多數據。嘗試了logistic regression, naive bayes, random forest等傳統機器學習方法,準確率在接近90,目標是達到95。
2,人才要求
熟悉自然語言處理,有文本分類經驗,善于使用相關的機器學習/深度學習模型,英語水平良好,能夠對文本特征有理解。
3,合作方式
線上