有多重文本大數(shù)據(jù)處理需求,基于盡可能保密原因,詳情溝通時介紹——
需求一:網(wǎng)頁類文本挖掘、信息、特征提取
需求二:數(shù)據(jù)清洗、去重、融合
需求三:實體識別與合并,例如,在多篇新聞資訊中涉及到的人名、公司名、地理名,將同一個合并為同類
類型:新聞資訊、上市公告、法律文書、人物介紹等文本類、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)
經(jīng)驗:有3年以上同類型大數(shù)據(jù)、自然語言處理經(jīng)驗
要求:至少在上述三種需求中,有一種以上,在業(yè)務(wù)場景中實現(xiàn)落地,且,具有使用價值的成果
建議:如果有興趣合作,請介紹自己擅長的技術(shù)、應(yīng)用領(lǐng)域,數(shù)據(jù)處理的應(yīng)用場景