一、需求描述:
類別:利用序列生成網絡進行詩歌生成
進度:網上有已經利用seqgan生成詩歌的代碼
功能:在原有seqgan(序列生成對抗網絡)的基礎上進行改進,使得最終生成的詩歌一方面要滿足詩歌的平仄規則的要求;其次,原有seqgan中采用的是蒙特卡洛樹搜索算法,具有一定的隨機性,改進的另一個點要設法降低它的隨機性,提高效率;最后,原本生成的詩歌最終用BLEU(機器生成與人工創作之間的相似度)這個指標進行評測的,改進后,BLEU指標要明顯高于原本的數值。總之,使得機器生成的詩歌要盡可能的接近人工創作,指標進行相應的提升。
技術:深度學習、基于pytorch框架。
二、人才要求:
熟悉深度學習,熟悉自然語言處理技術(包括但不限于如:古詩詞研究語料庫的建立、分詞處理、平仄標注等)、熟練使用pytorch框架進行編程、熟悉近幾年前沿自然語言處理技術和深度學習技術,從事過自然語言處理技術的經驗者優先。
三、參考產品:
已有的古詩詞研究語料庫
Lantao Yu的論文:Sequence Generative Adversarial Nets with Policy Gradient
四、合作方式:
工作方式:遠程開發。
工作周期:5-8天