1. 綜合考慮代碼和運行結果,因此如果運行結果發生問題,可以僅提供代碼。(需要提供代碼和運行結果)
2. 代碼請盡可能給代碼加上注釋。代碼可以用圖片黏貼的形式,作圖的結果請不要用截圖,可以使用插入圖片的方式。
4. 在完成要求的基礎上,可以根據自己的理解做適當的拓展,并請在代碼上做出明確的注釋。
5. 請大家注意版面的整潔和清晰程度,代碼請拷到word里。電子版務必轉成pdf格式。
作業 一
請從Tushare中導入至2018年1月1日至2021年1月1日5支股票(任選)的收盤價,并生成一個數據框 DataFrame。 計算每天每支股票的漲跌幅,并計算累計漲跌幅序列。針對5支股票的漲跌幅,計算這5支股票收益率的協方差和相關系數。
假設投資者A,他采用投資并持有的策略,在2018年1月1日后的第一個交易日,購買了5支股票,每支100萬元。計算每個交易日A先生持有的每支股票市值情況并可視化,同時再計算每個交易日A先生投資組合的整體市值并可視化。
假設投資者B,她采用定投的方式,自2018年1月1日后的第一個交易日起,每天以當日收盤價對每支股票購買100股,計算每個交易日B女士持有的每支股票的盈虧情況并可視化,同時再計算每個交易日B女士投資組合的整體盈虧情況,并可視化。
作業 二
使用Tushare的命令找出隨機100個場外公募基金,并找出它們在過去一年的調整后凈值。計算它們各自在過去一年中的收益(不到一年的需將其年化)。找到它們各自最近的基金經理的情況,看看收益和基金經理的學歷和性別是否有關系(可以使用其他的特征)。
作業 三
使用爬蟲爬取最近3個月每日的新浪新聞(可以使用講義中的方法)。將新聞按照日進行分組,并對工作日的新聞進行輿情分析,使用Snow_NLP對于新聞進行打分,并計算每日的平均輿情得分。將輿情得分與當期的股票指數進行比較,計算它們兩者間的相關系數,進而判斷使用輿情分析是否可以做到預測股市的變化。
作業 四
使用Tushare任取場內或者場外基金歷史超過2年的200個公募基金,取得過去兩年的基金凈值序列,通過計算夏普比率(可任意設定無風險利率),來找到19年表現最好的50個基金。通過計算平均收益率,找到2020年表現最好的50個基金。看看有多少基金在其夏普比例和平均收益率的表現是一致的。