基本信息
案例ID:182671
技術(shù)顧問:hugh崔 - 9年經(jīng)驗(yàn) - 黑龍江省建工集團(tuán)

項(xiàng)目名稱:知乎心臟用藥爬取結(jié)果
所屬行業(yè):醫(yī)療健康 - 專業(yè)細(xì)分服務(wù)
->查看更多案例案例ID:182671
技術(shù)顧問:hugh崔 - 9年經(jīng)驗(yàn) - 黑龍江省建工集團(tuán)
項(xiàng)目名稱:知乎心臟用藥爬取結(jié)果
所屬行業(yè):醫(yī)療健康 - 專業(yè)細(xì)分服務(wù)
->查看更多案例
此作品對知乎的心臟用藥的相關(guān)結(jié)果做了一個總結(jié),一共10頁,每頁20條信息。我是開發(fā)者角色,其中我使用selenium的動態(tài)網(wǎng)頁爬取技術(shù)打開知乎網(wǎng)頁,然后又使用beautifulsoup進(jìn)行了頁面解析。然后我又使用了前端的vue框架和bootstrap的技術(shù)給獲取的信息進(jìn)行了分頁處理,在每個詳情頁又使用了js技術(shù)獲取下一條或者上一條信息和返回列表功能.
1. 通過webdriver實(shí)例化一個瀏覽器對象【谷歌瀏覽器】
2.遇到selenium能被知乎識別的反爬問題,使用自己打開的一個瀏覽器,繞開反爬
再用selenium接管這個瀏覽器這樣就可以完成反爬的處理。
3. 通過urllib模塊輸入相關(guān)問題,然后直接通過selenium,下拉網(wǎng)頁到最后
4. 通過beautifulsoup的語法獲取相關(guān)超鏈接和標(biāo)題
5. 通過requests模塊向這些超鏈接發(fā)送請求,然后獲取返回頁面的源碼后用xpath語法獲取需要的數(shù)據(jù),
然后存入mysql數(shù)據(jù)庫
6.建立前端的vue-cli腳手架,通過bootstrap和vue的相關(guān)指令生成前端頁面
7.通過pdo和數(shù)據(jù)庫連接返回所需的數(shù)據(jù),然后和vue框架進(jìn)行前后端的交互
8.將相關(guān)的vue框架和后端的php文件上傳到阿里云服務(wù)器