項目名稱:AI 動漫風格生成器
技術棧:Python (Flask, OpenCV, PyTorch), JavaScript (HTML/CSS), Stable Diffusion, ControlNet
項目描述
開發了一款基于深度學習的 AI 動漫風格生成器,支持用戶上傳圖片并生成動漫風格的線稿和完整畫風。項目集成了 StableDiffusion 和 ControlNet 模型,通過 Flask 提供后端服務,前端實現圖片上傳、線稿生成和畫風遷移功能。
核心功能
圖片上傳與預覽:支持用戶拖拽或選擇圖片上傳,實時預覽上傳的圖片。
線稿生成:基于 OpenCV 實現圖片線稿生成,提供黑白素描效果。
畫風遷移:集成 Stable Diffusion 和 ControlNet 模型,根據用戶輸入的指令生成動漫風格圖片。
結果展示與下載:生成結果實時展示,并提供下載鏈接。
技術亮點
深度學習模型集成:
使用 PyTorch 加載和運行 Stable Diffusion 和 ControlNet 模型,支持 GPU 加速。
動態選擇數據類型(torch.float16 或 torch.float32),確保模型在 CPU 和 GPU 上均可運行。
前后端交互:
使用 Flask 構建 RESTful API,處理圖片上傳、線稿生成和畫風遷移請求。
前端通過 Fetch API 與后端交互,實現異步請求和動態內容更新。
文件處理與存儲:
使用 OpenCV 處理圖片,生成線稿并保存到指定目錄。
通過 Flask 的 send_from_directory 提供文件下載功能。
用戶體驗優化:
實現拖拽上傳、實時預覽和錯誤提示功能,提升用戶交互體驗。
使用 CSS 美化界面,確保頁面布局簡潔美觀。
項目成果
成功實現圖片上傳、線稿生成和畫風遷移功能,生成效果符合預期。
支持多種圖片格式(PNG、JPG、JPEG),最大上傳文件限制為 16MB。
項目代碼結構清晰,模塊化設計便于維護和擴展。