深度學習與計算機視覺: 熟練掌握 PyTorch、TensorFlow 等深度學習框架,具備扎實的計算機視覺理論知識,包括圖像分割、點云配準、目標檢測等。
生成模型與圖像處理: 熟悉 Diffusion Models、GANs 等生成模型,具備圖像處理、風格遷移、圖像壓縮等方面的實踐經驗。
模型優化與部署: 具備模型量化、剪枝等優化技術經驗,熟悉 ONNX 模型轉換與部署,能夠在 Orin 等嵌入式平臺上進行模型優化。
算法設計與實現: 具備較強的算法設計與實現能力,能夠針對特定問題提出創新解決方案,并將其轉化為高效的代碼實現。
科研能力: 具備良好的科研素養,能夠閱讀和理解學術論文,并將其中的方法應用于實際項目中。
團隊協作與溝通: 具備良好的團隊協作精神和溝通能力,能夠與團隊成員高效合作,共同完成項目目標。
個性化多主題文本到圖像生成: 在 Dream Diffusers 項目中,我成功地將多個個性化概念融入到 Pixel-Art 中,并通過語義分割和概念保留損失函數等創新技術,提升了模型在多主題重構、藝術渲染和屬性修改等方面的表現。
低重疊點云配準: 在 Masked Point Cloud Registration 項目中,我提出了一種將 MaskNet 與 Multi-Level DCP 相結合的新方法,顯著降低了 RTE 指標,并提高了配準精度。
自動泊車與車道線檢測: 在 SenseTime 實習期間,我設計并實現了用于自動泊車感知的道路實例分割端到端建模流程,并提出了實時 ARD 車道線跟蹤和 3D 車道線檢測框架,取得了優于現有技術的性能。
用于有損壓縮的隱式神經表示: 在中科院計算所實習期間,我通過集成低比特網絡量化,改進了 SIREN 模型,實現了更高的壓縮率、更低的精度損失和更高的 PSNR。
在 SenseTime 實習期間,我參與了自動駕駛感知系統的研發,主要負責自動泊車和車道線檢測模塊。 自動泊車: 設計并實現了用于自動泊車感知的道路實例分割端到端建模流程,通過準確分割道路區域,為車輛提供可靠的泊車引導。 車道線檢測: 提出了實時 ARD 車道線跟蹤框
Dream Diffusers 是一個基于擴散模型的文本到圖像生成項目,旨在實現個性化多主題圖像生成。作為項目負責人,我帶領團隊實現了以下創新: 多主題融合: 將多個個性化概念融入到 Pixel-Art 中,使得生成的圖像更具創意和表現力。 語義分割與概念保留: 開發了創