2、掌握并行計算技術(shù),了解并行編程,常用CUDA、OpenMP、MPI等編程框架。
3、異構(gòu)計算環(huán)境下遙感圖像并行變化檢測技術(shù)
4、掌握C/C++、P" />
1、Linux服務(wù)器遠程登錄。環(huán)境搭建、開源項目在服務(wù)器的部署。
2、掌握并行計算技術(shù),了解并行編程,常用CUDA、OpenMP、MPI等編程框架。
3、異構(gòu)計算環(huán)境下遙感圖像并行變化檢測技術(shù)
4、掌握C/C++、Python等開發(fā)語言,掌握常見的算法和數(shù)據(jù)結(jié)構(gòu)。
5、熟悉計算機體系結(jié)構(gòu)
6、深入了解一種深度學(xué)習(xí)框架(Caffe)。
7、了解GPU體系結(jié)構(gòu)。
1、ChatGLM2-6B、Baichuan-13B、文生圖Stable-diffusion等開源大模型在Linux服務(wù)器上的部署。
2、基于OpenMP與循環(huán)展開技術(shù)的GEMM性能優(yōu)化。
3、基于CUDA的二維卷積(Conv2)算子的實現(xiàn)。
ChatGLM2-6B大模型服務(wù)器的部署。包括環(huán)境安裝、基礎(chǔ)代碼調(diào)用、網(wǎng)頁版Demo部署等。并且進行了一系列對話測試。
本 作品實現(xiàn)了基于OpenMP的并行化矩陣乘法算法,并結(jié)合循環(huán)展開、調(diào)整循環(huán)次序等手段進一步實現(xiàn)了程序性能的提升,與標(biāo)準(zhǔn)串行算法進行了對比,證明了并行算法的正確性。 實驗使用的并行線程數(shù)為4。 實驗結(jié)論:1、并行化+循環(huán)展開+循環(huán)次序調(diào)整能夠極大提升矩陣乘法程序性能,性能約