工作職責(zé):
深入分析訓(xùn)練系統(tǒng),定位和解決訓(xùn)練系統(tǒng)各個層次的性能瓶頸,不斷提升訓(xùn)練效率,打造業(yè)界領(lǐng)先的訓(xùn)練系統(tǒng),推進(jìn)算法的高效迭代。如:
1. 面向AI推理場景的全局KVCache的多級輕量化存儲計算,與PD分離相結(jié)合,推動整體推理性能提升;
2. 面向AI訓(xùn)推場景的通訊性能提升;
3. 優(yōu)化推理速度、內(nèi)存占用和能耗,支持多種硬件架構(gòu)(GPU、NPU等 )
4. 模型量化, 剪枝, 編譯
5. 申請并承擔(dān)科研任務(wù),發(fā)表高水平研究成果,推動項(xiàng)目合作。
任職資格:
1. 計算機(jī)、電子工程、自動控制等專業(yè)博士及以上學(xué)歷;
2. 了解深度學(xué)習(xí)算法基本原理,熟悉CNN/Transformers等主流模型原理與CUDA、MPI、NCCL等相關(guān)底層原理;具有AutoML/模型推理/訓(xùn)練優(yōu)化或AI 相關(guān)大模型/重要項(xiàng)目經(jīng)驗(yàn)者優(yōu)先;熟悉
3. 優(yōu)秀的代碼能力,熟練掌握C/C++或Python/CUDA等編程語言。
薪資:15-40K
工作地點(diǎn):1。廣東省東莞市南城區(qū)寰宇匯金中心9B33層;2.北京市海淀區(qū)知春路23號量子銀座7層