崗位職責(zé):
1.負(fù)責(zé)IT運(yùn)維領(lǐng)域人工智能大模型的微調(diào)訓(xùn)練,包括數(shù)據(jù)準(zhǔn)備、模型調(diào)優(yōu)、效果評(píng)估及迭代優(yōu)化;
2.設(shè)計(jì)并搭建大模型訓(xùn)練框架,優(yōu)化訓(xùn)練效率和資源利用率,解決分布式訓(xùn)練中的技術(shù)難點(diǎn);
3.參與智能體(Agent)的開(kāi)發(fā)與實(shí)施,將大模型能力嵌入實(shí)際運(yùn)維場(chǎng)景(如自動(dòng)化故障診斷、日志分析等);
4.跟蹤行業(yè)最新算法與技術(shù)(如RLHF、Prompt工程),推動(dòng)模型性能提升;
5.撰寫(xiě)技術(shù)文檔,沉淀方法論,指導(dǎo)團(tuán)隊(duì)完成模型部署與維護(hù)。
任職要求:
1.計(jì)算機(jī)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷;
2.精通PyTorch/TensorFlow等深度學(xué)習(xí)框架,熟悉Hugging Face、LangChain等工具生態(tài);
3.具備NLP/CV/多模態(tài)大模型微調(diào)經(jīng)驗(yàn),熟悉LoRA、P-tuning等參數(shù)高效微調(diào)技術(shù);
4.熟悉IT運(yùn)維領(lǐng)域知識(shí)(如Zabbix、Prometheus等監(jiān)控工具)者優(yōu)先;
優(yōu)秀的編程能力(Python/Scala),有分布式訓(xùn)練(如DeepSpeed、Megatron-LM)經(jīng)驗(yàn)者優(yōu)先。