崗位職責(zé):
1.前沿技術(shù)追蹤與落地:持續(xù)跟蹤LLM、多模態(tài)、 Al Agent等領(lǐng)域的最新技術(shù)動(dòng)態(tài)(如GPT系列、 DeepSeek系列、Claude系列、Sora等),并結(jié)合業(yè)務(wù)場(chǎng)景進(jìn)行快速驗(yàn)證和應(yīng)用。
2.模型微調(diào)與對(duì)齊:負(fù)責(zé)大模型的監(jiān)督微調(diào)
(SFT)、指令微調(diào),以及基于人類/AI反饋的強(qiáng)化學(xué)習(xí)(RLHF/RLAIF)、直接偏好優(yōu)化(DPO)等對(duì)齊技術(shù),提升模型在特定任務(wù)上的表現(xiàn)。
3.RAG與智能體(Agent)開發(fā):設(shè)計(jì)和優(yōu)化檢索增強(qiáng)生成(RAG)流程,結(jié)合向量數(shù)據(jù)庫(kù)、知識(shí)圖譜等技術(shù),減少模型幻覺(jué),提升回答的準(zhǔn)確性。構(gòu)建和開發(fā)能夠使用工具、進(jìn)行復(fù)雜任務(wù)規(guī)劃的AI智能體。
4.多模態(tài)能力構(gòu)建:負(fù)責(zé)文本、圖像、音頻、視頻等多模態(tài)大模型的研發(fā)和應(yīng)用工作,包括但不限于多模態(tài)內(nèi)容理解、生成和跨模態(tài)檢索。
5.性能優(yōu)化與部署:負(fù)責(zé)大模型的推理性能優(yōu)化,包括量化、蒸餾、剪枝等模型壓縮技術(shù),并使用 vLLM、TensorRT-LLM等先進(jìn)框架進(jìn)行高效部署,降低服務(wù)成本。
6.評(píng)估體系建設(shè):設(shè)計(jì)并建立一套科學(xué)、全面的模型評(píng)估體系,從準(zhǔn)確性、流暢性、安全性等多個(gè)維度對(duì)模型能力進(jìn)行持續(xù)、客觀的評(píng)測(cè)。
任職要求
1.計(jì)算機(jī)科學(xué)、人工智能、電子工程、數(shù)學(xué)或相關(guān)領(lǐng)域的碩士研究生學(xué)歷。
2.3年以上AI算法研發(fā)經(jīng)驗(yàn),至少1年以上大模型(LLM)相關(guān)的項(xiàng)目實(shí)戰(zhàn)經(jīng)驗(yàn),環(huán)保相關(guān)領(lǐng)域。
3.精通Python編程,熟練掌握至少一種主流深度學(xué)習(xí)框架(PyTorch優(yōu)先,TensorFlow亦可)。
4.具備豐富的大模型微調(diào)(SFT,LoRA,QLoRA等)和對(duì)齊(RLHF, DPO)實(shí)踐經(jīng)驗(yàn)。
5.熟悉RAG技術(shù)棧,有向量數(shù)據(jù)庫(kù)(如Milvus, Pinecone.Chroma)的使用經(jīng)驗(yàn).