職位描述
該職位已進行加V認證,請放心投遞
負責nlp大模型生成內容的可控可信方向的研發和落地。
工作內容包括大模型基座的訓練,對比,基于公開數據集/業務數據集的微調, 生成知識的可控性,準確性方案研發,以及大模型小型化相關技術來保證模型的落地應用。
職位要求
1. 計算機相關專業獲得碩士學位, 博士優先, 發表過大模型相關研究ai頂會論文優先;
2. 對nlp主流大模型如gpt3/chatgpt/t5/palm/llama/glm等的原理和差異有深入的理解;
3. 熟練掌握主流深度學習框架pytorch/tensorflow,大模型訓練框架megatron-lm/deepspeed等多機多卡方案,有百億/千億nlp大模型訓練調優經驗優先;
4. 熟悉常見的模型小型化技術,如量化/剪枝/蒸餾等,熟悉onnx/tensorrt;
5. 有良好的代碼開發能力,有開源項目開發經驗優先。
工作地點
地址:北京朝陽區北京-朝陽區環球金融中心
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
HR
螞蟻科技集團股份有限公司
-
銀行
-
1000人以上
-
中外合資(合資·合作)
-
浙江省杭州市西湖區西溪新座5幢802室
應屆畢業生
碩士
2026-01-31 05:38:49
3659人關注
注:聯系我時,請說是在四川人才網上看到的。
