職位描述
該職位已進行加V認證,請放心投遞
【崗位使命】
通過腳本化 / 平臺化手段,提升數據標注同學的自動化效率和數據質量,為算法團隊快速沉淀高質量訓練數據。
【核心職責】
負責文本 / 圖像 / 音頻等多模態數據的采集、清洗、去重與格式轉換;
開發并維護半自動 / 全自動標注流水線,包括任務切分、預標注、質檢、回流等環節;
基于現有標注工具進行二次開發或插件集成;
持續監控標注流程的時效、成本與準確率,分析瓶頸并進行腳本或服務級優化;
與標注運營同學緊密溝通,快速響應內部需求并迭代工具;
完成相關文檔、使用手冊與內部培訓,保障工具落地效果。
【任職要求】(必備)
本科及以上學歷,計算機/軟件/電子信息等相關專業;
2~3 年 Python 開發經驗,熟悉常用數據結構、網絡與 Linux 環境;
精通 Python 快速腳本化能力,熟練使用 Pandas/Numpy/regex 等做批量數據處理;
熟練掌握至少一種主流 Web 框架(FastAPI / Django / Flask),掌握;
熟悉Git、 RESTful,基本掌握 CI/CD 流程、常見數據庫;
良好的編碼規范與自測意識,能獨立交付小型自動化項目。
【優先 / 加分項】
? 能編寫簡單前端頁面(HTML/CSS/Vanilla JS 或 Vue/React 輕度使用);
? 了解LLM 推理、PyTorch、RAG、LangChain / OpenAI API 等;
? 熟悉向量數據庫(Milvus/FAISS)或文本檢索、數據去重算法者優先。
【福利待遇】
綜合薪資12k-24k,繳納五險一金,有帶薪休假
【上班時間】
9:30-18:00,雙休,可彈性1小時打卡,法定節假日正常休息
工作地點
地址:北京朝陽區來廣營地區阿里巴巴朝陽科技園
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
HRHR
阿里巴巴(中國)有限公司
-
IT服務·系統集成
-
1000人以上
-
中外合資(合資·合作)
-
杭州濱江區阿里巴巴濱江園區699
2年以上
學歷不限
2026-02-01 10:54:51
587人關注
注:聯系我時,請說是在四川人才網上看到的。
