1、核心職責聚焦于構建可靠、高效、安全合規的AI數據基礎設施;
2、負責AI模型訓練推理數據的全流程管理以及數據版本控制及質量評估;
3、設計實現高吞吐、低延遲的數據提取、轉換和加載(ETL)流程,以支持模型訓練和評估;使用工具或開發自動化工具/腳本(如Python)處理大規模數據,包括多源數據采集、噪聲過濾、去重、缺值補充、存儲、訪問和加載等;
4、設計數據存儲架構,包括數據庫選型(關系/非關系型、向量數據庫/時序數據庫)、數據表、存儲過程、訪問控制、性能優化、冗余備份等;
5、按需實施隱私計算(聯邦學習/差分隱私)及脫敏策略,確保訓練數據符合GDPR/《個保法》要求;
6、按需構建數據質量監控平臺,定義并自動化校驗數據完整性、一致性及分布偏移指標(如PSI)。
任職要求:
1、計算機/統計學相關專業,2年以上數據工程經驗;
2、精通Python/SQL,熟練使用 PySpark/Pandas 進行大規模數據處理;
3、具有編寫自動化工具、腳本或使用分布式計算工具/ETL工具(如Hadoop、Spark、Talend等)進行數據ETL的能力與實際工程經驗;
4、具有設計數據存儲架構的能力與實際工程經驗;
5、熟悉電力、氣象、光伏等領域和設備的數據處理、治理經驗者優先;
6、熟悉GDPR/《個人信息保護法》/隱私計算/脫敏策略者優先。
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
-
其他
-
21-50人
-
公司性質未知
-
航天路50號17層
應屆畢業生
學歷不限
最近更新
828人關注
注:聯系我時,請說是在四川人才網上看到的。
