職位描述
該職位已進行加V認證,請放心投遞
職位描述:
1. 主導大模型系統(tǒng)架構設計:
負責RAG系統(tǒng)的整體架構設計,包括存儲層、檢索層、推理層與緩存層的技術選型與實現(xiàn)。
構建高可用、低延遲的分布式推理服務框架,支持向量數據庫集成(如Milvus、Elastic)、知識庫管理與多模態(tài)檢索優(yōu)化。
設計并實現(xiàn)Agent工作流編排框架,支持工具調用(MCP協(xié)議)、任務規(guī)劃與自動化執(zhí)行。
2.模型部署與性能優(yōu)化:
負責大模型(LLM/VLM)的本地化部署、量化壓縮、動態(tài)批處理與推理加速,優(yōu)化GPU/CPU異構算力利用率。
3. AI服務平臺開發(fā):
基于Java/Go/Python構建高并發(fā)、可擴展的AI微服務,與現(xiàn)有業(yè)務系統(tǒng)深度集成,實現(xiàn)模型訓練-部署-監(jiān)控的全鏈路管理。
4.技術領導與跨團隊協(xié)作:
指導中級工程師,制定技術方案,并主導技術攻關。與產品、算法、基礎設施團隊協(xié)作,定義需求并推動工程落地。
職位要求:
1.計算機科學、人工智能或相關領域本科及以上學歷,5年以上大型服務端開發(fā)經驗,3年以上AI系統(tǒng)相關項目經驗
2.有牽頭大型AI工程項目經驗,具備一定的團隊管理或技術領導經驗
3. 具備扎實的 Java 編程基礎,熟悉常用的 Java 開發(fā)框架,包括不限于Spring,SpringMvc、SpringBoot、Spring Cloud,有高并發(fā)分布式系統(tǒng)開發(fā)經驗
4. 熟悉常用數據庫,包括不限于Mysql、MongoDB、ES、Redis等,熟悉常用的消息中間件
5. 熟悉python/GO開發(fā)語言,能進行一般的python/Go項目開發(fā)
6. 能夠快速理解業(yè)務需求,具備良好的溝通能力,將業(yè)務需求準確轉化為技術方案
7. 善于學習和總結,有團隊合作精神和較強執(zhí)行力,較強的問題解決能力、跨團隊溝通能力和技術規(guī)劃能力。
【加分項】
?1. 精通Transformer架構、RAG技術棧、向量數據庫優(yōu)化與多模態(tài)檢索策略者優(yōu)先。
?2. 掌握vLLM/SGLang/TensorRT-LLM推理框架中至少一種模型部署方法,掌握模型量化、算子融合、投機采樣等優(yōu)化技術者優(yōu)先。
3. 對AI技術前沿(如Agent、多模態(tài))有持續(xù)跟蹤熱情者優(yōu)先。
工作地點
地址:武漢洪山區(qū)武漢-洪山區(qū)小米武漢總部武漢小米總部
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
hrHR
小米科技有限責任公司
-
通信/電信/網絡設備/增值服務
-
1000人以上
-
私營·民營企業(yè)
-
北京市海淀區(qū)清河中街68號華潤五彩城寫字樓
相似職位
-
前端開發(fā)工程師 (MJ006136) 8000-15000元應屆畢業(yè)生 本科新浪網技術(中國)有限公司
-
機電設備類公估師 5000-10000元應屆畢業(yè)生 大專中衡保險公估股份有限公司四川分公司
-
HRBP 6000-10000元應屆畢業(yè)生 本科成都百同科技有限公司
-
美租業(yè)務策略 10000-15000元應屆畢業(yè)生 本科貝殼找房(北京)科技有限公司
-
尋源(硬裝主輔材/家具家電/布藝軟裝) 10000-18000元應屆畢業(yè)生 本科貝殼找房(北京)科技有限公司
-
金融產品顧問 8000-15000元應屆畢業(yè)生 大專中國人壽保險股份有限公司成都市分公司濱江營銷服務部
應屆畢業(yè)生
本科
2026-02-03 09:11:03
3231人關注
注:聯(lián)系我時,請說是在四川人才網上看到的。
