職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
崗位描述:
1. 負責對基于大模型構(gòu)建的通用垂類應(yīng)用進行效果和質(zhì)量評估;通過與產(chǎn)品研發(fā)團隊的緊密合作,制定評估標準和體系,準確分析評估效果,為應(yīng)用的優(yōu)化和改進提供支持,以提升應(yīng)用的性能、用戶體驗和市場競爭力;
2. 應(yīng)用效果與質(zhì)量評估: 1)負責評估基于大語言模型構(gòu)建的通用垂類應(yīng)用的效果和質(zhì)量,包括但不限于語言理解準確性、生成內(nèi)容的合理性、邏輯連貫性、知識準確性等方面; 2)參與設(shè)計測試用例,涵蓋不同場景、用戶需求和輸入條件,以確保應(yīng)用在各種情況下的穩(wěn)定性和可靠性; 3)參與收集和分析用戶反饋數(shù)據(jù),結(jié)合實際使用情況,對應(yīng)用的性能和用戶體驗進行綜合評估;
3. 評估標準與體系建設(shè): 1)理解業(yè)務(wù)需求和產(chǎn)品目標,與產(chǎn)品研發(fā)團隊密切溝通和協(xié)作,負責制定詳細、明確的評估標準和指標體系; 2)理解評估數(shù)據(jù)的收集、整理和分析流程,確保評估數(shù)據(jù)的完整性和可靠性,為評估體系的持續(xù)改進提供數(shù)據(jù)支持;
4. 評估效果分析與報告:撰寫評估報告,清晰闡述評估方法、過程、結(jié)果和結(jié)論,為產(chǎn)品研發(fā)團隊提供決策依據(jù)和改進方向。能力要求:
1. 本科及以上學(xué)歷,有AI數(shù)據(jù)生產(chǎn)和評估相關(guān)領(lǐng)域背景,具備2年以上訓(xùn)練師團團隊管理經(jīng)驗;
2. 能準確理解業(yè)務(wù)訴求,對質(zhì)量/數(shù)據(jù)變化敏銳,能通過獨到的視角或科學(xué)的方法發(fā)現(xiàn)并解決問題,推動業(yè)務(wù)指標達成和策略落地;
3. 有自然語言處理、搜索、人工智能領(lǐng)域相關(guān)工作經(jīng)驗,有AI項目交付經(jīng)驗者優(yōu)先;
4. 有想象力、良好的理解閱讀能力和創(chuàng)意,了解國內(nèi)外各種類型的AI產(chǎn)品玩法,如工具類(GPT、豆包、文心一言等)娛樂類(貓箱、星野、CAI等)多模態(tài)AI(Midjourney、可靈等);
5. 熟悉大語言模型,有數(shù)據(jù)標注與管理的經(jīng)驗,具備從訓(xùn)練數(shù)據(jù)到模型效果評估到優(yōu)化的完整經(jīng)驗者優(yōu)先;
6. 熟練使用Excel等數(shù)據(jù)分析工具,具備數(shù)據(jù)獲取、分類和分析能力;
7. 對AI產(chǎn)品有熱情與熱愛,具備出色的好奇心與學(xué)習(xí)能力,能適應(yīng)較快節(jié)奏的工作方式
工作地點
地址:成都武侯區(qū)成都-武侯區(qū)雙楠島·文創(chuàng)園區(qū)6樓


職位發(fā)布者
林海俊HR
北京三快在線科技有限公司

-
互聯(lián)網(wǎng)·電子商務(wù)
-
500-999人
-
股份制企業(yè)
-
漢國中心29樓
相似職位
-
qa-過程質(zhì)量工程師-mp (四川時代) 面議應(yīng)屆畢業(yè)生 不限寧德時代新能源科技股份有限公司
-
游戲內(nèi)容運營 25000-50000元應(yīng)屆畢業(yè)生 本科OPPO廣東移動通信有限公司
-
產(chǎn)品專員 10000-15000元應(yīng)屆畢業(yè)生 本科國藥集團藥業(yè)股份有限公司
-
java開發(fā)工程師 15000-25000元應(yīng)屆畢業(yè)生 本科貝殼找房(北京)科技有限公司
-
新媒體運營 3000-5000元不限 不限成都極度陪玩網(wǎng)絡(luò)有限公司
-
電磁算法工程師 面議應(yīng)屆畢業(yè)生 不限成都瑞迪威科技有限公司