崗位職責(zé):
1. 參與需求分析及技術(shù)方案設(shè)計(jì)。
2. 數(shù)據(jù)定制化: 根據(jù)特定項(xiàng)目方向(如面向轉(zhuǎn)場、多鏡頭、前景字符)定制數(shù)據(jù)源策略和數(shù)據(jù)處理方案。
3. 數(shù)據(jù)處理與構(gòu)建:
○ 設(shè)計(jì)并執(zhí)行數(shù)據(jù)清洗、預(yù)處理。
○ 定義并確保高質(zhì)量的數(shù)據(jù)標(biāo)準(zhǔn)。
○ 組織和管理數(shù)據(jù)標(biāo)注工作。
○ 構(gòu)建結(jié)構(gòu)化的、適用于模型訓(xùn)練和評(píng)測的高質(zhì)量數(shù)據(jù)集。
4. 流程優(yōu)化: 持續(xù)優(yōu)化數(shù)據(jù)獲取、處理、標(biāo)注、存儲(chǔ)和管理流程,提升效率與質(zhì)量。
5. 評(píng)測數(shù)據(jù)建設(shè): 專注于構(gòu)建公平、全面、具有挑戰(zhàn)性模型評(píng)測數(shù)據(jù)集,服務(wù)于模型能力評(píng)估和行業(yè)對(duì)比。
崗位需求:
1. 計(jì)算機(jī)科學(xué)、數(shù)據(jù)科學(xué)、人工智能、軟件工程或相關(guān)領(lǐng)域的本科及以上學(xué)歷。
2. 相關(guān)經(jīng)驗(yàn)與技術(shù)領(lǐng)域年限:
■ 1年~3年數(shù)據(jù)處理、數(shù)據(jù)工程或機(jī)器學(xué)習(xí)相關(guān)領(lǐng)域工作經(jīng)驗(yàn)。
■ 1年及以上實(shí)際處理視頻數(shù)據(jù)(圖像+文本、視頻+文本等)的項(xiàng)目經(jīng)驗(yàn),熟悉其特有挑戰(zhàn)和處理方法。
優(yōu)先:有視覺語言模型(VLM) 相關(guān)項(xiàng)目數(shù)據(jù)工作經(jīng)驗(yàn),深刻理解其數(shù)據(jù)需求。
3. 專業(yè)技能:
數(shù)據(jù)處理基礎(chǔ)扎實(shí): 了解數(shù)據(jù)清洗、預(yù)處理、轉(zhuǎn)換技術(shù),熟悉常見的數(shù)據(jù)處理工具和庫(如Pandas, NumPy, SQL等)。
數(shù)據(jù)標(biāo)準(zhǔn)制定: 具備定義清晰、可執(zhí)行的多模態(tài)數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)(如圖文相關(guān)性、視頻片段描述準(zhǔn)確性、時(shí)序?qū)R度)的能力。
數(shù)據(jù)標(biāo)注管理: 有設(shè)計(jì)標(biāo)注規(guī)范、管理標(biāo)注團(tuán)隊(duì)或使用標(biāo)注平臺(tái)的經(jīng)驗(yàn)。