職位描述

【職位描述】:
1. 大模型訓(xùn)練與推理優(yōu)化,負責(zé)深度學(xué)習(xí)模型的量化和蒸餾,實現(xiàn)高效的模型壓縮和部署,提高模型的運行效率和推理速度。
2. 大模型線上部署,負責(zé)LLM模型的端到端部署,包括但不限于推理引擎的定制化開發(fā)、模型優(yōu)化和壓縮、模型部署的端到端流程設(shè)計等
3. 大模型應(yīng)用開發(fā),負責(zé)結(jié)合業(yè)務(wù)場景進行定制化復(fù)雜agent系統(tǒng)設(shè)計、搭建與交互頁面開發(fā)
4. 大模型相關(guān)應(yīng)用落地,以獲得業(yè)務(wù)產(chǎn)出、內(nèi)部專利、論文發(fā)表等。
【任職要求】:
1. 計算機、數(shù)學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷在讀
2. 優(yōu)秀的工程能力
3. 對機器學(xué)習(xí)原理有一定了解,較好的的數(shù)學(xué)基礎(chǔ)
4. 思維嚴(yán)謹(jǐn),邏輯清晰;自驅(qū)、樂觀、好奇心驅(qū)動、團隊合作精神。
【加分項】:
1. 深度學(xué)習(xí)訓(xùn)練與推理加速經(jīng)驗
2. 熟悉LLM相關(guān)的算法技術(shù)與加速方法
3. 有一定的推薦和用戶增長領(lǐng)域業(yè)務(wù)經(jīng)驗者
1. 大模型訓(xùn)練與推理優(yōu)化,負責(zé)深度學(xué)習(xí)模型的量化和蒸餾,實現(xiàn)高效的模型壓縮和部署,提高模型的運行效率和推理速度。
2. 大模型線上部署,負責(zé)LLM模型的端到端部署,包括但不限于推理引擎的定制化開發(fā)、模型優(yōu)化和壓縮、模型部署的端到端流程設(shè)計等
3. 大模型應(yīng)用開發(fā),負責(zé)結(jié)合業(yè)務(wù)場景進行定制化復(fù)雜agent系統(tǒng)設(shè)計、搭建與交互頁面開發(fā)
4. 大模型相關(guān)應(yīng)用落地,以獲得業(yè)務(wù)產(chǎn)出、內(nèi)部專利、論文發(fā)表等。
【任職要求】:
1. 計算機、數(shù)學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷在讀
2. 優(yōu)秀的工程能力
3. 對機器學(xué)習(xí)原理有一定了解,較好的的數(shù)學(xué)基礎(chǔ)
4. 思維嚴(yán)謹(jǐn),邏輯清晰;自驅(qū)、樂觀、好奇心驅(qū)動、團隊合作精神。
【加分項】:
1. 深度學(xué)習(xí)訓(xùn)練與推理加速經(jīng)驗
2. 熟悉LLM相關(guān)的算法技術(shù)與加速方法
3. 有一定的推薦和用戶增長領(lǐng)域業(yè)務(wù)經(jīng)驗者
工作地點
地址:北京海淀區(qū)北京海淀區(qū)嘀嘀大廈B座6層


職位發(fā)布者
HR
北京小桔科技有限公司


-
交通·運輸·物流
-
1000人以上
-
股份制企業(yè)
-
北京市海淀區(qū)東北旺西路8號院35號樓5層501室
相似職位
-
高級硬件研發(fā)工程師 16000-25000元應(yīng)屆畢業(yè)生 碩士長春賽諾邁德醫(yī)學(xué)技術(shù)有限責(zé)任公司
-
嵌入式軟件工程師 8000-16000元應(yīng)屆畢業(yè)生 本科長春賽諾邁德醫(yī)學(xué)技術(shù)有限責(zé)任公司
-
新媒體客服 3000-5000元不限 不限長春市加速度企業(yè)管理咨詢有限公司
-
Java開發(fā)工程師(長春) 7000-10000元應(yīng)屆畢業(yè)生 本科浙江金惠科技有限公司
-
網(wǎng)絡(luò)工程師(遼源) (職位編號:2023082140) 面議應(yīng)屆畢業(yè)生 不限中國電信股份有限公司吉林分公司
-
游戲美工 8000-12000元不限 不限吉林星羽時空網(wǎng)絡(luò)科技有限公司