職位描述

工作職責
-預(yù)訓(xùn)練和微調(diào)大語言模型,基于自有數(shù)據(jù),訓(xùn)練更適合需求場景的大語言模型
-與數(shù)據(jù)工程師合作,理解和預(yù)處理數(shù)據(jù),以準備用于深度學習模型的輸入
-閱讀和理解最新的研究論文,跟蹤和使用業(yè)界最佳實踐進行模型訓(xùn)練,驗證并分析效果和
-監(jiān)控模型訓(xùn)練過程,進行問題排查和調(diào)優(yōu)
任職資格
-計算機科學,電子工程,數(shù)學,物理或相關(guān)領(lǐng)域的碩士或博士學位
-對深度學習,機器學習,神經(jīng)網(wǎng)絡(luò),transformer有深入的理解,有項目中應(yīng)用的經(jīng)驗
-具有良好的編程能力,有python和c++編程經(jīng)驗和深度學習框架使用經(jīng)驗,熟悉pytorch、megatron-lm
-能閱讀和理解技術(shù)研究論文,并能將論文的觀點轉(zhuǎn)化為實際的算法
-善于解決問題和適應(yīng)新的技術(shù)變化
工作地點
地址:荊州


職位發(fā)布者
HR
百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司


-
互聯(lián)網(wǎng)·電子商務(wù)
-
1000人以上
-
私營·民營企業(yè)
-
北京海淀區(qū)上地十街10號百度大廈