1)大模型算法研發與優化:
①負責大模型的訓練、微調與優化,結合實際業務需求提升模型性能;
②研究并實現知識圖譜、知識庫的構建與維護,支持大模型的知識增強能力;
③開發知識增強的多輪問答系統,優化檢索與生成模塊的性能,提升問答準確率與用戶體驗。
2)大模型微調技術研究:
①熟練掌握大模型的微調技術,并進行深入研究與創新;
②探索高效微調方法,降低大模型在特定任務上的訓練成本與資源消耗;
③結合實際場景,設計并實現定制化的微調方案。
3)大模型部署與應用:
①負責大模型的部署與推理優化,確保模型在高并發場景下的高效運行;
②研究模型壓縮與加速技術(如量化、剪枝、蒸餾等),提升大模型的推理效率;
③推動大模型在產品中的應用,解決實際業務問題。
4)技術調研與創新:
①跟蹤大模型領域的前沿技術,結合實際業務需求進行技術調研與創新;
②參與技術方案的制定與評審,推動團隊技術能力的提升。
工作時間:周一至周五8:30-16:30,午休1小時;周末雙休
1)學歷要求:碩士研究生及以上學歷,985/211本科,計算機科學、人工智能、電子工程、自動化等相關專業。
2)工作經驗:
①3-5年大模型、自然語言處理、知識圖譜等相關領域的研究或開發經驗;
②具備知識圖譜、知識庫構建及RAG問答系統的實際項目經驗。
3)技術能力:
①熟悉業界主流大模型(如GPT、BERT、T5、LLaMA等)的算法原理與實現細節;
②熟練掌握大模型的微調技術,包括但不限于Adapter、LoRA、Prompt Tuning、Prefix Tuning等。
③熟悉大模型的訓練框架(如PyTorch、DeepSpeed、Megatron-LM等),具備大規模分布式訓練經驗;
④熟悉模型壓縮與加速技術(如量化、剪枝、蒸餾等),具備大模型部署與推理優化經驗;
⑤具備知識圖譜、知識庫構建及RAG問答系統的開發經驗,熟悉相關工具與框架(如Neo4j、Elasticsearch、FAISS等)。
1)具備良好的代碼能力,熟練掌握Python/C ,具備良好的編程習慣;
2)具備較強的學習能力與問題解決能力,能夠獨立完成技術調研與開發;
3)具備良好的團隊協作能力與溝通能力,能夠與跨部門團隊緊密合作。
4)加分項:
①在重要國際學術會議(如CVPR、ICCV、ECCV、NeurIPS等)發表過相關論文;
②具備大規模數據集處理與分布式訓練經驗;
③有端側實際產品落地經驗,熟悉從算法研發到上線的完整流程;
④有教育行業開發經驗。
