職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
崗位職責:
1、負責驗證及應用各類開源AI分布式訓練技術;
2、負責AI推理引擎的架構設計、系統開發及優化;
3、研究業界多語言NLP / 多模態大模型,探索自然語言、多模態技術在業務中的落地和創新,并迅速進行轉化。
任職要求:
1、精通 PyTorch,了解 Tensorflow/Caffe 等任意一種深度學習框架,并掌握 DeepSpeed/NVIDIA Megatron/Colossal-AI等分布式訓練框架;
2、熟悉 BERT / GPT-3 / LLaMa / Diffusion 等當前熱門的 CV/NLP/Audio 模型,有百億以上大模型訓練調優經驗者優先;
3、具備良好的編程能力,熟練掌握 Python、數據結構和算法設計,熟悉 Linux / Unix 系統和 Shell 編程,熟練使用 Git;
4、了解并行計算、CUDA、網絡通信、系統優化、集群硬件架構等相關知識;
5、至少一年以上的深度學習、對話系統、文本生成等實際項目經驗;
6、有分布式集群、多機多卡大模型預訓練、微調及推理經驗者優先;
7、具備英文專業文獻閱讀能力,能主動跟蹤發展現狀;
8、計算機、人工智能、機器學習等相關專業本科及以上學歷。
工作地點
地址:南京秦淮區南京-秦淮區紫云智慧廣場


職位發布者
HR
聯通智網科技有限公司

-
通信/電信/網絡設備/增值服務
-
公司規模未知
-
國有企業
-
西城區