职位描述
在国产/非国产的不同算力服务器上部署模型推理及训练的环境,部署不同类型的模型、进行模型微调等;机器学习、深度学习或其他人工智能领域的代码编写,可以实现包括RAG架构实现专家模型能力的编写;带领并指导团队成员进行模型的研究和实现,培养团队的技术能力,解决团队面临的技术挑战;负责模型推理和训练过程中的资源调度与优化,解决计算资源的高效利用问题;与研发等团队紧密合作,确保技术方案能够有效支持业务需求的落地与实现;基于业务需求,设计并构建高效的AI技术架构,推动模型的训练、推理、部署等技术方案的落地。