工作地点:
广东省-广州市,广东省-深圳市
工作职责:
岗位职责:
1. 负责度量平台的功能开发,可靠性和性能优化。
2. 负责度量算法的设计和开发,包括:算子功能和性能度量、集群通信性能的度量、训推场景性能度量、算力预测、大模型应用画像及分类等算法。
3. 负责度量算法的工程化落地,包括:工程化重构、性能优化等。
任职资格:
任职要求:
1. 计算机相关专业本科及以上学历,具备扎实的计算机基础知识;
2. 5年及以上go、python开发经验,具备良好的代码规范意识和文档编写能力;
3. 熟悉GPU体系架构、计算机体系结构,有相关经验者优先;
4. 有高并发、高可用系统的设计与开发经验,熟悉分布式系统架构;
5. 熟悉Kubernetes(K8s)生态,具备容器化应用的部署、运维与调度优化经验;
6. 了解或参与过大模型(如GPT、BERT等)的训练或推理工作;有TensorFlow、PyTorch等框架使用经验者优先;
7. 熟悉微服务架构, 有云原生开发经验者优先;
8. 具备较强的学习能力、逻辑思维能力和团队协作能力,乐于接受挑战。