中国电信股份有限公司云计算分公司招聘系统--招聘详细

职位搜索

工作地点：	全部北京市天津市石家庄市太原市沈阳市哈尔滨市上海市南京市杭州市合肥市厦门市南昌市济南市郑州市武汉市长沙市广州市深圳市南宁市海口市重庆市成都市贵阳市昆明市拉萨市西安市银川市乌鲁木齐市
职位类型：	全部研发产品运营销售职能
发布时间：	全部三天内一周内一个月内三个月内半年内
	搜索

招聘动态

更多>>

暂无内容

研发专家/高级后端开发工程师（公有云智能操作助手）(J11021)

招聘类别：
活水岗位
工作性质：
全职
招聘人数：
若干
发布时间：
2025-09-03

截止时间：

工作地点：

北京市,上海市,四川省-成都市

工作职责：

专注于提升云服务器/裸金属产品的大模型推理性能，推动高性能推理引擎的开发与优化，支持公有云智能操作助手等AI产品的规模化落地。

1、技术方案设计与实施：参与云服务器/裸金属产品大模型推理引擎技术方案的讨论与制定，聚焦于 “硬件-编译器-运行时”协同优化的关键领域，如动态量化、计算图调度优化、跨硬件抽象等。
2、核心模块开发与优化：深度参与或牵头推理引擎核心模块（如动态批处理系统、分布式KV缓存管理、高效异构通信等）的开发与优化工作，致力于提升关键性能指标（时延/吞吐/成本）。
3、挑战性场景攻关：参与解决云智能体场景下的大规模模型、长上下文、多模态推理等场景下的性能挑战，研究并应用先进的调度算法与内存管理技术（如缓存优化、计算与通信重叠）。
4、技术探索与协同：参与业界前沿技术（如开源项目vLLM, TensorRT-LLM等）的研究与评估，探索其在公司技术栈中的应用；协助内部技术分享与知识沉淀，参与相关基准测试与优化工作。

任职资格：

1、大学本科及以上学历，并取得相应学位，计算机科学、人工智能、体系结构等相关专业背景。
2、5年以上工作经验，其中3年以上AI系统优化/高性能计算研发经验，1年以上AI推理相关研发经验。
3、理解主流开源推理框架（如vLLM, TensorRT-LLM, Triton等）的核心原理。
4、熟悉公司核心技术栈和业务场景者优先。有顶会论文者可不受经验限制。
5、具备良好的沟通能力和团队协作精神，能够独立承担复杂技术项目的研发工作。
6、有开源社区贡献或在虚拟化/容器安全领域有技术论文/专利者优先。

现在申请

返回职位列表