职位发布者
其他要求
语言要求:中文/精通随时到岗招聘1-3人国籍要求:中国大陆
职位描述
1.)负责本地大模型(如 Llama、DeepSeek 等)的部署、优化与运维,确保模型在内网/本地环境中高效稳定运行。
2.)研究与实现 MCP(Model Context Protocol)相关功能,编写与维护 MCP 插件,实现与大模型的交互和扩展。
3.)优化推理性能,包括模型量化、并行计算、推理加速等。
4.)搭建并维护大模型运行环境(GPU集群、容器化部署、VDI/内网环境适配等)。
5.)支持业务团队接入大模型,提供 API/SDK 等调用接口,保障服务安全与高可用。
6.)跟踪大模型和 AI 基础设施前沿技术,结合业务需求提出优化方案。
任职要求:
1.)计算机科学、人工智能或相关专业本科及以上学历。
2.)熟悉常见大模型框架(PyTorch、TensorFlow、vLLM、LMDeploy、llama.cpp 等),具备实际部署经验。
3.)熟悉本地推理与服务化部署(Docker/Kubernetes/VMware/本地集群)。
4.)有 MCP(Model Context Protocol) 或其他大模型扩展协议/插件开发经验优先。
5.)熟悉 GPU 算力优化,具备模型量化、并行推理、分布式训练/推理经验者优先。
6.)熟练掌握 Python,熟悉 Go/Node.js 等至少一种后端语言者优先。
7.)具备良好的问题分析和解决能力,能独立完成大模型环境搭建与优化。
加分项
1.)有 AI Agent、LangChain、AutoGPT 等项目经验。
2.)熟悉私有化部署、安全合规要求的本地 AI 解决方案。
3.)有开源项目贡献或技术社区活跃度。
特别申明:
- TG招聘严禁企业和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等。 若发布的职位存在违法等恶意内容的情况, 请立即举报
工作地址
马来西亚-吉隆坡市