AI产品经理-AI Router方向 at Gate Technology

Company: Gate Technology

Location: APAC-C1

Type: FULL_TIME

Apply for this position

Job Description

<div> <div data-lark-html-role="root"> <div data-eleid="4"><strong><span data-eleid="5">【关于这个岗位】</span></strong></div> <div data-eleid="7"><span data-eleid="8">作为平台 AI 基础设施与算力调度的“交通指挥官”,你将主导 AI 模型中转站及 Multi-LLM 聚合平台的整体规划与矩阵演进。该岗位直接面对多模型适配、高并发流量调度、金融级Token计费等高壁垒场景。你将拥有极高的架构设计自主权,与顶尖的算法专家、基础架构(Infra)工程师和数据科学家协同攻坚,亲手打造一个高可用、低延迟、具备强商业化变现能力的全球化 AI 路由中台。</span></div> <div data-eleid="9"><strong><span data-eleid="10">【你会做什么】</span></strong></div> <ul data-eleid="11"> <li data-eleid="12"> <div><strong><span data-eleid="13">多模型聚合与标准化(Multi-LLM Hub)</span></strong><span data-eleid="14">:负责海量通用大模型(如 OpenAI, Anthropic, DeepSeek 等)的标准化接入、适配与封装,统一输出高兼容性的标准化 API 接口,彻底解决多模型版本兼容与调用不一致痛点。</span></div> </li> <li data-eleid="15"> <div><strong><span data-eleid="16">智能流量调度(Smart Routing &amp; High Availability)</span></strong><span data-eleid="17">:设计并持续迭代 AI 流量路由策略,主导智能路由、动态负载均衡(Load Balancing)、并发限流(Rate Limiting)、模型降级与故障熔断机制的设计,保障平台在极端高并发下的绝对稳定性。</span></div> </li> <li data-eleid="18"> <div><strong><span data-eleid="19">商业化中台与权限管控(Token Metering &amp; Monetization)</span></strong><span data-eleid="20">:构建企业级 AI 权限体系、多租户账号体系、调用配额管理以及精细化的 </span><strong><span data-eleid="21">Token 计费账单(Metering &amp; Billing)</span></strong><span data-eleid="22">、日志审计与风控防刷系统,支撑 B 端企业与 C 端用户的大规模商业化接入。</span></div> </li> <li data-eleid="23"> <div><strong><span data-eleid="24">全生命周期推进(Infra PMO)</span></strong><span data-eleid="25">:协同研发、测试、运维团队高效推进版本迭代,梳理全链路业务流,跟进线上问题闭环,持续优化中转平台的吞吐量性能与综合成本结构(Cost Optimization)。</span></div> </li> <li data-eleid="26"> <div><strong><span data-eleid="27">技术前瞻与赋能</span></strong><span data-eleid="28">:跟踪全球 AI 产业动态与模型迭代趋势,将客户痛点转化为标准化的中台能力,对内赋能多元业务线,对外实现高价值的商业化输出。</span></div> </li> </ul> <div data-eleid="29"><strong><span data-eleid="30">【我们希望你】</span></strong></div> <ul data-eleid="31"> <li data-eleid="32"> <div><span data-eleid="33">2-3 年 </span><strong><span data-eleid="34">AI 产品、大模型平台、API 中台或高性能 SaaS 平台</span></strong><span data-eleid="35">的产品实战经验。</span></div> </li> <li data-eleid="36"> <div><strong><span data-eleid="37">懂技术、知底层</span></strong><span data-eleid="38">:深刻理解大模型调用链路、API 转发逻辑、网络协议、并发控制、超时重试等底层逻辑,能与 Infra 工程师进行无障碍的技术对话。</span></div> </li> <li data-eleid="39"> <div><span data-eleid="40">熟悉全球主流大模型(LLMs)的能力特性,对大模型微调(Fine-tuning)、知识库(RAG)、上下文管理、对话记忆与 Prompt 工程有扎实的基础认知。</span></div> </li> <li data-eleid="41"> <div><span data-eleid="42">具备极强的逻辑抽象与架构设计能力,可独立独立输出高质量、高严谨度的 PRD、时序流程图与高保真原型。</span></div> </li> <li data-eleid="43"> <div><span data-eleid="44">具备强烈的 Owner 意识、卓越的数据敏感度与项目推进力,抗压能力强,乐于挑战技术未知。</span></div> </li> </ul> <div data-eleid="45"><strong><span data-eleid="46">【加分项】</span></strong></div> <ul data-eleid="47"> <li data-eleid="48"> <div><span data-eleid="49">有成熟 AI 中转平台、API 分发平台、算力调度中心或企业级 AI 中台完整从 0 到 1 落地经验者优先。</span></div> </li> <li data-eleid="50"> <div><span data-eleid="51">熟悉各类大模型适配层、对话接口及 </span><strong><span data-eleid="52">Embedding 向量接口</span></strong><span data-eleid="53">调用逻辑。</span></div> </li> <li data-eleid="54"> <div><span da

Browse More Jobs

Priority job-market routes

Explore exact-match crypto job pages with stronger market coverage, salary context, and fresh protocol hiring inventory.