关于我
我构建经得起现实考验的基础设施。我是一名驻新加坡的站点可靠性工程师。 我管理 AWS,编写 Terraform,并理清复杂的 Kubernetes 环境。 我在复杂的系统故障演变为公开事故之前将其修复,并构建经久耐用的系统。
我构建经得起现实考验的基础设施。我是一名驻新加坡的站点可靠性工程师。 我管理 AWS,编写 Terraform,并理清复杂的 Kubernetes 环境。 我在复杂的系统故障演变为公开事故之前将其修复,并构建经久耐用的系统。
工程学士,主修信息工程/计算机科学。
在新加坡 Thales 担任站点可靠性工程师。
1. 基于Terraform实现AWS基础设施即代码(IAC)管理,通过Github Actions实现CI/CD流水线,采用S3存储Terraform状态文件,并基于Atlantis搭建自主服务平台管理全栈基础设施
2. 主导WAF规则架构升级,将原有首规则组模式重构为首-中-末三层规则组架构,使安全策略开发效率提升25%,实现敏捷安全迭代
3. 实施网络架构优化,通过AWS Transit Gateway替代传统NAT方案,实现年度云成本节约超$120K
4. 牵头完成Cloudfront资源从WAF Classic到WAFv2的全量迁移,覆盖30+业务线并实现零服务中断
5. 参与7x24小时oncall轮值,全年系统可用率保持99.95%以上,故障平均响应时间<5分钟
6. 推动基础设施代码重构,将Terraform单体架构升级为Terragrunt模块化架构,代码可维护性提升40%
1. 被分配到 SPBE/Sistem Pemerintahan Berbasis Elektronik/电子政府系统(印度尼西亚通信和信息部拥有的项目)。该项目包括子项目,例如电子系统组织者/PSE/Penyelenggara Sistem Elektronik、政府邮件服务器、PDNS/Pusat Data Nasional Sementara/临时国家数据中心、SIDEKA/Sistem Informasi Pelayan An Desa/乡村服务信息系统、Sistem Pengelolaan Pengaduan Pelayan An Publik Nasional/SP4N/国家公共服务投诉管理系统等。 2. 设置 Netbox 并将其与 HashiCorp Vault 集成,并将大多数服务器信息、IP 地址、凭据等从 Google 电子表格迁移到平台。 3. 解决 Kubernetes 环境中的数据库 PostgreSQL 等基础设施问题。
构建和维护核心阿里云基础设施,包括 Kubernetes、Redis 和 CI/CD 流水线。
管理 Kubernetes 的部署、定时任务、Kafka 和 Keycloak。
配置 WAF 和防 DDoS 以保护生产环境。
搭建 GitLab CI/CD 流水线,并使用阿里云日志服务实现集中化日志管理。
管理开发、预发布和生产环境的 ApsaraDB RDS 实例。
自动化 Node.js 应用程序的部署流程。
在 AWS ECS 上部署和排查应用程序故障。
编写 Linux 脚本来自动发送邮件,并使用 AIDE 每小时验证文件完整性。
优化文件监控脚本,降低了 CPU 使用率和执行时间,使告警触发更快。
部署 AWS OpenVPN Access Server,以保护远程客户端到客户端的安全通信。
规划从 4PSA 到 PowerDNS 的 DNS 迁移,并将其与 Plesk 同步。
Upwork 个人资料: https://www.upwork.com/freelancers/~01f8124f7d4fb15080
与 DevOps Enabler 团队的 23 人合作(后来转到可观察性团队)。 使用 Jenkins-as-a-code 插件增强 Jenkins,以最小的努力自动执行配置更改。 通过将 NewRelic 集成到其一些内部工具中来增强 Tokopedia 的可观察性。
使用 Google Cloud Platform (GCP) 建立、部署和维护 2023 年国家教育质量保证计划 (SNBP) 下教育部 (BPPP) Kemdikbud RI 的部分 IT 基础架构。 监控 Google Cloud Platform 日志以报告任何事件或错误,以便与开发人员团队一起解决。 改进用于将原始数据转换为生产格式的实用程序,速度提高 10 倍。 印度尼西亚有 678,407 名学生、21,702 所高中和 137 所公立大学使用该系统。
正在从 Medium 加载最新文章...