Kinh nghiệm
3+ năm
Role hiện tại
Data Scientist
Công ty
Cake by VPBank
Vị trí
TP. HCM
Giới thiệu
Ba năm trước mình đang build mô hình kiểm duyệt nội dung cho một mạng xã hội du lịch. Bây giờ mình đang tự động hoá quyết định tín dụng tại một digital bank. Ở giữa là: data pipeline, feature store, hệ thống chat agent đa tầng, và không ít đêm debug model tới sáng.
Mình thích những bài toán mà data lộn xộn, hậu quả có thật, và không có benchmark sạch nào để núp vào.
Hiện tại mình đang build CakeAutoML — hệ thống tự động hoá toàn bộ quy trình từ chuẩn bị nhãn đến model tín dụng đã được validate — và nghiên cứu xem lịch sử giao dịch & hành vi ứng dụng có thể chấm điểm tín dụng cho những người mà credit bureau truyền thống chưa từng “thấy”. Điểm giao nhau của alternative data, embedded finance và ML production là chỗ mình muốn dành thời gian.
Nội dung trang là mô tả năng lực cá nhân; không phải thông tin chính thức của tổ chức hay lời khuyên đầu tư.
Kinh nghiệm
- Xây dựng CakeAutoML — tự động hoá toàn bộ pipeline credit scoring: Label Preparation → Data Preparation → Feature Selection → Training → Validator — đưa thời gian training end-to-end xuống dưới 60 phút.
- Đóng góp vào ML workflow: orchestration DAG, chuẩn hoá quy trình training và deployment cho nhóm Data Science.
- Nghiên cứu & triển khai Alternative Credit Scoring từ tín hiệu transaction behaviour + app usage — phục vụ chấm điểm tín dụng cho sản phẩm Embedded Finance.
PIC cho phần lớn các sản phẩm AI — điều phối trực tiếp với PM, Backend Engineers, CS & Ops teams từ discovery đến production.
- Dẫn triển khai end-to-end hệ chat agent kiến trúc multi-agent (supervisor) với hybrid RAG, function calling và GenAI — automate 70–80% lượt chat với 90% chính xác (validated trên manual-labelled CS sample).
- CMS: tự động phân loại case & triage email — workflow từ nhận request → phân loại → assign downstream; giảm ~70% thao tác thủ công.
- Data Modeling: BigQuery & Doris (Conversation Insight, Callbot, Feature Store); BI qua Looker Studio & Superset.
- Data Pipeline batch & streaming: Airflow, dbt (SQL/Python), Kafka.
- ML Platform: FeatureStore (Feast), MLOps, scoring production (NTB/ETB).
- Auto EDA agent (MCP/DataHub style).
Làm việc trực tiếp với CTO — xây dựng toàn bộ hệ thống Data & AI từ raw log đến các sản phẩm AI production.
- Xây dựng data warehouse từ raw log: thiết kế mô hình dữ liệu (user, post, hashtag, tương tác, quan hệ), pipeline batch, real-time & lambda.
- Hệ thống kiểm duyệt nội dung: fine-tune PhoBERT, bán tự động phát hiện vi phạm & xếp hạng mức độ cho reviewer.
- Hệ thống gợi ý & ranking: gợi ý kết bạn, ranking user & hashtag dùng graph embedding; tích hợp API với backend & QC.
Trọng tâm kỹ thuật
Học vấn & ghi nhận
Đại học FPT
Cử nhân Trí tuệ nhân tạo · 10/2019 — 10/2023 · Xếp loại Very Good
- Học bổng 100% Đại học FPT
- Học bổng 100%++ tập đoàn FPT cho tỉnh Bình Định
- Top 10 học sinh tỉnh Bình Định (bậc phổ thông)
Chứng chỉ
- Natural Language ProcessingDeepLearning.AI · 6/2023
- Fundamentals of Machine Learning in FinanceNYU Tandon · 6/2023