Scorecard Và PD Band: Biến Model Score Thành Ngôn Ngữ Policy
Model score chỉ có giá trị khi nó được dịch thành policy language. Bài này đi từ scorecard, WOE/IV đến PD band, actual bad rate, cum rate, cum bad rate và marginal risk.
On this page
Điểm cần nhớ
- Model score không tự nói được policy; PD band mới giúp Risk và Business ra quyết định.
- Scorecard vẫn sống khỏe trong credit risk vì explainability, auditability và reason code.
- WOE/IV hữu ích để đọc feature, nhưng IV quá cao là tín hiệu phải kiểm tra leakage.
- Actual bad rate by band kiểm tra risk ordering; predicted PD vs actual bad rate kiểm tra calibration.
- Cum bad rate cho thấy portfolio tại cutoff; marginal/bin bad rate cho thấy nhóm approve thêm rủi ro thế nào.
1. Score không phải ngôn ngữ cuối cùng
Trong notebook, model output là một con số. Trong credit policy, con số đó phải trở thành quyết định: approve tới band nào, giảm limit ở đâu, pricing tăng bao nhiêu, nhóm nào manual review.
Đó là lý do scorecard, score band và PD band vẫn quan trọng. Chúng biến model thành một ngôn ngữ mà Risk, Business, Finance và Operations có thể dùng chung.
2. Scorecard: vì sao cách cũ vẫn hữu ích
Scorecard thường dùng logistic regression với binning và WOE. Nó không phải lúc nào cũng mạnh nhất về rank-order performance, nhưng có ba lợi thế lớn trong credit risk:
| Lợi thế | Vì sao quan trọng |
|---|---|
| Explainability | Dễ giải thích vì sao khách bị điểm thấp |
| Governance | Dễ audit, document, review policy |
| Operationalization | Dễ chuyển thành reason code và policy rule |
ML model có thể tốt hơn về AUC/Gini, nhưng nếu không dịch được thành decision bands và reason story, stakeholder vẫn khó dùng.
3. WOE/IV: đọc feature theo ngôn ngữ risk
WOE (Weight of Evidence) cho biết một bin thiên về Good hay Bad:
textWOE = ln(%Good in bin / %Bad in bin)
IV (Information Value) đo sức phân biệt của feature:
textIV = sum((%Good - %Bad) x WOE)
| IV | Cách đọc |
|---|---|
| < 0.02 | Yếu |
| 0.02-0.1 | Thấp |
| 0.1-0.3 | Trung bình |
| 0.3-0.5 | Mạnh |
| > 0.5 | Rất mạnh, cần kiểm tra leakage hoặc proxy quá gần label |
Common mistake: thấy IV cao và mừng quá sớm. Trong credit, một feature quá mạnh có thể là future information, collection status sau booking, hoặc proxy cho chính label.
4. PD band: nơi model gặp policy
Nếu model output là probability of bad, band nên được đọc theo PD:
textPD thấp = rủi ro thấp PD cao = rủi ro cao
Ví dụ:
pythonntb_bins = [-1, 0, 0.025, 0.04, 0.05, 0.075, 0.1, 0.125, 0.15, 0.2, 0.5, 1]
Bins thường mịn hơn ở vùng PD thấp vì đó là nơi decision thật xảy ra: approve, limit, pricing, manual review. Vùng PD rất cao có thể rộng hơn vì nhiều hồ sơ bị reject.
5. Actual bad rate by band
Một bảng band monitoring tốt không chỉ có volume. Nó phải cho thấy model có rank đúng và có calibrated không.
| PD band | Volume | Avg predicted PD | Actual 30+ DPD | Cách đọc |
|---|---|---|---|---|
| 0-2.5% | 10,000 | 1.6% | 1.8% | Tốt |
| 2.5-4% | 8,000 | 3.2% | 3.5% | Tốt |
| 4-5% | 5,000 | 4.5% | 4.7% | Tốt |
| 5-7.5% | 3,000 | 6.2% | 8.5% | Underestimate risk |
| 7.5-10% | 1,500 | 8.4% | 11.0% | Underestimate risk |
Nếu actual bad rate tăng đều theo band, rank ordering vẫn ổn. Nếu actual cao hơn predicted PD ở nhiều band, vấn đề chính là calibration hoặc population shift.
6. Cum rate, cum bad rate và marginal risk
Khi sort từ PD thấp đến cao:
textCum rate = cumulative volume / total population Cum bad rate = cumulative bad / cumulative volume
Ví dụ:
| PD band | Volume | Bad | Bin bad rate | Cum rate | Cum bad rate |
|---|---|---|---|---|---|
| 0-2.5% | 1,000 | 10 | 1.0% | 10% | 1.0% |
| 2.5-5% | 2,000 | 60 | 3.0% | 30% | 2.3% |
| 5-7.5% | 1,500 | 90 | 6.0% | 45% | 3.6% |
Nếu cutoff là PD <= 7.5%, approval/cum rate là 45%, cum bad rate là 3.6%. Nhưng nhóm approve thêm từ 5% lên 7.5% có bin bad rate 6.0%. Đây là marginal risk.
7. Mini case: portfolio nhìn ổn, marginal group không ổn
Risk appetite là bad rate tối đa 4%. Cutoff PD <= 7.5% có cum bad rate 3.6%, nhìn có vẻ pass. Nhưng marginal group 5% < PD <= 7.5% có bad rate 6.0% và chủ yếu đến từ affiliate channel.
Recommendation tốt:
Overall cutoff vẫn dưới risk appetite, nhưng marginal risk của affiliate channel không tốt. Em đề xuất giữ cutoff cho salaried và existing customer, còn affiliate channel áp dụng lower limit hoặc manual review.
8. Checklist
- Band có đủ volume và bad count không?
- Actual bad rate có monotonic theo PD band không?
- Predicted PD có gần actual bad rate không?
- Có đọc bin bad rate cùng với cum bad rate không?
- Marginal group có profit dương không?
- Kết quả có tách theo channel, product, NTB/ETB không?
9. Takeaway
Model score là vật liệu thô. PD band là nơi model đi vào policy. Nếu DS không đọc được band, cum rate và marginal risk, model rất dễ bị dùng như một con số đẹp thay vì một công cụ quyết định.
In This Series
Credit Risk Modeling & Decisioning
Bài 4 / 8