逆向分析C1 prequalify 模型(自我评估申请Venture X通过概率:C1 prequalify 总结帖的进一步分析)

此贴是一个闲的蛋疼的且一本正经的胡说八道的理论分析(没有可信依据,纯DP反推和基于lz对模型的了解),如果看官们觉得没用,请忽略。先说重点,

此贴是基于自我评估申请Venture X通过概率:C1 prequalify 总结帖 和 近期发现的500k大法的进一步分析 (https://www.uscardforum.com/t/topic/449366)。

基于第二部分模型的理想人物刻画

再强调一次:这是模型中的理想样本点,不是让任何人模仿填写。模仿的同学们,lz不负责。Prequalify的结果,随着prequalify和申请卡之间的任何credit变化而变化,所以时间上的可延续性低。

1. 年收入

  • $500,000左右
  • 作用:hard positive,压缩所有风险比值

2. 使用意图(Q1,选两个)

理想的选择(请尊重事实,这只是个理想模型):

  • Travel rewards
  • New card member offer (没办法,不选这个,可能进入别的pool)

为什么:

  • Travel rewards → Venture / VX 最匹配(暗示提高 E[Spend])

理想情况下通常不选:

  • Building credit(暗示你是入门用户)
  • No annual fee(与 VX 不匹配,且可能被标记为其他用户群)
  • Low interest(可能触发风险交互)

3. 就业状态(Q5)

  • Employed
  • Occupation:稳定、高收入的行业/model可理解的语言

作用:

  • 将 Uncertainty 压到最低
  • 使高收入与收益信号“可信”

4. 现金预支(Q8)

  • No

作用:

  • 排除 ​negative
  • 保持在“可控转息用户”而非“财务压力用户”

5. 住房

  • 状态:Own / Living with family(真实前提下)
  • 月支出:相对收入很低,比如1%

作用:

  • Housing 只进 Loss → 越低越好
  • 500k 应该是压缩了风险空间

6. 使用与负债

  • 非零但不高的 balance
  • Utilization 处在 低–中区间(远离 sigmoid 拐点)
  • 无 cash advance
  • 适度 balance 更容易被 target,适度是balance相对于收入的比例

7. 信用行为

  • 近期报告非常平稳(少 HP、少新账户)
  • 平均信用历史较长
  • 若没有其他银行的近期的往来,更优

总结

从理论上看,Capital One prequalify 的最优人选并非风险最低或收入最高或信用历史最好的极端解,而是:在高收入(如 500k)加持下,使用意图与高端产品高度匹配、具备稳定就业、可能排除现金预支行为、远离风险拐点、且信用行为长期稳定的用户。该人物位于“收益最大化、风险非线性约束、不确定性最小化”的自然最优区间。

基于DP的理论模型分析(纯扯淡)

1. Overall Model Structure(公式是友好模式)

结合以下已观察到的DP:

  • utilization 出现非线性跳变(good → reject)
  • 适度 balance 反而更容易被 target
  • cash advance 是强烈负信号
  • 使用意图问题可能影响模型的早期分类
  • 极高收入(如 500k)可“硬破阈值”

可能的模型形式为 预期净收益模型(Expected Net Value Model)

PreScore = E(Profit) - lambda * E(Loss) - gamma * Uncertainty

Pre的方式应该是类似于阈值的分类:

PreScore >= Threshold_VentureX => Prequalify

该模型基本确定不是传统信用分模型,而更接近基于机器学习的风险权衡模型。


2. Model Components and Their Rationale

2.1 Expected Profit E[Profit]

  • 有 balance 的用户更容易被 target
  • Low interest 是双刃剑
  • Travel rewards / SUB 可能影响pre的产品,还是要选

合理的分解为:

E(Profit) = alpha1 * E(Spend)
+ alpha2 * E(Interest)
- alpha3 * E(SUB_Cost)

  • E[Spend]:刷卡体量
  • E[Interest]:转息收益,可能由 balance 存在等信号推断
  • E[SUB Cost]:一次性成本,用于惩罚纯薅奖励用户,解释为什么大量pre没有SUB

这解释了为什么 适度 balance是加分项。


2.2 Expected Loss E[Loss]

  • utilization 稍高即触发 reject
  • housing 永远是负项
  • cash advance 应该是 hard negative

合理形式为:

E(Loss) = p_default(Util, DTI, Housing, …) * LGD

DTI = 每月债务支出 ÷ 每月总收入
LGD = 违约损失率

其中造成风险的概率常可能表现为 sigmoid:

p_default
= sigma( beta0
+ beta1 * Util
+ beta2 * DTI
+ beta3 * Housing
+ beta4 * CashAdvance
+ … )
Util = 信用卡使用率,在其他银行刷卡多可能是负面的

  • Util / DTI / Housing:连续变量,进入非线性函数 → 产生“看似硬阈值”的拐点
  • Cash advance:应该是负面标签

这解释了为什么 适度 balance是加分项,但不是越高越好,违约率增加。


2.3 Uncertainty

  • Employed 显著更稳
  • 近期新账户 / HP 多 → pre 消失
  • 有其他银行的频繁往来是negative
  • 需要其他银行的高额度卡使用历史

可表示为:

Uncertainty
= u1(Employment Status) + u2(Recent Credit) + u3(Credit History) *1/Average_Credit_Age + …

  • Employed:最低不确定性
  • Self-employed / Student:更高不确定性
  • 信用报告“稳定”:缩小风险区间
  • 高额度卡历史:显著降低不确定性
  • 平均历史越高,Credit history相关的uncertainty越低

2.4 Why Income Is a Hard Positive

收入在模型中具有三重作用:

  1. 直接提高 E[Profit]
  2. 作为分母压缩 DTI、Housing/Income 等风险比值
  3. 降低风险估计的不确定性

Income up
=> E(Profit) up
=> E(Loss) down
=> Uncertainty down

这解释了为什么 500k 收入可能表现为hard positive / 硬破阈值,同时给出了一些其他可能有用的建议。

8 个赞

大家快跑啊 C1 又来骗炮了 还一次骗3个炮
:troll:

来不及看 先点赞 但是我觉得数据不足以很好的理解各种模型。。。只能分析个正相关负相关

1 个赞

同意,纯纯的胡扯,不过可能有一点点指导意义吧

3 个赞

眾所周知第一行
if income>1M
accepted
end

真的假的?稳稳的吗?不过就算如此,还是有不愿意这么去弄的坛友吧

找你要个4506c 就萎了。 :troll:

:doge:

是呗,且选国籍,其实这是个不好的label

感觉也没啥用 虽然银行一般都很古板 但是随便model往里面塞一堆参数 他也说不清哪些参数更重要了吧

一些指标可能还是有一些决定性作用,其实从最近的500k看,可能还是可以进一步优化下选项,毕竟这么多同国籍人士,都是500k莫名其妙…

个人觉得 10月底那一波 sub还是75k的时候 可能c1改了什么变得极易触发pre-approval

然后100k史高以后 又有些变动 变得不那么容易了 但还是要比最早简单

相比较之前的话 难度排序应该是 之前pre approval>现在preapproval+100k>现在preapproval+75k

自己之前10月底preapprove了 但是收入验证c1没接受(甚至就业那里还选的student) 最后的据信是too many cards in 24 months for given income

现在100k去尝试 不论选student还是employed 都是500k以内显示Based on your credit report from one or more of the agencies on the back of this letter, number of bank cards tradelines opened in the last 24 months for given income 和 Based on your credit report from one or more of the agencies on the back of this letter, there are too many recently opened credit cards

但如果写到500k 就是只有第二条 信报来说没啥变动 除了可能history+1month 消费pattern也是差不多的 甚至前后就差了两周—这也是为什么怀疑100ksub可能会有点关系 等史高过了再看看吧

另:

现在写1M甚至2M都没用 就提示too many recent card(但事实上比preapproval那次 各卡history还+1)

1 个赞

其他卡如果出了statement,也会有影响

我1m也被拒了 好像credit history至少要1yr才行

1 个赞

最近500k也不好用啊 :yaoming:
recent inquiry 你们c1自己心里没点b数吗 :yaoming:

可能是改了一些参数,以前可能收入影响其他指数太多了

但是感觉拒信上的理由都是random string,没什么参考价值 :yaoming:

拒信都是非常宏观的理由,所以需要一些分析来解析下这个模型

站长力作,但是感觉这个逆向有点难:yaoming:每个metric的weight感觉不好推
但是感觉500k or (刚过两年记录 and <5卡) 这两个条件任意一个还是挺容易过的