建模方案3.2特征工程3.2.1用户信息特征 1 个问题 2 问题分析 2.1 问题背景 随着科技的发展,银行陆续打造了丰富多样的线上线下客户触点,满足客户日常业务办理、渠道交易等需求。面对海量客户,银行需要更全面、更准确地洞察客户需求。在实际业务开展过程中,需要发现客户的流失,预测客户资金的变化;提前/及时对客户进行营销,减少银行资金流失。本次大赛提供实际业务场景中的客户行为和资产信息作为建模对象。一方面,希望展示每位参赛选手的实际数据挖掘能力。营销解决方案充分体现了数据分析的价值。 2.2 赛题分析与理解 通过对赛题的分析理解,本次比赛的任务是:根据用户的基本信息、资金状况和每个季度的行为信息,建立客户流失预警模型,找出客户流失的原因,并协助商家加强客户维护和营销,增加客户粘度,减少客户/资金流失。这个建模的目标是根据用户前两个季度的历史数据预测下一季度用户的标签(-1/0/1,标签有递增关系)。问题转化为三分类问题,特征由1) aum_m(Y), 2) behavior_m(Y), 3) big_event_Q(Z), 4) cunkuan_m(Y), 5) cust_info_q(Z)构成桌子, 3 建模方案 3.2 特征工程 3.2.1 用户信息特征 数据源表:cust_info_q(Z季度客户信息) 家庭年收入、年龄等数值类型直接输入模型。发现不同标签下的年龄分布差异较大。 将性别、客户等级、职业等分类类型转换为分类变量并输入到模型中。发现普通用户是最大的流失客户群。 此外,用户信息的完善程度可能会影响用户的忠诚度,从而对基础信息的缺失率特征进行处理。 3.2.2 资金状况特点 数据源表:aum_m(Y月末资产数据)、behavior_m(Y月行为数据)、cunkuan_m(Y月存款数据): 主要处理存款、金额、交易金额的方差、平均值、增长率、最大值和最小值,并结合字段含义进行组合推导。 其中,月入金C1和产品数量C2分布在不同的标签下,发现资金流动风险高的用户整体入金金额/产品数量相对较低,且呈下降趋势时间。 3.2.3 时间特征 数据源表:behavior_m(Y月行为数据)、big_event_Q(Z季度客户主要历史数据) big_event_Q(Z)主要是第一次转账、入金等日期,从今天到开户处理的日期区间,反映客户的活跃度; behavior_m(Y) 有季度末的最新交易日期。通过处理交易的具体时间和星期几等时间特征,可以反馈用户的一些行为。发现不同标签用户的交易时间分布差异较大,针对特定时间段(12点,>14点)做了离散化。 3.2.4 序列预测特征 由于计算资源不足导致拟合效果不佳,该模块的特征没有包含在模型中。不过这个方法考虑了时间序列的连续性来预测未来的资金情况,可以作为这个程序的一个小亮点。 考虑到项目的标签定义与资金波动情况有很大的关系,本模块序列预测特征的思路是利用(LSTM或LGB)回归,基于Q4季度的资金情况进行预测前几个月的历史资金数据(比如Q3季度作为训练样本),将预测的数值结果作为特征放入模型中。 3.2.5 Featuretools组合特征 Featuretools 是一个用于自动特征推导的开源库。它主要采用转换和聚合的方法自动推导特征,以补充人工推导特征的不足。我们先通过lightgbm进行训练,然后人工选择split和gain重要性前150的特征,然后使用Featuretools成对做乘法/除法,做特征交互特征。考虑到Featuretools组合的变量噪声较大,模型最终选择Top300 Featuretools的重要特征进入模型。 3.3 特征选择 特征选择的主要方法有: 1)筛选方法:皮尔逊相关系数(衡量变量之间的线性相关性)、缺失率和单值率等;2)打包:多个特征集(前向/后向))迭代寻找最优子集。3)Embedding方法:通过LGB模型选择特征重要性较高的特征。考虑到有限的计算资源,该方案采用:筛选方法初步筛选后,模型通过嵌入方法进一步筛选重要特征。这种方法更有效,因为模型学习和特征选择的过程是同时进行的。 3.4 模型训练 LightGBM(Light Gradient Boosting Machine)是一个实现了GBDT算法的框架,支持高效的并行训练,训练速度更快,内存消耗更低,精度更好,支持海量数据的分布式处理。并且它支持分类变量等优点。基于派生特征,共有1211维特征,包括原始特征和类别特征。Lightgbm就是用这个训练的,用贝叶斯方法调整参数。单模型验证集的Kappa值约为0.49(在线测试集的Kappa值约为0.475)。 3.5 模型融合 受到bagging思想的启发,我们对训练集随机采样5次(采样率70%)银行零售流失客户挽回方案,随机采样列,使用贝叶斯优化选择子模型,最终得到5个lgb子模型进行bagging。该方法在参数和特征上都引入了多样性(差异),最终大大提高了bagging的泛化效果,OOT测试集Kappa约为0.483。 3.6 建模过程中的发现与创新 1)总结用户画像:在特征处理的过程中,我们总结了高流失用户的用户画像: 2) Features 设计了序列预测特征:考虑时间序列的连续性,预测未来资金情况,将预测的数值结果作为特征。 3)模型易于部署:最终模型使用5个Lightgbm进行均值融合,模型结构不复杂且易于部署,达到了在线Kappa 0.483的效果。 4 营销方案 4.1 客户流失综合原因分析 当今银行产品同质化现象很普遍。客户选择产品和服务的方式越来越多,客户对产品的忠诚度越来越低。获取新客户的成本远高于维护老客户的成本。因此,客户流失成为银行业最为关注的问题之一。客户流失的原因可以分为两类: 第一类是缺乏非主观意志。比如破产,工资卡变更等。 第二类是未满足的需求。原因比较复杂,比如产品营销活动少、产品利率较低、经营体验差、客户自身需求变化、竞争对手策略、国家政策等。 结合模型对客户流失特征(Shap值)的分析,对客户流失贡献度高的特征有:存款金额小、存款产品少、AUM低、年龄小等,综合原因可能是产品没有竞争力,活动少,不重视年轻客群。我们建议可以采取相关措施,如:加强客户关系维护、差异化营销、扩大销售、多开展营销活动等。 (注:本节亏损原因分析是从建模技术层面分析的,无疑是比较片面的,具体原因可以结合宏观政策变化、营销活动等因素来分析)流失趋势,并通过流失客户资金流向分析补充证据。) 4.2 营销策略 4.2.1 客户群体细分 商业银行客户数量庞大银行零售流失客户挽回方案,银行自身资源相对有限。考虑到成本效益的原则,我们需要重点关注容易流失的优质客户。因此,我们首先将客户群体分为两步: 第一步:借助流失预警模型,我们可以将客户的流失倾向分为三类:高流失风险客户群(-1)、低流失风险客户群(0)、稳定客户群(1) . 第二步:根据客户的质量,大致可以分为以下三类:低价值客户、有价值客户和高附加值客户。我们可以综合考虑客户等级、Aum值、最近一次消费区间、消费频率、消费金额、金融产品数量、金融产品金额、未来价值这些维度(通过这个序贯回归预测模型预测未来的AUM值),我们有具体划分客户群质量的两种方式: 方法一:根据客户在各维度指标中的排名分布划分价值客户(例如,以各指标的第80个百分位点作为参考阈值)。各维度指标具体划分门槛,请参考业务建议。 方法二:以各维度指标为特征,归一化后采用聚类方法建模划分K个客户群,以各客户群的中心值定义客户群的价值类别。 4.2.2 整体客户经营策略 按综合损失风险和质量属性划分客户群后,针对不同类型的客户制定不同的营销策略: 4.2.3 大客户管理策略 在这种细分结构下,我们专注于存在流失风险的高价值/附加值客户,并根据他们的需求为他们量身定制营销方式: 1)借助用户画像了解其特点,提供个性化服务和优惠政策。如:提醒参加营销活动、增加贷款授信额度等; 2)通过建立营销推荐模型交叉销售更多优质产品; 3)建立专职客户经理机制,做好营销渠道(如电话营销)和客户的用户问卷调查。 5 思考与展望 5.1 聚焦客户生命周期与智能营销 需要注意的是,当客户处于不同的生命周期阶段时,需要满足不同的需求。结合客户生命周期管理,对每一类客户进行深入理解和量化管理。通过区别对待处于不同客户生命周期阶段的客户,实现企业资源的优化配置。 5.2 其他营销点 5.2.1 营销时机等偏好 挖掘客户手机APP登录、转账、购买理财产品等活动的活跃时间段,并参考每个客户的活跃时间段,有针对性地发送营销短信。 5.2.2 洞察客户需求 获取更多类型的数据(参与活动、理财习惯),评估客户的兴趣爱好,推荐适合客户的营销产品。 |
另一视角
换一换- 移动手机号贷款口子_口子贷款移动手机号怎么改
- 支付宝贷款口子有多少_支付宝的口子
- 无视征信线上借款app_借款征信_借款app不上征信
- 只需要身份证贷款口子_贷款需要身份证号码吗
- 有网银流水求贷款口子_流水贷款是真的吗_银行流水网贷
- 支付宝账号贷款新口子_支付宝申请贷款口子_支付宝的口子
- 大学生贷款秒下的口子_口子下款秒到_口子贷款
- 只需要身份证贷款口子_贷款需要身份证号吗
- 有信用卡能贷款的口子_有信用贷可以办信用卡吗
- 急需1000贷款口子_贷款新口子秒下1000
- 微信客户服务平台(微信诞生于哪一年)
- 北京整体喷砂机械厂家排名并附上它们的简要介绍
- 创业分析和综合分析一样吗?(不同概念的不同场景)
- ppp项目贷款怎么申请和审批?
- 360贷款投诉电话大全(快速解决贷款问题,让你安心借款)
- 2023元旦高速公路有免费吗?
- 现在的取暖煤真的降价了吗?
- 煤炭价格下月能降下来吗?
- 煤炭价格为什么会爆涨?
- 我们这边现在一吨自己烧锅炉的1400—1800元了,你们那里多少钱啊
- 广东又开始限电了,是不是制造业产能过剩了?
- mg通胀连续超记录之后,还会怎么走?
- 欧盟提出应对气候变化一揽子计划,企业和消费者将受到哪些影响?
- 苏伊士运河被堵事件分析
- 苏伊士运河被堵,长荣公司预计赔多少钱?
- 为什么日本作为发达国家,日元却这么不值钱?
- 澳大利亚铜精矿出口暴跌80%,澳企还能顶得住吗?
- 听说在新西兰居住超过10年,到65岁就可以领取退休金对吗?
- 俄罗斯真的有全民免费医疗吗?
- 欧盟各国,农村老人的养老金与城市老人养老金差距大吗?
- 2024年五大审核快、下款易的网贷平台推荐
- 如何有效应对网贷对征信的影响?解析网贷与信用管理策略
- 征信有污点还能贷款买车吗?五大策略助你成功贷款
- 网贷还清后征信多久更新?逾期记录多久消除?5大征信维护技巧
- 2024年5大审核宽松、快速下款的贷款平台推荐
- 2024年5大网贷平台快速下款5000元
- 2024年黑户好下款的5个网贷平台:低门槛快速放款
- 征信差负债多也能借钱:盘点5个门槛低、快速下款的网贷平台
- 盘点5个最快放款的网贷平台,借款秒到账,轻松解决资金需求
- 借款容易通过!推荐5个适合急需资金的网贷平台
- 网贷逾期一年多,没人催收也没被起诉?
- P2P里的借方都可以不还钱了吗?为何不归为“失信”人?
- 如果网贷全面取缔来临,出借人和借款人,哪一个最受益?
- 卢志强从未投资团贷网 22万出借人觉得呢?
- 有多少人受了P2P的亏?有多少人投进去的钱拿不回来的?
- 手机hao被盗用,申请网贷,金融机构找我追款,怎么处理?
- 平台进行协商后要求借款者只还本金,不还征信会受到影响吗?
- 借了网贷钱后,还款也有套路?
- 欠了一大笔网贷,即将全面逾期,应该如何度过这个时期?
- 网贷逾期后,这个还款协议千万不能签!否则这辈子别想还清知道吗
- 招商银行网上银行官网(如何在网上开通招商银行的电子银行)
- 12378网贷协商还款有用吗(12378协商还款技巧)
- 招行一网通(招行一网通账户什么意思)
- st康美药业股吧(未来康美会被退市吗)
- 邮政储蓄卡人工客服电话(邮政投诉95580管用吗)
- 龙江交通股票(沾龙的上市公司)
- 算利息的软件(陕西信合怎么查利息)
- 支付宝里的网商银行怎么贷款(支付宝网商贷怎么开通条件)
- 中信银行怎么转人工服务(怎么转中信银行的人工服务)
- 余额宝10万元一天收益(余额宝存10万一天多少钱)
- 是高市净率好还是低市净率好?
- 为什么最近很多人买基金都亏了?
- 基金都是牛市赚大钱,熊市亏大钱,为什么出现这样的情况?
- 为什么很多新基民喜欢买新基金?
- 首只ETF发行失败,基金募资失败或被清盘,投资者有哪些损失?
- 按照排行榜买基金,为什么总受伤?
- 100万用来买大盘基金,年收益用来当生活费,能不能做到一辈子不
- 投资者买基金时,买的是什么?
- “爆款基金”值得投资吗?
- 基金的表现,会均值回归吗?
- 如何看待那些把人民币兑换成美元现金放在家里的人?
- 今日人民币最新外汇牌价查询(2021年11月12号)
- 今日人民币最新外汇牌价查询(2021年11月11号)
- 今日人民币最新外汇牌价查询(2021年11月9号)
- usa的钱我们叫美元,那人民币走出国门,在国外叫什么?
- 今日人民币最新外汇牌价查询(2021年11月7号)
- 今日人民币最新外汇牌价查询(2021年11月6号)
- 今日人民币最新外汇牌价查询(2021年11月4号)
- 今日人民币最新外汇牌价查询(2021年11月2号)
- 今日人民币最新外汇牌价查询(2021年11月1号)
- 第24届冬奥会铜合金纪念币预约为何没有出现“秒杀”?
- 河南发现50吨特大金矿,对世界金价有影响吗?
- 个人储备较多黄金算违法吗?
- 可以把手里的闲钱买成黄金,来抵御货币贬值?
- 现货黄金行情分析软件下载后怎么做?
- 黄金典当和黄金回收,哪种方式好?
- Taper临近,滞胀担忧来袭,黄金真能翻身吗?
- 黄金现在跌到多少钱一克了?
- 非农数据“爆冷”,金价后续又将有怎样的走势?
- 2021年10月11号金店黄金价格今天多少一克?
- 2024元旦哪天是法定节假日呢英语 2024元旦是星期几
- 2023元旦高速收费吗现在 2023元旦为啥不免高速费
- 2023元旦农历日期 23年元旦时间
- 2023元旦哪天算加班呢视频 2023劳动节哪天算加班
- 2023元旦放假时间表图片大全 23年元旦假期安排
- 2023元旦海报宣传语图片 2023年元旦海报宣传语
- 2023元旦法定节假日是几天休息 2023法定节假日放假安排
- 2023元旦法定节假日是哪几天 2023年1月份国家法定假期几天
- 2023元旦节高速免费几天 2023年元旦免过路费吗
- 2024元旦要补班么 2024跨年是星期几
- 宝马金融贷款操作指南(详解宝马金融贷款流程)
- 夫妻两人每人月薪3000,工作稳定,小县城,能养的起比亚迪汉吗?
- 最近大雪,很多电动汽车都开不了了,电动汽车的发展之路是不是还
- 网友都说小米汽车以后会超越特斯拉,在技术上有实现的可能性吗?
- 特斯拉生产供应链基本都靠中国,为什么我们不能成,特斯拉能成?
- 汽车传感器市场分析,国产机会如何?
- 大家聊聊今年汽车行业市场行业现状与趋势?
- 存一万给一辆电动车,银行为什么那么大方?
- 为什么有那么多人骑电动车上班?
- 你觉得自动驾驶的前景如何?
- 中国城市GDP排名2020年排行榜-2020全国GDP省份排名一览表
- 2020年中国区块链企业百强榜
- 2019年全球银行千强排名,中国包揽前四,总利润3120亿美元
- 华尔街金融巨头有哪些?华尔街十大金融巨头排名排行榜
- 法国各大银行排名排行榜:法国巴黎银行排第二,第一名成立最早
- 德国银行排名排行榜:德国商业银行登榜,第一名德意志银行
- 巴西各大银行排名排行榜:巴西哪家银行最好?巴西银行仅第三
- 加拿大银行排名排行榜:皇家银行第一 历史最悠久的排名第四
- 2020全球500强排名排行榜完整版 世界五百强排名一览表
- 2020福布斯全球最新富豪排名排行榜 杰夫·贝佐斯位居世界首富第
- borrow borrow是什么意思
- 磁力搜索引擎是什么 什么叫“磁力搜索”
- 魔兽怀旧服金币交易平台5173 魔兽世界亚服怎么卖金
- 秋田犬币怎么样 什么是柴犬币
- tokenpocket下载 tokenpocket怎么使用
- 日币换人民币汇率计算器 nt换算rmb计算器
- 美元未来可能一路暴跌2022 2023年金价最便宜是多少
- 比特币最全历史价格明细 比特币历史最高价格是多少美元
- implication 硕士论文中最后一章“implication”是什么意思
- kitty磁力猫 磁力猫手机app