Python使用RMF聚類分析客戶價值

来源:https://www.cnblogs.com/blogs/archive/2019/12/07/12003145.html
-Advertisement-
Play Games

投資機構或電商企業等積累的客戶交易數據繁雜。需要根據用戶的以往消費記錄分析出不同用戶群體的特征與價值,再針對不同群體提供不同的營銷策略。 用戶分析指標 根據美國資料庫營銷研究所Arthur Hughes的研究,客戶資料庫中有三個神奇的要素,這三個要素構成了數據分析最好的指標 R-最近一次消費(Rec ...


投資機構或電商企業等積累的客戶交易數據繁雜。需要根據用戶的以往消費記錄分析出不同用戶群體的特征與價值,再針對不同群體提供不同的營銷策略。

用戶分析指標

根據美國資料庫營銷研究所Arthur Hughes的研究,客戶資料庫中有三個神奇的要素,這三個要素構成了數據分析最好的指標

    R-最近一次消費(Recency)

    F-消費頻率(Frequency)

    M-消費金額(Monetary)


通過該圖將用戶進行分類:

    R、F、M都很高,重要價值客戶(VIP客戶)

    F、M很高,R不高,重要保持客戶

    R、F、M都很低,流失客戶

    M很高,R、F不高,重要輓留客戶

 

根據這8個類別的R、F、M指標,對用戶進行標註,哪些是重要價值客戶,哪些是重要保持客戶,哪些是重要發展客戶,哪些是流失客戶等

 

流程介紹

以R、F、M這三個核心指標為維度進行聚類分析

利用K-means聚類分析將用戶分類

根據R、F、M指標,對用戶進行標註

 

準備工作:
數據

     某電商企業客戶近期購買的數據。包含客戶註冊日期,最後購買日期以及購買消費總金額

 

參數:

R-求出最近一次投資時間距提數日天數

F-月均投資次數

M-月均投資金額


目標:分析客戶交易數據,用戶群體的特征與價值,進行精準營銷,降低營銷成本,提高銷售業績。

1  分析數據獲取RFM

R-求出最近一次投資時間距提數日天數

    確定一個提現日,減去用戶的最新投資日期

F-月均投資次數

    總投資次數/總月數

M-月均投資金額

    投資總金額/總月數

 

 

處理數據獲取R-F-M

def dataChange(data):
    deadline_time = datetime(2016,7,20)
    print(deadline_time)

    # 時間相減 得到天數查 timedelta64類型
    diff_R = deadline_time - data["最近一次投資時間"]

    # 渠道具體天數
    # days = diff_R[0].days
    R = []
    for i in diff_R:
        days = i.days
        R.append(days)

    print(R)
    '''
    用戶在投時長(月
    Python沒有直接獲取月數差的函數
    1、獲取用戶在投天數
    2、月=在投天數/30,向上取整
    '''
    diff = deadline_time - data["首次投資時間"]
    print(diff)

    # 利用向上取整函數
    months = []
    for i in diff:
        month = ceil(i.days/30)
        months.append(month)

    print(months)

    # 月均投資次數
    month_ave = data["總計投標總次數"]/months
    F = month_ave.values
    print(F)

    # 月均投資金額
    M = (data["總計投資總金額"]/months).values
    print(M)

    return R, M, F

 2 訓練KMeans模型

先對數據進行轉換,然後通過K—Means模型訓練,生產模型

def analy_data(data, R, M, F):
    cdata = DataFrame([R, list(F), list(M)]).T
    # 指定cdata的index和colums
    cdata.index = data.index
    cdata.columns = ["R-最近一次投資時間距提數日的天數", "F-月均投資次數", "月均投資金額"]
    print("cdata_info:\n", cdata)

    print("cdata:\n", cdata.describe())

    # K-Means聚類分析

    # 01 數據標準化  均值:cdata.mean()   標準差:cdata.std()
    # 對應位置分別先相減 再相除
    zcdata = (cdata-cdata.mean())/cdata.std()
    print("zcdata:\n", zcdata)

    # n_clusters:分類種數  n_jobs:計算的分配資源  max_iter:最大迭代次數  random_state:隨機數種子,種子相同,參數固定
    kModel = KMeans(n_clusters=4, n_jobs=4, max_iter=100, random_state=0)
    kModel.fit(zcdata)
    print(kModel.labels_)

 

3  通過模型對用戶標註

   # 統計每個類別的頻率
    value_counts = Series(kModel.labels_).value_counts()
    print(value_counts)

    # 將類別標簽賦回原來的數據
    cdata_rst = pd.concat([cdata, Series(kModel.labels_, index=cdata.index)], axis=1)
    print(cdata_rst)

    # 命名最後一列為類別
    cdata_rst.columns = list(cdata.columns) + ["類別"]
    print(cdata_rst)

    # 按照類別分組統計R, F, M的指標均值
    user_ret = cdata_rst.groupby(cdata_rst["類別"]).mean()
    print(user_ret)

 

'''

        R-最近一次投資時間距提數日的天數   F-月均投資次數         月均投資金額
類別
0 27.859375 2.820312 21906.754297
1 20.684211 4.552632 115842.105263
2 10.568182 5.579545 26984.313636
3 12.111111 17.277778 107986.000000

結論:
類別3:R、F、M都比較高,屬於重要價值客戶 或 超級用戶
類別0:R、F、M都比較低,屬於低價值客戶
類別1:R一般、F一般、M很高,也屬於重要價值客戶

'''

通過模型對新用戶標註

1、獲取新用戶數據

2、通過和原數據處理獲取RFM

3、通過訓練模型得出用戶類型

def user_classes(cdata, user_info):
    '''
    # 模擬一條用戶數據
    1、獲取當前時間表示為截止時間
    2.計算出: R F M

    '''
    R, M, F = user_info_change(user_info)
    user_data_info = DataFrame([[R], [F], [M]]).T
    print(user_data_info)

    # user_data_info = DataFrame([[12.5], [18.0], [20000.0]]).T
    user_data_info.index = ["lily"]
    user_data_info.columns = cdata.columns
    print("cdata_info:\n", user_data_info)

    new_zcdata = (user_data_info-cdata.mean())/cdata.std()
    print("new_zcdata", new_zcdata)

    kModel = load_model("user_classes.pkl")
    ret = kModel.predict(new_zcdata)
    print("new_zcdata_ret:", ret)
    # new_zcdata_ret: [3]

 









您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 編程只是 if ; 為了少寫重覆的代碼,有了迴圈 for/while; 但碰到很長的重覆代碼,可能用一個迴圈難以實現,所以出現了面向對象的思想: 類:就是你的迴圈主體 實例:就是對你的迴圈的一次調用 概念: 1. 在Python中,首字母大寫的,名稱指的是類。這個類定義中的括弧是空的 2. 類包括 ...
  • 本人第一次寫博客,之前都是用自己的日記本。 但是苦於不能時時帶著電腦,實在是不方便。。。。所以決定用手機。正好就是朋友也都在用博客,所以,,真香。。。 廢話不多說,點到為止。。 原理:比較兩個相鄰的元素,將值大的元素交換至右端。 冒泡排序的優點:每進行一趟排序,就會少比較一次,因為每進行一趟排序都會 ...
  • 大家好,歡迎來到樂位元組小樂的Java技術分享園地。這次給大家分享的是Tomcat 一. 什麼是 Tomcat Tomcat 是一個符合 JavaEE WEB 標準的最小的 WEB 容器,所有的 JSP 程式一定要有 WEB 容器的支持才能運行,而且在給定的 WEB 容器裡面都會支持事務處理操作。 T ...
  • 利用JavaFX設計一個井字棋游戲,其中包括了能夠與玩家對戰的AI。AI的實現相比五子棋來說要簡單得多,可以保證AI在後手情況下絕對不會輸,具體實現如下: /* * To change this license header, choose License Headers in Project Pr ...
  • 說在前面 我覺得沒有什麼錯誤是調試器無法解決的,如果沒有,那我再說一遍,如果有,那當我沒說 一、拋出異常 可以通過 raise 語句拋出異常,使程式在我們已經知道的缺陷處停下,併進入到 except 語句 raise句法: raise關鍵字 調用的異常函數名 ValueError (這個函數必須是異 ...
  • 一.賦值即定義 1.運行以下代碼會出現報錯 2.使用global關鍵字解決以上報錯 3.不推薦使用global global總結 x+=1這種是特殊形式產生的錯誤的原因?先引用後賦值,而python動態語言是賦值才算定義,才能被引用。解決辦法,在這條語句前增加x=0之類的賦值語句,或者使用globa ...
  • 作者:陳皓 (@左耳朵耗子) | 編輯:玲玲 來源:https://dwz.cn/YELpxqyC 對,你沒看錯,本文就是教你怎麼寫出讓同事無法維護的代碼。 一、程式命名 1、容易輸入的變數名。比如:Fred,asdf 2、單字母的變數名。比如:a,b,c, x,y,z(如果不夠用,可以考慮a1,a ...
  • 1 開發需要環境 工欲善其事,必先利其器。在正式開發之前我們檢查好需要安裝的拓展,不要開發中發現這些問題,打斷思路影響我們的開發效率。 安裝 swoole 拓展包 安裝 redis 拓展包 安裝 laravel5.5 版本以上 如果你還不會用swoole就out了 2 Laravel 生成命令行 p ...
一周排行
    -Advertisement-
    Play Games
  • .Net8.0 Blazor Hybird 桌面端 (WPF/Winform) 實測可以完整運行在 win7sp1/win10/win11. 如果用其他工具打包,還可以運行在mac/linux下, 傳送門BlazorHybrid 發佈為無依賴包方式 安裝 WebView2Runtime 1.57 M ...
  • 目錄前言PostgreSql安裝測試額外Nuget安裝Person.cs模擬運行Navicate連postgresql解決方案Garnet為什麼要選擇Garnet而不是RedisRedis不再開源Windows版的Redis是由微軟維護的Windows Redis版本老舊,後續可能不再更新Garne ...
  • C#TMS系統代碼-聯表報表學習 領導被裁了之後很快就有人上任了,幾乎是無縫銜接,很難讓我不想到這早就決定好了。我的職責沒有任何變化。感受下來這個系統封裝程度很高,我只要會調用方法就行。這個系統交付之後不會有太多問題,更多應該是做小需求,有大的開發任務應該也是第二期的事,嗯?怎麼感覺我變成運維了?而 ...
  • 我在隨筆《EAV模型(實體-屬性-值)的設計和低代碼的處理方案(1)》中介紹了一些基本的EAV模型設計知識和基於Winform場景下低代碼(或者說無代碼)的一些實現思路,在本篇隨筆中,我們來分析一下這種針對通用業務,且只需定義就能構建業務模塊存儲和界面的解決方案,其中的數據查詢處理的操作。 ...
  • 對某個遠程伺服器啟用和設置NTP服務(Windows系統) 打開註冊表 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\W32Time\TimeProviders\NtpServer 將 Enabled 的值設置為 1,這將啟用NTP伺服器功 ...
  • title: Django信號與擴展:深入理解與實踐 date: 2024/5/15 22:40:52 updated: 2024/5/15 22:40:52 categories: 後端開發 tags: Django 信號 松耦合 觀察者 擴展 安全 性能 第一部分:Django信號基礎 Djan ...
  • 使用xadmin2遇到的問題&解決 環境配置: 使用的模塊版本: 關聯的包 Django 3.2.15 mysqlclient 2.2.4 xadmin 2.0.1 django-crispy-forms >= 1.6.0 django-import-export >= 0.5.1 django-r ...
  • 今天我打算整點兒不一樣的內容,通過之前學習的TransformerMap和LazyMap鏈,想搞點不一樣的,所以我關註了另外一條鏈DefaultedMap鏈,主要調用鏈為: 調用鏈詳細描述: ObjectInputStream.readObject() DefaultedMap.readObject ...
  • 後端應用級開發者該如何擁抱 AI GC?就是在這樣的一個大的浪潮下,我們的傳統的應用級開發者。我們該如何選擇職業或者是如何去快速轉型,跟上這樣的一個行業的一個浪潮? 0 AI金字塔模型 越往上它的整個難度就是職業機會也好,或者說是整個的這個運作也好,它的難度會越大,然後越往下機會就會越多,所以這是一 ...
  • @Autowired是Spring框架提供的註解,@Resource是Java EE 5規範提供的註解。 @Autowired預設按照類型自動裝配,而@Resource預設按照名稱自動裝配。 @Autowired支持@Qualifier註解來指定裝配哪一個具有相同類型的bean,而@Resourc... ...