Python

تحلیل Pareto: value_counts و سهم تجمعی

فراوانی، درصد و جمع تجمعی توی سه خط: نشون میده چند تا الگو 80 درصد حجم رو توضیح میدن.

کاربرد

اولویت‌بندی دلایل مرجوعی یا علت‌های حادثه: اول سراغ همون اقلیتی برو که بیشترین وزن رو داره.

پیش‌نیازها

Python 3.9+, pandas

Python
import pandas as pd

counts = df["motif_retour"].value_counts()
pareto = pd.DataFrame({
    "nb": counts,
    "part_pct": (counts / counts.sum() * 100).round(1),
})
pareto["cumul_pct"] = pareto["part_pct"].cumsum().round(1)

top = pareto[pareto["cumul_pct"] <= 80]
print(pareto.head(6))
print(f"\n{len(top)} motifs expliquent 80 % des retours")

نتیجه

                    nb  part_pct  cumul_pct
motif_retour
taille_incorrecte  612      38.3       38.3
article_endommage  389      24.3       62.6
ne_correspond_pas  201      12.6       75.2
change_avis        118       7.4       82.6
erreur_livraison    97       6.1       88.7
autre               83       5.2       93.9

3 motifs expliquent 80 % des retours
Pandasvalue_countsParetoAnalyse

اسنیپت‌های مرتبط

بازگشت به آزمایشگاه داده