一、买单中商品组合的基本出现规律
数据概况
在纳入分析的全部 99 万条商品销售记录中,共涉及到了 21 万种商品,而其中有 9 万种在 8 月只被销售过一次,占所有商品销售记录的 10%。总共这 99 万商品销售记录构成了 67 万条买单记录。数据显示,有 56%的商品销售记录对应的是只包含一个商品的买单(占总买单数的 82%),而另外 12 万买单则均为多种商品的买单,对应了多达 43 万条商品销售记录。
根据前面给出的商品组合纳入标准,同时满足两条筛选标准的商品销售记录共 19 万条,涉及到 1.2 万件商品,共 6 万条买单记录。
商品组合数量
按照商品组合前提条件出现次数不低于 60 次,结果出现概率不低于 30%的标准(也就是数据中至少包括了 60×30%=18 次该商品组合),我们最终从 6 万条买单记录中筛选出了 2929 个商品组合。这近 3000 个组合中,28%包含了 2 种商品,36%包含了 3 种商品,30%包含了 4 种商品,6%包含了 5 种商品。
商品组合的价格分布
有趣的是,并非商品种类越多,组合的总价就越高,数据显示包含 3 种商品的购物组合其总价反而是最低的,换言之,只包括 2种商品的购物组合可能其中的商品平均售价要高一些。
组合涉及到的商品数量
所筛选出的约 3000 种组合实际上只涉及到了 400 种商品,其中有 121 种只在某种组合中出现,但另外 70%的商品都会在不止一个组合中出现,最多的一种商品竟然在 878 个组合中出现过。
商品组合的二级类目分布
数据非常明确的显示,高达 98%的组合内商品都属于果泥/米粉/婴幼儿辅食类,而品类中单价和比例都较高的婴幼儿奶粉二级类目中仅有 45 种商品被筛选入购物组合,在比例上几乎可被忽略,但由于其单价均较高,其市场价值则不可忽视。
更多阅读: