分类 数据分析 下的文章

第4课:工具演示——用SQL拼接销售、会员与产品数据


为了实现表与表之间的匹配连接,我们需要使用到SQL语句的连接语句JOIN语句。
INNER JOIN语句两边是需要进行链接的两张表,ON后面的部分则是告诉SQL是根据两张表里的哪个字段去进行表与表之间的连 
接。
语法:
SELECT column_name(s)
FROM table1
INNER JOIN table2
ON table1.column_name=table2.column_name;

LEFT JOIN:包含LEFT JOIN语句左边表的全部记录以及语句右边表能匹配上的部分记录
RIGHT JOIN:包含RIGHT JOIN语句右边表的全部记录以及语句左边表能匹配上的部分记录

inner join加上left join再加上right join三种join方式的结合

  

第3课:数据清洗与整理


在上节中,我们根据所需解决的数据分析问题,完成从多个数据表中拼接聚合数据的过程,在确认数据在收集前后完整而且 
准确后,我们将进入下一步,对数据质量进行变量级别的清洗与整理。

在这个阶段中,我们工作包含两个方面,一个是“清洗“,即将有问题的数据排除出去,这里主要涉及对数据缺失,异常和其 
他问题的处理;另一个则是”整理“,即将数据转化成更有助于后续分析的样式,比如将实际年龄转换成80后,90后这样有业 
务意义的分组。

数据清洗
–
数据清洗涉及数据缺失,异常和其他问题的处理
数据缺失
    缺失的信息来自于哪个数据表?在原表中它们也是缺失的吗?
    如果在原表也缺失,那么是否是有收集信息的疏漏?
    缺失信息的比例是多少?
数据异常
    数据有明显违背常识的错误
    数据的离群值
    特殊数字来标注“缺失值”

数据整理
–
对数据进行统一的格式化和命名规则处理
对某些信息进行重新编码以满足后续分析需求

第2课:界定数据分析问题


案例——腾讯视频: 界定问题,将what转变为how

49M.png

I.png

(V~_Y5@4@CYC4W5UX3P%C)Y.png

@_54KI9RIL%(7CI9H%`~M%5.png

界定业务问题(以宜家为例)
WHAT
–
通过顾客购买产品所产生的营业收入和利润数据,随时了解企业的经营状况
问题:
我们这个月的收入和利润如何?
每个顾客在我店里大概都会花多少钱?
家具类产品里面是沙发卖的好还是桌子好?

WHY
–
通过数据挖掘,发现与17年相比,18年的用户花费在高价产品(2000+)的比例少了很多
问题转变为:
为什么顾客购买的平均单价在下降?
我们在这里对数据进行了深挖,可以看到,和18年相比,19年的用户花费在高价产品(2000+)的比例少了很多,
背后的原因可能涉及到经济,市场和其他等因素,但对宜家来说,直接的原因就是用户没有花钱在价格高的产品上。

HOW
–
采取“精准营销”模式,识别高价值顾客,实施针对性的营销方案,发放专属优惠券促进顾客购买。
此时,问题拆分为:
定义高价值顾客,并从数据中识别高价值顾客的具体特征;
选择那些在收到优惠券之后使用的顾客,将优惠券推送至会员卡,并跟踪分析后续的使用和购买情况。

界定业务问题与分析计划
Step 1 识别关键环节,将 What 转变为 Why
–
与关键的业务人员一同参与,识别能用数据驱动业务发展的关键环节。
业务人员从自身角度出发往往是带着WHAT问题而来,
我们需要用数据引导他们走向WHY/HOW的问题层。

Step 2 选择分析计划
–
根据业务目标找到所有可能解决的技术方法与所需数据,选择分析计划。
不同的分析方法在所需的数据准备工作上会有较大差别,实施时间长度也会有所不同,
因此要在这里罗列出各个方案的细节目标与数据需求。

Step 3 明确衡量分析项目成功的标准
–
最终哪些数据的变化,能够体现数据分析实现的价值?

第1课:什么是数据分析


1.什么是数据分析?
数据分析是根据业务问题,对数据进行收集,清洗,处理和建模的过程,用于识别有助于业务的信息,获取关键业务结论并 
辅助决策制定。这个定义实际上是从两个层面来解释数据分析:

    它具体是在做什么?
    它能产生什么样的价值?

2.数据分析具体在做什么?
业务问题的界定→数据收集与清洗→分析与模型

3.数据分析产生什么价值?
数据分析是为企业盈利的
    提高收入
        更低成本获客
        提高现有顾客购买金额
        让购买中低端产品的顾客购买更高价利润更高的产品
    成本和风险控制
        帮助企业预测市场走向
        减少产品滞销和畅销产品断货的几率
        优化内部经营效率 

4.数据分析越发重要的原因
数据增长,用户创造了大量的数据
数据的储存与计算能力不断提升
在大数据环境下,基于分析所进行的各种场景优化都可以进行数据采纳和验证,使数据分析的价值可以量化

5.领英Linkedin :数据分析帮助互联网企业获取了大量的用户,最终实现盈利
成果:因为深度挖掘用户数据,在2009年成立6年后,从百万级用户增长至亿万级用户,并在2016年被微软以260亿美元巨资 
收购。
对用户数据深度挖掘,如工作时间、学校、共同认识的人等
推出了“你也可能认识的人(People You May Know)”的功能
强化了用户的关系粘度,实现了用户网络的爆炸式增长