1.数据展示
图1. 部分数据维度
2. 数据解读
2.1 kmeans聚类结果分析
分别求出Kmeans聚类结果label为0,1的公司的各个统计量,结果如图1,图2,图3,图4所示。
图2. kmeans 聚类label为0 的公司的统计数据
图3. kmeans 聚类label为0 的公司
图4.kmeans聚类 label为1 的公司的统计数据
图5.kmeans聚类 label为1 的公司
由上述四图可知,第一类公司(label = 0)有28家,第二类公司(label = 1)有20家。数据预处理中对融资轮次的划分如表1所示:
(1)融资轮次(finance)指标:对于第一类公司,其融资轮次(finance)的均值为0.32,第二类公司的融资轮次均值为3。
(2)租金(rent):对于第一类公司,其租金(rent)的均值为0.24,第二类公司的租金均值为0.41。
(3)知识产权(patent):包含商标,专利数量,软件著作数量。第一类公司,其知识产权指标的均值为0.57, 而第二类公司知识产权指标的均值为0.8。
由上述分析可知:
第一类公司的融资轮次普遍较低,知识产权数量较少,租金较低;
第二类公司的融资轮次较高,知识产权数量较多,租金较高。
同时参考公司排名,第一类公司排名均值为34.07,而第二类公司的排名均值为15.7。基于上述数据分析,我们可以推测,第一类公司的融资轮次较低,知识产权数量较少,一般为小型公司,因此其租金较低,排名较为靠后。同理,第二类公司的融资轮次较高,知识产权数量较多,一般为大型公司,因此其租金较高,排名较为靠前。
2.2 层次聚类结果分析
分别求出层次聚类结果label(agg_labels)为0,1的公司的各个统计量,结果如图6,图7所示。
图6. 层次聚类 label为0 的公司的统计数据
图6. 层次聚类 label为1 的公司的统计数据
从图6和图7可知,在诸多指标中,公司分类的主要区别在下列几个指标:
(1)融资轮次(finance)指标:对于第一类公司,其融资轮次(finance)的均值为0.62,第二类公司的融资轮次均值为3.43。
(2)租金(rent):对于第一类公司,其租金(rent)的均值为0.26,第二类公司的租金均值为0.43。
(3)知识产权(patent):包含商标,专利数量,软件著作数量。第一类公司,其知识产权指标的均值为0.62, 而第二类公司知识产权指标的均值为0.79。
结果与Kmeans相似。
从图像角度观察各个聚类指标的分布情况,如图8所示:
图8 各聚类指标数据分布情况
分布结果与上述数据分析一致。
故根据聚类分析结果,公司为增强自身的竞争力,应提高融资金额,专利等知识产权的数量。
上一篇:没有了
下一篇:没有了