基于生存分析方法的我国互联网企业生存期分析

发布时间:2018-06-25 来源: 散文精选 点击:

http://img1.qikan.com.cn/qkimages/zgsc/zgsc201812/zgsc20181233-1-l.jpghttp://img1.qikan.com.cn/qkimages/zgsc/zgsc201812/zgsc20181233-2-l.jpghttp://img1.qikan.com.cn/qkimages/zgsc/zgsc201812/zgsc20181233-3-l.jpg
  [摘 要]文章利用Kaplan-Meier生存分析法和Cox比例风险模型对我国2014—2017年间244家已倒闭互联网企业和68家尚未倒闭企业进行实证研究,探寻我国互联网企业生存期规律及其可能的影响因素。研究结果表明:我国互联网企业生存期与企业的行业和地区都有显著关系。建议互联网企业应认清所在行业特点,深入研究所在地区网民习惯及地域特点,才能更好地持续经营。
  [关键词]互联网企业;Kaplan-Meier生存分析;Cox生存模型
  [DOI]10.13939/j.cnki.zgsc.2018.12.070
  随着我国互联网的普及和消费者消费习惯的改变,以计算机网络技术为基础,利用网络平台提供服务并获得收入的互联网企业发展迅猛。但一个不争的事实是,随着市场竞争的加剧,大量的互联网企业选择退出甚至被挤出市场。与中国的大部分行业一样,我国的互联网企业也呈现出较高退出率的流转特征(鲍宗客[1])。因此我国互联网企业呈现的一个显著特征是企业的持续经营时期很短。相关研究调查表明,中国企业平均生存时间大约为3.6年,其中中小企业的平均生存时间更短,仅为2.5年,与欧美企业相比相差甚远。除了寿命周期短,我国互联网企业能做强和做大的也是寥寥无几。因此,分析我国互联网企业生存时间的规律及其影响互联网企业生存的因素,并基于此为创业者提供投资借鉴具有重要意义。
  关于我国企业的生存期及其影响因素已有不少文献进行了研究。吴利华等[2]对企业生存理论研究进行了比较好的回顾,指出企业能否生存是外部环境因素和企业能力互为作用的结果。根据经济环境的变化,企业生存理论研究的侧重点有所不同。不同的学者从不同的角度构建企业生存理论以及论证影响企业生存的各种因素,如:资源投入、学习能力、规模与影响力(王淼薇等[3]、王峰[4]、林兰等[5]);战略选择(林兰等[5]、戚建梅等[6]、邓子梁等[7]);技术创新(鲍宗客[1]、吴冰[8]);外部融资约束(曹献飞[9])。由于企业生存数据普遍存在删失的特征,因此在上述企业生存理论研究和实证研究中多数引入了生存分析的理论框架。应用生存分析中的生命表分析、Kaplan Meier分析、Cox回归模型描述企业生存过程(曹裕等[10])以及对企业生存过程的影响因素进行分析(陈鸽林等[11])。但上述研究存在的一个问题是其实证多数采用的是工业企业数据(逯宇铎等[12]、王淼薇等[3]、戚建梅等[6]、邓子梁等[7]),其他企业类型数据比较少见。因此这些文献所得结论主要适用于工业企业,对其他类型的企业如互联网企业未必适用。基于互联网企业的生存分析研究除少数工作(如林若飞等[13])外尚不多见。本文弥补这一不足,研究互联网企业的生存期特征以及影响互联网企业生存的因素。我们采用大数据网络爬虫技术获取相关联网企业的数据,采用Kaplan-Meier生存分析法和Cox比例风险模型来探究不同行业、不同地区互联网企业的生存规律及可能存在的影响因素。
  1 我国互联网企业数据
  1.1 数据及变量
  本文采用网络爬虫技术爬取了国家企业信用信息公示系统中2014—2017年互联网企业数据。保留了注册时间在2014—2017年之间的企业数据。共计312家。其中倒闭或退出的244家,68家仍在经营。对于已经倒闭的互联网企业,将注册时间视为企业存活的开始时间,将国家企业信用信息公示系统中显示的注销时间视为企业倒闭的时间点,将注册时间和注销时间之间的天数视为该企业的生存时间;对于尚未倒闭的互联网企业,将注册时间视为企业存活的开始时间,将注册时间到2017年6月18日之间的天数视为企业的生存时间。
  根据已有企业生存理论研究文献,考虑到数据的可获取性,在互联网企业生存数据分析中,被解释变量为企业的生存时间及到2017年6月18日止企业的生存状态[0(存活)和1(倒闭)],解释变量包含企业的注册资本和第一股东出资比例两个定量变量以及企业所属行业和地区两个定性变量。其中,根据随机数据爬取的取样结果中频数由高到低,行业编号为:1(互联网+金融)、……、8(互联网+其他);根據截至2016年的全国各省份互联网普及率由高到低,所在地区为:1(北京)、……、29(黑龙江)。数据概览如下表所示。
  1.2 统计特征
  2 生存分析理论
  2.1 生存分析概念
  生存分析是研究生存现象和响应时间数据及其统计规律的一门学科。在刻画企业生存时间时通常用以下三个函数来描述:生存函数、概率密度函数和危险率函数。
  2.2 Kaplan-Meier生存分析
  为得到删失数据下生存函数的估计,Kaplan和Meier(1958)给出了生存函数非参数估计方法——乘积极限法,其优点是对数据的分布没有要求,利用条件概率及概率乘法原理来计算生存率,适用于生存时间数据的原始资料(或未分组资料),可用于小、中或大样本。应用中可以通过绘制Kaplan-Meier曲线比较不同条件下样本生存函数之间有无差异。除此之外,我们也可以采用log-rank test对数秩检验等定量分析不同样本的风险函数有无显著差异。
  2.3 Cox比例风险回归模型
  为研究企业生存究竟受到哪些因素的影响,考虑到删失数据的存在,通常采用Cox比例风险回归模型。该模型是一种半参数模型,对数据的分布没有要求。其基本形式如下:
  该风险比与基准函数无关,且不随时间t变化。这也是Cox模型基本的比例风险(proportional hazards, PH)假定。通常可以通过Schoenfeld残差图进行PH假定的检验。
  3 实证分析
  3.1 Kaplan-Meier曲线
  图1为不同行业的Kaplan-Meier生存曲线图。图1表明不同行业的生存曲线存在很大差异,其中技术创新型互联网企业有比较高的生存率。这与鲍宗客[1]

相关热词搜索:互联网 分析 企业生存 生存 我国

版权所有 蒲公英文摘 www.zhaoqt.net