内容摘要:网络商品区域分布是信息时代下经济活动的空间表现形式。本文通过多元线性回归模型,利用2012年统计年鉴以及淘宝网络平台相关数据,分析表征网络商品区域分布的重要因子,主要包括信息传输计算机服务投资、批发企业交易额,在此基础上提出了合理分布淘宝网络商品,提高网络商家的经营利润,进而优化我国电子商务均衡发展的思路和建议。
关键词:淘宝网 网络商品 区域分布 多元线性回归
网络商品是电子商务的重要依托,其区位分布不仅能体现区域内电子商务的均衡度,而且能为区域内部的商品流通进行有效的调节和有序的选择其合适的经济活动的一种形式。现阶段我国将网络商品区位性与区域组织相联系的宏观研究还处于摸索时期。基于此,本文以淘宝网为例,借助淘宝网络平台的相关数据对该网站商品的区域分布进行分析,意在揭示网络商品的区位对区域组织的影响力。
研究现状
目前针对网络购物的研究大多是集中在网络购物行为的影响因素、信用评价机制等视角上,对网络商品区域分布的研究并不多见。Kenji Hashimoto等(2002)将信息网络的虚拟空间与其实际地理位置结合起来进行分析。王蕾(2008)首次从省域层次对淘宝网络店铺的分布情况进行了实证分析,并对影响区域布局的相关因素进行了归纳,包括经济发达程度、货源地、交通便捷性等;杨丽花(2011)在相关研究中分析了领域设施对C2C实体店铺在城市中空间区位选择的影响,认为除了传统的传输网络、货源供给、市场集聚因素外,技术劳动力因素、信任因素成为电子商务区位选择的主流;王贤文(2011)研究结果表明经济发展程度越高、物流业越发达的地区越容易积聚大量的网络店铺以及网络商品。
前人的研究结论多是通过对数据的描述得来,但是经济发达程度、物流发达水平、货源充足程度以及教育水平等影响网络商品区域分布的因素应该用什么数据来表现以及说明还是模糊的,这正是本文尝试的方向。
变量选取与模型设立
相关研究表明,网络商品区域分布的影响因素主要包括经济发达程度、物流发达水平、货源充足程度以及教育水平,本文结合现有数据选取表征经济发达程度的指标有生产总值(X1)、第三产业总值(X2);表征物流发达水平的指标有快递从业人员(X3);表征货源从组程度的指标有批发企业数(X4)、批发企业交易额(X5);表征教育水平的指标有上网人数(X6)、信息传输计算机服务投资(X7)、教育投资(X8)。把淘宝平台商品数(y)作为因变量,建立的多元线性回归模型如下:
Y=β0+β0 X1+β0 X2+β0 X3+β0 X4+β0 X5+β0 X6+β0 X7+β0 X8+ε
数据来源与统计分析
(一)数据来源
本文中31个省(直辖市)的淘宝商品数据来源于淘宝平台,利用淘宝高级搜索得来。自变量数据来源于中国统计年鉴(2012年),整理后的数据参见附录。
(二)统计分析
1.相关性分析。首先分析因变量与各自变量之间的相关关系,通过相关关系的分析整理可知,商品数与第三产业总值、快递从业人员、批发企业个数、批发企业交易额、上网人数、信息传输计算机服务投资、生产总值这7个自变量的相关系数都超过0.5,均在0.01水平(双侧)上显著相关,说明相关性强;商品数与教育投资在0.05水平上显著相关,但是相关系数为0.398,相对于其他自变量而言,与因变量的相关性弱。
2.逐步回归。由表1可知,自变量之间相关系数普遍高于0.5,说明自变量之间的相关性强,为了尽量避免多重共线性对回归模型的影响,本文采用逐步回归的方式进行自变量的选取。
首先将与因变量相关性最强的自变量,引入线性回归模型,构造一元线性方程。查表1可知,与商品数相关性最强的自变量是信息传输计算机服务投资(X7),两者的相关系数为0.736,构造的一元线性方程如下:
y=-3301.989+78.435 X7
调整后的R2为0.562,F值为34.323,t值为5.859,该方程通过F检验和t检验。
然后再按相关性强弱引入第二个自变量,查表可以应该引入批发企业交易额(X5),两者的相关系数为0.715,构造的多元线性回归方程如下:
y=-2966.043+49.121 X7 +0.096 X5
调整后的R2为0.591,F值为22.689,X7系数的t检验值为2.799,X5系数的t检验值为2.367,该方程通过F检验和t检验。
再试着引入第三产业总值(X2),构造的多元线性回归方程如下:
y=-3265.156+58.271 X7 +0.203 X2
调整后的R2为0.522,F值为17.356,X7系数的t检验值为2.134,X5系数的t检验值为0.848,该方程通过F检验,X7系数通过t检验,而X5系数的t未通过t检验。
再试着引入批发企业个数(X4),构造的多元线性回归方程如下:
y=-2940.136+55.188 X7 +0.589 X4
调整后的R2为0.537,F值为18.392,X7系数的t检验值为2.470,X4系数的t检验值为1.292,该方程通过F检验,X7系数通过t检验,而X4系数的t未通过t检验。
依次类推,再先后引入上网人数(X6)、快递从业人员(X3)、生产总值(X1)、教育投资(X8),通过比较R2值的大小,0.591>0.537>0.522>…,可知第二个引入回归模型的自变量为批发企业交易额(X5)。
然后再按相关性强弱引入第三个自变量,查表可以应该引入第三产业总值(X2),构造的多元线性回归方程如下:
y=-2960.855+52.532 X7+01 X5-0.46 X2
调整后的R2为0.577,F值为14.615,X7系数的t检验值为2.034,X5系数的t检验值为2.152,X2系数的t检验值为-0.183,该方程通过F检验,X7 和X5的系数通过t检验,X2的系数未通过t检验。
依次类推,再先后引入批发企业个数(X4)、上网人数(X6)、快递从业人员(X3)、生产总值(X1)、教育投资(X8),综合比较R2值大小,以及回归方程是否通过F检验,回归系数是否通过t检验,可知最优的回归模型如下:
y=-2966.043+49.121 X7 +0.096 X5
该模型共引入两个自变量,分别是信息传输计算机服务投资(X7)、批发企业交易额(X5)。
通过计算,回归平方和为5.407E8,残差平方和为3.336E8,表明自变量可以在很大程度上解释因变量。
由于在引入变量的过程中采用了逐步回归的方法,所以很大程度上避免了多重共线性情况,回归结果显示两个自变量X7、X5容差均为0.502,VIF均为1.991,表明多重共线性的程度较小(见表2)。
3.残差分析。在回归模型的分析中,假定ε是期望值为0,方差相等且服从正态分布的一个随机变量。如果此假定不成立,后面的分析都有问题,因此有必要进行方差分析来确定有关ε的假定是否成立。残差分析包括以下几部分:
残差是否服从均值为零的正态性。由图1可知,标准化残差符合正态分布的假设。
残差的独立性分析。由表3可知,DW值为2.141,接近于2,可以认为该模型不存在自相关情况。
异方差分析。由图2可知,随着因变量的增加,残差有所波动,但是整体而言,基本上符合回归分析中方差企业的假设。
模型解释与研究结论
从回归模型中留下的自变量可知,表征淘宝商品数区域分布的主要指标为信息传输计算机服务投资、批发企业交易额。此结果表明,与国外相比,我国的互联网发展和普及程度较弱,从而导致我国消费者拥有的计算机网络经验和知识也相对较少,因此网络购物中的计算机服务投资是影响我国消费者网络购物行为的重要因素。网络购物的优势是为消费者提供便捷的购买方式,但网络购物涉及到商品的信息搜集、订购、付款等一系列程序,每个程序又有相应的操作流程和方法,对于网络经验较少的消费者会产生一种挫败感,从而放弃选择网络购买,因此本研究认为,我国的购买网站应该为消费者提供简单、易学易懂、易操作的购买流程,减少消费者的挫败感,提高消费者对网络购买的易用认知水平,以降低消费者购买所花费的时间并以减少消费者所做的努力为首要目标。批发企业交易额越大意味着该区域的批发市场越活跃,货源越充足,物流越发达,就会有更多的人在淘宝开店,自然商品数就越多,表明我国电子商务发展和当地的经济发达程度非常相关。
综上所述,通过理论及实证研究表明影响淘宝网络商品区域分布的影响因素主要有地区经济发达程度、物流发达水平、货源充足程度以及教育水平等,而主要表征网络商品区域分布的指标为信息传输计算机服务投资和批发企业交易额。
参考文献:
1.王贤文.中国C2C淘宝网络店铺的地理分布[J].地理科学进展,2011(11)
2.杨洋.基于回归分析的科普网站空间分布差异研究[J].科技创新导报,2010
3.俞金国.电子商务空间分布特征分析—来自淘宝网的实证[J].经济地理,2010(8)
4.周章伟.C2C电子商务模式下的网络店铺区域分布特征[J].热带地理,2011(1)
5.王蕾.C2C电子商务店铺区域分析的实证研究[D].河北师范大学硕士学位论文,2008
6.郭呈全,陈希镇.主成分回归的SPSS实现[J].统计与决策,2011(5)
- 本文标签:
|
|
【分享】 【打印】 【收藏】 【关闭】 | |
- 相关内容
- 更多
- 网络商品区域分布研究 [2014-6-11 9:59:56]
- 高端化妆品放低身段牵手本土电商 [2014-5-27 11:20:30]
- 化妆品行业进入“他时代” [2014-5-6 10:46:28]
- 女性商品设计风格研究 [2014-3-27 16:07:22]
- 大宗商品进口量与价格关系研究 [2014-3-27 15:59:09]
- 渠道费用暴涨 奶粉行业洗牌拉开大幕 [2013-10-29 11:02:36]
- 图片资讯
- 更多