还剩5页未读,继续阅读
文本内容:
论网站点击次数的正态分析方法奚回(单位略陕西西安710068)李兴波(保定金融高等专科学校河北保定071000)(特别说明本文是作者为了学习实证分析方法而刻意研究的一个问题,实用意义可能不大,练笔而已,敬请各位专家批评指正)摘要现行的网站点击次数分析方法有明显的缺陷,其根源在于没有对点击次数作随机变量考察本文作了这种考察,并验证了它服从正态分布正态分布的参数可以帮助网站分析其发展状况、与同业比较、制定科学的管理目标、考核员工等多种分析目的这种以正态分布为基础的分析方法,本文暂称为网站点击次数的正态分析方法关键词点击次数;分析方法;正态分布;参数
一、网站点击次数现行分析指标的缺陷和本文问题的提出随着我国经济社会的发展,计算机网络的应用已越来越普及,并发挥着越来越重要的媒介作用,因此,如何管理网络也变得越来越重要对一个网站来讲,点击次数(本文的分析方法,也适用于其他类似于点击次数的现象,如“某论坛某天发表的文章数”)的高低直接影响着其经营目标的实现程度,所以各网站总是极尽所能地提高其点击次数,并引入了一些与点击次数有关的分析指标,如最高点击次数、点击次数的不同期比较、点击次数的时间序列变化、一定期间点击次数的平均值等⑴同时、对于点击次数及其他网络流量信息重要性的关注也催生了商业性分析软件的应用,如ITSUN网站流量统计分析系统
②虽然这些指标(含分析软件所用指标)能够在一定程度上反映网站的管理状况,但是就对于点击次数的分析程度来讲,仍存在着明显的缺陷主要表现在
1、网站的访问者主要是网站无法控制的客户,所以点击次数是随机变量,上下变动频繁,这使现行分析指标的直接根据点击次数绘制的时间序列图波动剧烈、趋势弱虽然我们可以作回归分析来反映总体趋势,但回归直线和曲线的代表性都很差,如图1所示回归直线的R2仅为
0.0713,回归曲线的R2仅为O.lo而且回归线也不能提供更为详细的变动信息图1是根据“晋城在线”网站2005年7月1日至12月31日的点击次数绘制的时间序列图和回归线图,它说明了此缺陷的存在:图1晋城在线网站2005年7月1日至12月31日点击次数折线图和回归线图回归曲线y=
23.353x2_4E+06R2=
0.60684x+14,300,0003,800,0003,300,0002,800,0002,300,0001,800,000ZR9搀大灯浮等旧三之黄对笈不除超名巴大砥监密塔五监监落巴35第t4,800,
0002、最高点击次数是极端值,价值有限
3、各网站客观上需要能够在同业间相互比较的标准指标
4、考察点击次数出现在某个区间的概率(或频率)有助于网站制定科学的管理目标和考核标准但现行的分析方法没有涉及此分析角度
5、点击次数存在“周周期性”,即点击次数以一周为一个周期上下波动图2晋城在线2005年12月3日(周6)至12月17日(周6)的点击次数图2是晋城在线两周的点击次数时间序列图,它直观地说明了其点击次数存在周周期性3,700,0003,500,0003,300,0003,100,0002,900,0002,700,0002,500,0002,300,000123456789101112131415第t日点击次数存在周周期性的原因,可能是因为大部分用户访问网站的时间受其工作时间的周周期性的影响这种周周期性会影响现行考核分析指标结果的正确性或正确程度下面以晋城在线2005年11月和10月的点击次数对比分析为例,来说明这种影响的显著及剔除这种影响的方法该网站
11、10月的点击次数分别为95581509和98024557次,贝k
1、不考虑周周期性的影响则11月的日均点击次数为3186050次,10月为3162082次比较可知,11月的业绩高于10月,因为11月的日均点击次数上升了23968次但这只是假象
2、考虑周周期性的影响注意到,除4个整周外,10月余周
一、
六、日3天,11月余周
二、三2天我们已知晋城在线的点击次数明显地存在周周期性,周
六、日在低点,周
二、三在高点,所以10月的点击次数合计明显受低点影响,而11月则受高点影响要剔除这种影响,方法是忽略非整周数据中的周周期性数据,而保留其中的非周周期性数据(避免将非整周数据中的非周周期性数据也一同忽略掉了),然后将保留的数据并入4周数据中按4周计算日均点击次数其中,某天(例如周六)的点击次数周周期性数据,就是各周该天点击次数的期望值(平均值)这时,11月的日均点击次数为3168104次,10月为3162529次比较可知,11月的业绩比10月仅微弱上升,因为11月的日均点击次数比10月仅上升了5575次比较而言,本文认为第二种方法是科学的方法上述方法的对比,说明了点击次数周周期性对于分析结果正确性或正确程度影响的显著,而要理解并剔除这种影响,则需要对点击次数作随机变量考察鉴于以上对网站点击次数现行分析指标缺陷的分析,注意到网站“某一天的点击次数”是随机变量,它服从正态分布(后有实证检验),这使得利用正态分布的参数(U,2)对它进行科学考察成为可能所以,本文就拟从正态分布的角度,对网站点击次数分析方法进行研究,以期能改善现行指标的分析效果,或提出更有效的指标本文研究所用网站点击次数数据是“晋城在线”网站提供的公开的“晋城在线网站全频道点击次数月报表”(
2005.7T2)⑶在此,对该网站支持科学研究的实际行动表示感谢另外,在本文写作过程中,笔者曾查阅了相当数量的文献资料,但未发现一个与本文研究思路和内容类似或有关的文章,这使笔者的参考与借鉴无从进行,所以文内的不足可能在所难免,谨期能抛砖引玉
二、对“晋城在线”点击次数服从正态分布的实证检验表面上看,点击次数是离散型数据,但因为它取值范围广泛(0至几百万),所以应该把它看作连续型变量进行考察经笔者检验分析,证明晋城在线的点击次数服从正态分布表一是根据晋城在线2005年7-12月每天的点击次数样本数据计算的正态分布的分布函数(注意不是密度函数)频率概率对比表(其中自为实际点击次数除以10万后的四舍五入)表1晋城在线点击次数分布函数频率概率对比表k频率{C Wk}%概率{Wk}%k频率p{g Wk}%概率{己Wk}%p pP
200.
5434782610.
0126134813359.
782608756.
90034414211.
0869565220.
0446793153470.
1086956567.
46446235241.
6304347830.
8184675383577.
1739130477.
02111367252.
1739130431.
2738300543687.
584.
74415642263.
8043478263.
0878957353790.
7608695790.
11332948276.
521739136.
197391933896.
1956521793.
82972678289.
78260869610.
378291283997.
282608796.
070256272911.
9565217415.
154691624097.
8260869697.
123889423020.
6521739124.
414474184198.
9130434898.
825500833130.
4347826134.
242960994299.
4565217499.
393041093247.
8260869645.
592957924310099.79485127根据该表可绘制分布函数(注意不是密度函数)的频率概率对比图(图决鎏神3)如下:12345678910111213141516171819202122图3晋城在线点击次数分布函数频率概率对比图点击次数k二Round(实际点击次数/100000)从图3直观可知,晋城在线点击次数的分布与参数为(
32.9,
3.522)的正态分布有较好的拟合另外,还可以用x2检验对这一问题(Ho晋城在线点击次数服从参数为(
32.9,
3.522)的正态分布)进行更准确的检验检验结果为根据样本数据计算,得X2=
40.0343查x2表,得显著性水平为
0.
005、自由度为21的临界值为
41.401因为x2=
40.
034341.401,所以H()通过了检验,即晋城在线的点击次数服从参数为(
32.9,
3.522)的正态分布(4]
三、利用正态分布参数对晋城在线发展状况和内部考核的分析
(一)、对网站发展趋势的分析{MWM}d/W806040网站管理者首先应正确理解其网站的整体发展趋势,但如前所述,图1的分析不能很好地提供这方面的信息所以,客观上需要一种更好的指标来反映点击次数的发展趋势正态分布的参数u是其随机变量的期望值,其含义为均值,可以作为点击次数的代表在本例中,U=
32.9;而标准差为
3.52,远小于U,所以,口的变化可以很好地反映点击次数的发展趋势下图(图4)是晋城在线点击次数的u变化曲线图图4晋城在线点击次数的口变化曲线图35500003500000315000031X000却3350000蚓31Mx00032500003200000一96三匚大党我,为二宿中/黑云!2台乃工云发畲尊与己名秀三匕大号号焉
⑤彳等号盘洛石堵金岸上记第日t从该图可以得到以下信息
1、整体上,晋城在线点击次数呈稳定下降趋势,但最近有回升的迹象
2、在约第25至65日间,点击次数快速上升,并维持在较高的水平此后,点击次数却一再稳定下降在约85日附近情况有所改善,但没能逆转最后10日左右,点击次数有回升的迹象,但幅度不大上述趋势至少给网站提出了两个研究命题
1、判断点击次数下降的性质,分析原因从性质上,可以初步推断下降是系统性的这说明晋城在线整体服务质量与市场需求有一定的距离
2、对系统性下降之外的变动进行分析,即对点击次数的3个上涨期作细致的调查分析,为采取逆转措施提供思路需要说明的是查看图5时应忽略起初的几个值或部分值,因为此时数据量太少;图五反映的变化有迟滞现象,实际情况的发生要比图5反映的早几日;根据多个需要,制作多个数据量的图五更有利于分析
(二)对同业间相互比较的分析由于口能够作为点击次数的代表,可以反映这种代表性的强弱,所以它们可以用作同业间相互比较的标准指标(数据时期要相同)同样,可以计算多个口进行比较,也可以使用连续的口变化曲线图(图5)进行更详细的比较由于没有其他网站的数据,所以本文不作同业比较的实例分析
(三)对网站制定科学管理目标的分析管理目标分长远目标和近期目标wnsmT
1、对晋城在线长远目标的分析从图5可以判断其点击次数的下降是系统性的,在外部环境和内部管理没有发生显著改善以前这种趋势不会改变外部环境是客观存在,所以应从内部管理着手来延缓或逆转这种趋势这就是该网站在可预见的未来的长远目标为了达此目标,晋城在线应对其网站服务质量进行细致的考察,因为其点击次数的稳步下降与网络发展的总趋势(按几何级数增长⑸)相反
2、对晋城在线近期目标的分析从近期(如一个月)来讲,则应以近几期(如近3个月)的数据计算的P为依据具体目标应确定为比u略大的某个区域,如[u+/10,口+/5],表述为(口+1)具体略大指大多少,视管理力度的大小决定
(四)对网站内部考核指标的改善科学剔除点击次数周周期性影响,可以使剩余的点击次数数据与员工的工作努力程度的相关性进一步提高,使日均点击次数能更好地反映员工的业绩这个举例前面有,不再重复另外,一个经营期结束后,实际的点击次数往往与目标不一致,这时就要分析其差异性质(有利差异还是不利差异)、大小、原因服从正态分布的随机变量,其某个具体值落在口土区间的概率为
68.27%,落在口±2区间的概率为
95.45%,落在口±3区间的概率为
99.73%也就是说,如果点击次数落在上述区间则属正常,未落在上述区间则不正常这为进一步考核员工的工作努力程度提供了分析的依据
四、结语网站点击次数的正态分析方法要义纵上所述,可总结网站点击次数正态分析方法的要义如下网站点击次数服从正态分布;这个分布的参数可以帮助网站分析其发展状况、与同业比较、制定科学的管理目标、考核员工等多种目的主要参考文献
[1]
[5]杨坚争、许勤、杨维新.电子商务基础与实务[M].西安市西安电子科技大学出版社,
2001.
184、
133.
[2]ITSUM.ITSUN网站流量统计分析系统..ITSUN.com/,2005年12月1日,
[3]晋城在线网.晋城在线网站访问量(点击次数)分月报告[EB/OL].(晋城在线网站访问情况统计分析系统),2005年7月1日/2005年12月31日.
[4]刘剑平、陆元鸿.概率论与数理统计方法[M].上海市华东理工大学出版社,
1999.159-
161.(英文摘要、作者简介、通信地址、联系方法等略)。
个人认证
优秀文档
获得点赞 0