文章分类 | 推荐文章 | 最新文章 | 热点文章 | 最新软件 | 精品软件 | 下载排行 | 推荐下载 | 免费看大片 | WPS | 杀毒软件
清风网络
首 页 软件下载 网络学院 数码学院
QQ 电脑入门 游戏 操作系统 图形处理 办公软件 媒体动画 精文荟萃 工具软件 网络编程 程序开发 网络技术 认证考试 网站建设 文章专栏
当前位置:清风网络学院网络编程PHP用 PHP 使 Web 数据分析进入更高境界
精品推荐
特别推荐
·菜鸟学PHP之Smarty入门
·PHP环境安全配置教程
·PHP入门指导:如何学习PHP?
·Php+Mysql注入专题
·PHP:实现给上传图片加水印的程序代码
·PHP动态网站开发中常用的8个小技巧
·PHP初学者:配置Apache服务器并且设置DNS
·初学PHP指导:php.ini 配置详细选项
·好文分享:PHP入门的学习方法
·急速搭建属于自己的Discuz!6论坛
热点TOP10
·菜鸟学PHP之Smarty入门
·傲慢与偏见 程序员想让HR知道的七件事
·升级PHP5的理由:PHP4和PHP5性能对比
·PHP4将结束更新并在明年退出历史的舞台
·jdk1.6环境搭建netbeans的中文乱码
·关于Html嵌入打成jar包的Applet方法
·学习java的一些好的书籍介绍
·WEB开发中Spring AOP实际应用一例
·Java Server Faces建立交互式WEB站点
·利用Java Servlets 2.4实现过滤

用 PHP 使 Web 数据分析进入更高境界

日期:2008年5月31日 作者: 查看:[大字体 中字体 小字体]


 设计您的数据分析,做比简单原始计数更多的事

  对 Web 数据进行有效和多层次的分析是许多面向 Web 企业能够生存的关键因素,数据分析检验的设计(和决策)通常是系统管理员和内部应用程序设计人员的工作,而他们可能除了能够把原始计数制成表格之外,对统计学没有更多的了解。在本文中,Paul Meagher 向 Web 开发人员传授了将推论统计学应用到 Web 数据流所需的技能和概念。

  动态网站不断生成大量的数据 — 访问日志、民意测验和调查结果、客户概要信息、订单及其它,Web 开发人员的工作不仅是创建生成这些数据的应用程序,而且还要开发使这些数据流有意义的应用程序和方法。

  通常,对于由管理站点所产生的不断增长的数据分析需求,Web 开发人员的应对是不够的。一般而言,除了报告各种描述性统计信息之外,Web 开发人员并没有其它更好的方法来反映数据流特征。有许多推论统计步骤(根据样本数据估计总体参数的方法)可以被充分利用,但目前却没有应用它们。

  例如,Web 访问统计信息(按当前所编辑的)只不过是以各种方式进行分组的频率计数。以原始计数和百分比表示民意测验和调查结果的情况比比皆是。

  开发人员用比较浅显的方法处理数据流的统计分析或许已经足够了,我们不应期望太多。毕竟,有从事较复杂的数据流分析的专业人士;他们是统计师和受过训练的分析师。当组织需要的不仅仅是描述性统计时,可以请他们加入。

  但另一种应对是承认对推论统计学日益加深的了解正成为 Web 开发人员工作描述的一部分。动态站点正在生成越来越多的数据,事实表明,设法将这些数据变成有用的知识正是 Web 开发人员和系统管理员的责任。

  我提倡采取后一种应对;本文旨在帮助 Web 开发人员和系统管理员学习(或重温,如果知识已遗忘的话)将推论统计学应用到 Web 数据流所需的设计和分析技能。


  使 Web 数据与实验设计相关

  将推论统计学应用到 Web 数据流需要的不仅仅是学习作为各种统计检验基础的数学知识。将数据收集过程与实验设计中的关键差别关联起来的能力同样很重要:测量尺度是什么?样本的代表性如何?总体是什么?正在检验的假设是什么?

  要将推论统计学应用到 Web 数据流,需要先把结果看作是由实验设计生成的;然后选择适用于该实验设计的分析过程。即使您可能认为将 Web 民意测验和访问日志数据看作实验的结果是多此一举,但这样做确实很重要。为什么?

  1.这将帮助您选择适当的统计检验方法。
  2.这将帮助您从收集的数据中得出适当的结论。

  在确定要使用哪些适当的统计检验时,实验设计的一个重要方面是选择数据收集的衡量尺度。

  衡量标准的示例

  测量尺度只是指定了一个对所感兴趣的现象分配符号、字母或数字的步骤。例如,千克尺度允许您给一个物体分配数字,根据测量仪器的标准化的偏移量指示该物体的重量。

  有四种重要的衡量标准:

  定比尺度(ratio)— 千克尺度是定比尺度的一个示例 ? 分配给物体属性的符号具有数字意义。您可以对这些符号执行各种运算(如计算比率),而对于通过使用功能不那么强大的衡量标准获得的数值,您不能使用这些运算。


  定距尺度(interval)— 在定距尺度中,任意两个相邻测量单位之间的距离(也称为间距)是相等的,但零点是任意的。定距尺度的示例包括对经度和潮汐高度的度量,以及不同年份始末的度量。定距尺度的值可以加减,但乘除则没有意义。


  定序尺度(rank)— 定序尺度可应用于一组有顺序的数据,有顺序指的是属于该尺度的值和观察值可以按顺序排列或附带有评级尺度。常见的示例包括“好恶”民意测验,其中将数字分配给各个属性(从 1 = 非常厌恶到 5 = 非常喜欢)。通常,一组有序数据的类别有自然的顺序,但尺度上相邻点之间的差距不必总是相同的。对于有顺序的数据,您可以计数和排序,但不能测量。


  定类尺度(nominal)— 衡量标准的定类尺度是衡量标准中最弱的一种形式,主要指将项目分配给组或类别。这种测量不带数量信息,并且不表示对项目进行排序。对定类尺度数据执行的主要数值运算是每一类别中项目的频率计数。

  下表对比了每种衡量标准的特征:

衡量标准尺度 属性具有绝对的数字含义吗? 能执行大多数数学运算吗?
定比尺度 是。 是。
定距尺度 对于定距尺度是这样;零点是任意的。 加和减。
定序尺度 不是。 计数和排序。
定类尺度 不是。 只能计数。

  在本文中,我将主要讨论通过使用测量的定类尺度收集的数据,以及适用于定类数据的推论技术。


  使用定类尺度

  几乎所有 Web 用户 — 设计人员、客户和系统管理员 — 都熟悉定类尺度。Web 民意测验和访问日志类似,因为它们常常使用定类尺度作为衡量标准。在 Web 民意测验中,用户常常通过请求人们选择回答选项(如“您偏爱品牌 A、品牌 B,还是品牌 C?”)来衡量人们的偏好。通过对各类回答的频率进行计数来汇总数据。

  类似的,测量网站流量的常用方法是对一个星期内一天之中的每次点击或访问都划分给这一天,然后对每一天出现的点击或访问的数目计数。另外,您可以(也确实可以)通过浏览器类型、操作系统类型和访问者所在的国家或地区 — 以及任何您想得到的分类尺度 — 对点击计数。

  因为 Web 民意测验和访问统计信息都需要对数据归入某一特定性质类别的次数进行计数,所以可以用相似的无参数统计检验(允许您根据分布形状而不是总体参数作出推论的检验)来分析它们。

[1] [2] [3] [4] [5] [6] [7] 下一页 




上一篇:如何在PHP程序中防止盗链

下一篇:PHP PEAR/HTML/QuickForm实现用户注册表单界面

相关文章:
·我是怎么进入他人计算机的
·快马加鞭 20秒进入Win XP操作系统
·如何进入QQ空间安全模式
·进入她的体内获得美感
·第一章 路由器基本操作和简单配置命令-如何登录进入路由器
·教你绕过Foxmail帐户口令进入邮箱
·进入系统却迟迟不见反应解决办法
·暴风影音3进入倒计时 用户不是上帝
·果然更高效!Vista磁盘碎片整理亲历记
·安装Vista Business后无法正常进入系统?提示出错代码为STOP 0X0000000A
相关软件:
·Google Earth 动态卫星地图 汉化版 带我们进入间谍时代 能看见你家院子
·《禅宗诗歌境界》
·折紙的最高境界&七八十年代的玩具
·入不思议解脱境界普贤行愿品_男声朗诵版(多背景音乐)
·进入已知的魔法世界
·WEG半决赛 grubby vs moon 恭喜瓜比进入决赛

特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。
[打印本页] [关闭窗口] 转载请注明来源:http://www.vipcn.net
| 帮助(?) | 版权声明 | 友情连接 | 关于我们 | 信息发布
Copyright 2007 www.vipcn.net All Rights Reserved. 鄂ICP备05000083号Powered by:viphot