您现在的位置: 精品资料网 >> 市场营销 >> 业务管理 >> 资料信息

业务管理及数据管理知识分析模型(PDF 47页)

所属分类:
业务管理
文件大小:
3844 KB
下载地址:
相关资料:
业务管理,管理知识
业务管理及数据管理知识分析模型(PDF 47页)内容简介

业务管理及数据管理知识分析模型(PDF 47页)目录:

1.绪论
2.用户行为数据分析方法
3.移动互联数据源分析与数据处理算法
4.构建推荐系统
5.案例应用

 

业务管理及数据管理知识分析模型(PDF 47页)简介:

过程如下:
A. 获取范本库
a) 我们通过网络爬虫、文本分析等方法获取具有代表性和区分性的范本,即包含或与该范本有高度匹配的Url与该模板是同一类型的网页。当然,可能存在有代表性但区分性不高的范本,如image,由于很多网页都会包含图片,所以,包含image的url肯定是有图片信息,但是否具有其它属性,如游戏、漫画等,就不可知了。所以我们按区分性将模板加权,按被辨识出来类别的权重将url加以归类[36]。
b) 按照已有用户上网行为分析的信息分类表(如上图),加以丰富、改造后,给与每个模板分类标号后,将该模板加入模板库中。
c) 定期、不定期(在有时事热点发生时)的更新、修改范本库。
B.匹配 url
将获取的url 与模板库中的模板匹配并加以归类。
C.定义用户兴趣点
目的是要反映出大众上网行为习惯的倾向,但由于数据量较大不能全部使用。我们由抽样调查[28,29]理论计算得出,在准确率95%、误差2%的条件下,仅需3500人左右就能反映出大众(百万级别)的特征。因此,我们从3 万多不同的imsi 号码中随机了3000 个出来加以统计分析来反映这些公众兴趣特征。根据各url 分类后,我们把点击各类的人次作了统计。
按选定规则将上网行为归为29 个类型,统计结果显示这3000 人在7 天中上网次数72 万次,人均日上网次数34.3699,而有url 记录的有41 万,缺失大概3/7,对于这部分缺失,我们选择使用url 分类后等比拓展来代替原有缺失。这种方法固然不是最合适的,但是由于对应ip 依然很难提供分类信息,因此这种快捷而有效方法还是可行的。


..............................