大数据与数据挖掘之文本挖掘(PPT 56页)
大数据与数据挖掘之文本挖掘(PPT 56页)内容简介
文本挖掘的背景
文本挖掘概念
文本挖掘的过程
预处理
最大匹配分词法
停用词
文档建模
文档的向量空间模型
TF度量
IDF度量
关键词与网页的相关性计算
算例1
算例2
文档相似性计算
文档相似性计算示例
信息检索
文本检索的基本度量
信息检索的度量方式
模型质量的评价实例
文本挖掘举例
文档向量化
查询:相关度
文档间相似度(余弦定理)
3.文本的维度规约
文本挖掘方法
关联分析挖掘
关联分析挖掘
关联分析挖掘
文档分类分析
文档聚类分析
..............................
文本挖掘概念
文本挖掘的过程
预处理
最大匹配分词法
停用词
文档建模
文档的向量空间模型
TF度量
IDF度量
关键词与网页的相关性计算
算例1
算例2
文档相似性计算
文档相似性计算示例
信息检索
文本检索的基本度量
信息检索的度量方式
模型质量的评价实例
文本挖掘举例
文档向量化
查询:相关度
文档间相似度(余弦定理)
3.文本的维度规约
文本挖掘方法
关联分析挖掘
关联分析挖掘
关联分析挖掘
文档分类分析
文档聚类分析
..............................
上一篇:大数据技术概述(PPT 78页)
用户登陆
bi商务智能热门资料
bi商务智能相关下载