Web数据分析关键技术及解决方案[The key technologies and solutions of Web data analysis]pdf

图书网 2018年11月14日23:13:42
评论
2.6K

Web数据分析关键技术及解决方案[The key technologies and solutions of Web data analysis] 内容简介

《Web数据分析关键技术及解决方案/“十三五”科学技术专著丛书》集中讨论Web数据自动分析的关键技术——Web数据自动获取、特征抽取、表达建模及Web挖掘等相关理论和方法,在此基础上,分析了几种典型的Web数据分析需求,提出并介绍了具有针对性的解决方案及方法。主要解决方案包括:基于Web公共舆情自动分析及预警方案、基于语义的Web信息自动聚合方法、多源电商数据挖掘等。

《Web数据分析关键技术及解决方案/“十三五”科学技术专著丛书》选取当前Web数据分析的热点问题,总结了实际科研工作的研究成果,理论与实际案例相结合,适合高校电子信息、计算机等相关专业的教师、学生及研究人员阅读。

Web数据分析关键技术及解决方案[The key technologies and solutions of Web data analysis] 目录

第1章 Web大数据挖掘概述

1.1 大数据与网络大数据

1.2 Web大数据应用及特点

1.2.1 Web大数据

1.2.2 Web大数据特点

1.3 Web挖掘及Web挖掘类型

1.3.1 Web挖掘及Web挖掘类型

1.3.2 Web内容挖掘

1.3.3 Web结构挖掘

1.3.4 Web使用挖掘

1.4 Web挖掘过程

1.4.1 Web内容挖掘过程

1.4.2 Web结构挖掘过程

1.4.3 Web使用挖掘过程

参考文献

第2章 Web数据挖掘基础

2.1 Web信息程序获取方式

2.1.1 网络爬虫

2.1.2 其他Web信息程序获取方式

2.2 Web信息数据抽取

2.2.1 Web网页信息抽取

2.2.2 自然语言文本结构化信息抽取

2.3 Web信息文本模型的文本特征表示

2.3.1 文本模型与文本特征

2.3.2 VSM向量空间模型

2.3.3 布尔模型

2.3.4 概率主题模型

2.4 模式发现常用方法

2.4.1 统计分析

2.4.2 关联分析

2.4.3 分类分析

2.4.4 聚类分析

参考文献

第3章 Web内容及结构挖掘应用案例1:基于Web公共舆情自动分析及预警

3.1 概述

3.1.1 基于Web的公共舆情

3.1.2 网络舆情研究现状

3.2 基于Web意见的舆情分析预测模型

3.2.1 舆情分析预测模型概述

3.2.2 热点舆情发现模型研究

3.2.3 热点舆情发展趋势预测模型

3.3 基于意见挖掘的热点舆情发现模型

3.3.1 改进的热点舆情发现模型

3.3.2 基于Web意见挖掘的报道特征表示

3.4 来源加权的舆情分析模型

3.4.1 舆情来源量化分析指标

3.4.2 Page-Rank算法拓展

3.4.3 构建来源加权的舆情分析模型

3.5 热点舆情识别

3.5.1 话题热度特征描述

3.5.2 话题热度计算函数

3.6 实验及评估

3.6.1 网络新闻数据的抓取

3.6.2 中文分词及文本表示

3.6.3 模型改进效果分析

3.7 C5.0和BP神经网络结合的舆情预测模型

3.7.1 基于C5.0的意见分类

3.7.2 基于BP神经网络预测模型

3.7.3 实验及评估

3.8 小结

参考文献

第4章 Web内容挖掘应用案例2:基于语义的Web信息自动聚合系统的关键技术研究

4.1 信息聚合及相关技术

4.1.1 信息聚合

4.1.2 信息聚合问题研究现状

4.1.3 简易信息聚合技术RSS

4.1.4 数字签名算法Simhash

4.2 一种基于主题的Web信息自动聚合方案

4.2.1 方案架构

4.2.2 信息获取

4.2.3 信息预处理

4.2.4 按主题聚合

4.3 基于标点符号及标签相似度的正文抽取方法

4.3.1 网页类型及结构

4.3.2 常用网页正文抽取方法分析

4.3.3 基于标点分布的网页正文抽取算法

4.3.4 基于标签相似度的多正文网页抽取技术

4.3.5 算法设计及实验

4.4 基于潜在语义的Web信息聚合

4.4.1 概率主题模型与潜在语义分析模型

4.4.2 LDA模型

4.4.3 面向Web信息的LDA模型改进方法

4.4.4 实验结果分析

4.5 本章小结

参考文献

第5章 分布式多源电商数据挖掘

5.1 电子商务及电商数据分析

5.2 电商数据分析挖掘

5.2.1 引言

5.2.2 电商数据定义

5.2.3 电商数据采集

5.2.4 数据分析挖掘

5.3 多源电商数据融合

5.3.1 引言

5.3.2 数据融合

5.3.3 多源电商数据的特点

5.3.4 多数据源电商数据融合总体解决方案

5.3.5 多数据源电商数据融合方案

5.3.6 多数据源电商数据融合的具体实现

5.3.7 实验结果与分析

5.4 分布式电商数据分析挖掘系统

5.4.1 引言

5.4.2 基于Hadoop的分布式电商数据分析挖掘系统

5.4.3 基于Hadoop平台的层次聚类

5.4.4 电商数据的层次聚类分析

参考文献

Web数据分析关键技术及解决方案[The key technologies and solutions of Web data analysis] 精彩文摘

“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通信等行业存在已有时日,Nature杂志在2008年推出的Big Data专刊上提出了大数据(Big Data)概念,近年来因为互联网和信息行业的发展,大数据一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。

图书网:Web数据分析关键技术及解决方案[The key technologies and solutions of Web data analysis]pdf

继续阅读

→→→→→→→→→→→→→→→→→→→→查找获取

数据库

Kali Linux & BackTrack渗透测试实战pdf

本书基于编写团队的实际经验,围绕渗透测试进行了全面介绍,并选择“Kali Linux(包含BackTrack)” Live CD作为讲解工具。下载BackTrack Live CD和Kali Linu...
数据库

SQL进阶教程pdf

数据库工程师进阶中级实用指南 挖掘SQL常见技术的新用法 基于标准SQL编写 示例程序均可下载 本书适合具有一定SQL编程经验的工程师阅读 本书特色 1.转变面向过程语言的思维定式,学习SQL常见技术...
数据库

锋利的SQLpdf

锋利的SQL 作者:张洪举 锋利的SQL 出版社:人民邮电出版社 锋利的SQL 内容简介 《锋利的SQL》从基础、开发、性能调整和实战4个方面介绍了SQL技术及其应用,包括数据库管理、表管理、索引管理...
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: