文本数据挖掘（第2版）宗成庆 ISBN：9787302612957

宗成庆

1
文章

0
评论

2023年9月26日09:49:15

文本数据挖掘（第2版）

书籍作者：宗成庆

ISBN：9787302612957

书籍语言：简体中文

连载状态：全集

电子书格式：pdf,txt,epub,mobi,azw3

下载次数：4442

运行环境：PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板

内容简介

文本数据挖掘是通过机器学习、自然语言处理和推理等相关技术或方法，理解、分析和挖掘文本的内

容，从而完成信息抽取、关系发现、热点预测、文本分类和自动摘要等具体任务的信息处理技术。《文本数据挖掘（第2版）》主

要介绍与文本数据挖掘有关的基本概念、理论模型和实现算法，包括数据预处理、文本表示、文本分类、文本聚类、主题模型、情感分析与观点挖掘、话题检测与跟踪、信息抽取以及文本自动摘要等，最后通过

具体实例展示相关技术在实际应用中的使用方法。《文本数据挖掘（第2版）》书可作为高等院校计算机、自动化、网络安全、大数据分析等专业，以及利用到文本信息处理的交

叉学科（如金融财经、社会人文、生物医药等）的高年级本科生或研究生从事相关研究的入门参考书，也可供相关技术研发人员阅读和参考。

作者简介

宗成庆,中国科学院自动化所研究员、博士生导师，中国科学院大学岗位教授，ACL/CAAI/CCF Fellow，主要从事自然语言处理、机器翻译和语言认知计算等研究，主持国家项目10余项，发表论文200余篇，出版《统计自然语言处理》、《文本数据挖掘》和Text Data Mining三部专著及两部译著。担任国际计算语言学委员会（ICCL）委员，中国中文信息学会副理事长，曾任亚洲自然语言处理学会（AFNLP）主席，国际一流学术会议ACL’2015和COLING’2020程序委员会主席、ACL’2021大会主席。荣获国家科技进步奖二等奖和多个省部级及国家一级学会的科技奖励，获得北京市优秀教师、中科院优秀导师和国科大李佩教学名师等若干荣誉。享受国务院特殊津贴。张家俊，中国科学院自动化研究所研究员、中国科学院大学岗位教授、博士生导师，主要研究方向为机器翻译和自然语言处理，获得国家优秀青年科学基金资助，入选中国科协首届青年人才托举工程、中国科学院青年创新促进会优秀会员和北京智源青年科学家。发表CCF-A/B类论文80余篇，出版学术专著2部，译著1部。获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖、青年创新奖一等奖和2020年北京市科学技术奖一等奖等。担任中国中文信息学会青年工作委员会主任和机器翻译专委会副主任。担任ACL/EMNLP/COLING的(资深)领域主席和《自动化学报》等期刊的编委。夏睿，南京理工大学计算机学院教授、博士生导师，研究领域为人工智能、自然语言处理、文本数据挖掘，在国内外重要期刊和会议发表论文60余篇，出版学术专著2部，主持国家和省部级项目近10项，获得国际计算语言学会年会ACL2019杰出论文奖、中国中文信息学会青年创新奖一等奖等荣誉，获得江苏省杰出青年基金资助。

《文本数据挖掘（第2版）》电子书免费下载

pdf下载
txt下载
epub下载
mobi下载
azw3下载
下载暂时关闭，开启另行通知

前言

第 2版前言

大数据、大算力、大模型技术的快速发展极大地推动和改变着自然语言处理领域的研究和应用方式、方法，这种改变的速度远远超出了我们的预估和设想。几乎在《文本数据挖掘（第 1版）》出版的同时，预训练语言模型逐渐兴起，并得到了快速推广和应用。随后一系列大规模预训练语言模型不断在文本数据挖掘诸多任务上取得了更强的性能，获得了广泛的成功。与此同时，我们也发现了第 1版中的缺陷和不足，热心的读者以不同方式给我们提出了宝贵的建议。这些因素促使我们撰写了第 2版。

第 2版与第 1版的主要区别体现在如下三个方面：①内容更加丰富：在第 2版中除了增加最近几年流行的预训练语言模型（包括 BERT，GPT-3等）以外，还增加了最后一章技术应用，通过两个应用案例将全书各章的知识点串联起来，让读者看到每一章中介绍的技术如何在实际应用中发挥作用。②对部分内容进行了整合：考虑到神经网络模型是分布式表示和深度学习方法的基础性知识，第 1版第 3章和第 4章中均有涉及，部分内容略有重叠，因此，第 2版对这两章内容进行了整合。③增加了习题：在第 2版中各章最后增加了习题，以便于读者，尤其是学生结合每章的内容进行练习和实践。

在第 2版的撰写过程中得到了很多同事和朋友的帮助，他们或提供素材，或与作者讨论书中的内容，或帮助作者校对书稿。他们是中科院自动化所自然语言处理团队的向露博士和赵阳博士、北京中科凡语科技有限公司技术团队、南京理工大学计算机学院博士生沈祥清等。在此谨向他们表示衷心的感谢！同时感谢在互联网上对本书第 1版提出修改建议的热心读者们。

本书的撰写工作得到了中国科学院大学教材出版中心的资助（项目编号： YJF0812003），特此感谢！

还是那句老话，尽管作者尽了最大努力希望把这本书写好，但限于水平和时间，书中难免有诸多不足和疏漏。我们真诚地欢迎并接受读者以任何方式给予的批评指正！

作者 2021年 12月

文本数据挖掘（第2版）宗成庆 ISBN：9787302612957

内容简介

作者简介

《文本数据挖掘（第2版）》电子书免费下载

前言

目录

历史上的今天

→→→→→→→→→→→→→→→→→→→→查找获取

图灵程序设计丛书Magnus Lie Hetland ISBN：9787115353528

Visual C++从入门到精通明日科技 ISBN：9787302289326

C++从入门到精通明日科技 ISBN：9787302288473

程序员的数学3平冈和幸 ISBN：9787115417749

Java从入门到精通明日科技 ISBN：9787302287568

疯狂Java讲义李刚 ISBN：9787121236693

Java核心技术·卷1：基础知识（原书第9版）Cay S. Horstmann ISBN：9787111445142

深入理解Java虚拟机（第2版）周志明 ISBN：9787111421900

轻量级Java EE企业应用实战（第4版）李刚 ISBN：9787121242533

Docker 技术入门与实战杨保华 ISBN：9787111488521

发表评论取消回复

注册vip咨询

资源社区

内容简介

作者简介

《文本数据挖掘（第2版）》电子书免费下载

前言

目录

历史上的今天

→→→→→→→→→→→→→→→→→→→→查找获取

发表评论 取消回复

注册vip咨询

发表评论取消回复