文本挖掘研究进展

卷第期年月

模式识别与人工智能

文本挖掘研究进展 诺志群 张国煊

杭州电子科技大学计算机学院杭州

文本挖掘又称为文本数据挖掘或文本知识发现是指在大规模文本集合中发现隐含的以前未知的潜在 , 、 、

有用的模式的过程本文首先介绍了文本挖掘的概念包括文本挖掘的定义特点与其它儿个研究领域数据挖掘信息检索信息抽取计算语言学等的关系然后讨论了文本挖掘模型文本特征抽取与中间表示文本挖掘的 飞 、、、、 、

分类与实现技术最后介绍了几个文本挖掘产品 关扭词 文本挖掘数据挖掘文本知识发现自然语言处理关联规则文本聚类趋势分析 , , ,

,

,

,

中图法分类号

,

,

,

飞 ,,,,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

言 ,

常庞大缺乏组织整理并且格式多种多样我们不能 ,

充分利用这些数据这就要求有自动化的大规模文

随着电脑的普及与网络技术的发展电子化文

本数据分析技术来帮助我们处理和利用这些文档 ,

本文档的规模急剧增长这些文档包括研究报告学 ,

文本挖掘出现了作为一个新的正在迅速成为热点 ,

术论文在线文献库 、

页面公司内部公 ,

的研究领域它致力于从文本数据中发现新的事实 ,

告会议纪要等这些文档中包含了大量的信息是 重要的知识源但是很多情况下由于文档的数量非 ,

和知识帮助我们在文本的大山中探测并采掘有 ,

价值的金矿

,

浙江省自然科学基金资助项目一一一一收稿日期修回日期作者筒介俗志群男年生硕士讲师主要研究方向为中文信息处理男年生教授主要研究方向为计算语言学人工智能 , ,

,

,

,

张国位

,

,

,

文本挖掘研究进展

文本挖掘研究进展

你可能喜欢

  • 语义分析
  • 数据挖掘研究现状
  • 云计算学习
  • 生物医学
  • 知识发现
  • PPT背景图片免费下载
  • 医学文献
  • 数据分类

文本挖掘研究进展相关文档

最新文档

返回顶部