[1]曾锡山,胡俊荣.WEB 文本海量数据挖掘应用中的多点数据采集及处理问题研究[J].情报杂志,2010,(08):131.
点击复制

WEB 文本海量数据挖掘应用中的多点数据采集及处理问题研究()
分享到:

《情报杂志》[ISSN:1002-1965/CN:61-1167/G3]

卷:
期数:
2010年08期
页码:
131
栏目:
出版日期:
2010-08-18

文章信息/Info

Title:
Research of Multi-Point Data Collecting and Processing in the Massive
Web-text Mining Application
作者:
曾锡山;胡俊荣
华南师范大学计算机学院 广州 510631;华南师范大学图书馆 广州 510631
关键词:
WEB 挖掘文本挖掘海量数据数据转换网上清洗
文献标志码:
A
摘要:
对海量数据采集与挖掘技术的问题,提出如何利用WEB 文本进行多断点控制、并发采集、网上清洗等新技
术方法进行海量数据采集及处理,构建了基于WEB 文本海量数据挖掘的应用统计系统,实现了三千多万条原始数
据的采集、转换、统计。

相似文献/References:

[1]胡 峰 戚晓妮 汪晓燕.基于PMC 指数模型的机器人产业政策量化评价*———以8 项机器人产业政策情报为例[J].情报杂志,2020,(01):121.
[2]李牧南 王雯殊.基于文本挖掘的人工智能科学主题演进研究*[J].情报杂志,2020,(06):82.
[3]宋欣娜 郭 颖 席笑文.基于专利文献的多指标新兴技术识别研究*[J].情报杂志,2020,(06):76.

更新日期/Last Update: 2010-09-27