[1]郑婷婷 陈 翀 白海燕 梁 冰.学术搜索日志中的个体用户识别研究[J].情报杂志,2019,(11):175.
点击复制

学术搜索日志中的个体用户识别研究()
分享到:

《情报杂志》[ISSN:1002-1965/CN:61-1167/G3]

卷:
期数:
2019年11期
页码:
175
栏目:
出版日期:
2019-11-18

文章信息/Info

Title:
Research on Individual Identification in Academic Search Log
作者:
郑婷婷1 陈 翀1 白海燕2 梁 冰2
1. 北京师范大学政府管理学院 北京 100875;2. 中国科学技术信息研究所 北京 100038
关键词:
科研用户学术搜索日志小数据个体用户识别随机森林分类
摘要:
[目的/ 意义]文献检索中,特定账号可能以独享和共享的方式被使用。在理解用户信息需求确保个性化服务的精准性的问题上,首先要排除共享账号的群体所产生的各异行为对理解用户需求造成的干扰。因此,需要识别用户的行为边界,即某个账号的访问者是个体还是群体。[方法/ 过程]从科研用户的日志数据中提取行为习惯和主题偏好两方面特征,构建基于科研用户小数据和随机森林分类的个体用户识别模型,并以国家科技数字图书馆网站为例进行实证研究。[结果/ 结论] 实验表明,提出的方法能够有效识别学术搜索日志中的个体用户,准确率约为92. 9%,其中主题一致性是区别个体与群体科研用户的最重要特征。本研究不仅可以帮助识别个体用户和机构用户,优化用户管理,而且为跨设备的同一用户判定提供思路。
更新日期/Last Update: 1900-01-01