[1]李晓超 贾立国 罗 燕 陈 敏 柳萌萌 赵书良.布茨定律用于中文同频词规律的实证研究[J].情报杂志,2015,(06):62.
 Empirical Study on Applicability of Booth’s Law for the Law of Same FrequencyWords in Chinese Text[J].journal of intelligence,2015,(06):62.
点击复制

布茨定律用于中文同频词规律的实证研究()
分享到:

《情报杂志》[ISSN:1002-1965/CN:61-1167/G3]

卷:
期数:
2015年06期
页码:
62
栏目:
出版日期:
2015-06-18

文章信息/Info

Title:
Empirical Study on Applicability of Booth’s Law for the Law of Same Frequency Words in Chinese Text
作者:
李晓超123 贾立国4 罗 燕123 陈 敏123 柳萌萌123 赵书良123
1. 河北师范大学数学与信息科学学院 石家庄 050024; 2. 河北师范大学河北省计算数学与应用重点实验室 石家庄 050024; 3. 河北师范大学移动物联网研究院 石家庄 050024; 4. 河北师范大学教务处 石家庄 050024
关键词:
同频词 齐普夫定律 布茨定律 低频词
文献标志码:
A
摘要:
布茨定律反映了英文文本同频词的分布规律,但布茨定律是否适用于中文文本很少有学者对其进行深入 研究。为了探究布茨定律对于中文文本的适用性,揭示中文文本同频词的统计规律,对大量中文文本同频词进行统 计研究,实验过程中注重了实验数据规模的选取和文本长度跨度的设计。实验得出:随着文本长度的增大,低频词 的同频词数与不同词数的比值并非定值,而是逐渐减小;低频词的同频词数与不同词数的关系呈幂函数增长。另 外,随着文本长度的增大,低频词的同频词数与频次为1 的同频词数的比值也非定值,而是逐渐增大。上述结果与 布茨所做英文的实验不一致,故得出结论:布茨定律不适用于中文文本。
更新日期/Last Update: 2015-06-26