[1]任智军 扈林芳.专利文献OCR 校对方法研究[J].情报杂志,2011,(03):182.
点击复制

专利文献OCR 校对方法研究()
分享到:

《情报杂志》[ISSN:1002-1965/CN:61-1167/G3]

卷:
期数:
2011年03期
页码:
182
栏目:
出版日期:
2011-03-18

文章信息/Info

Title:
The Study of OCR Proofreading Method of Patent Document
作者:
任智军 扈林芳
中国专利信息中心 北京 100088
关键词:
OCR 校对 专利文献 HMM 模型 校对词典
文献标志码:
A
摘要:
专利文献代码化对于专利无纸化审查、专利分析、专利检索和专利管理都非常重要。本文提出一种以专利
文献OCR 校对词典和技术领域特征为基础, 利用中文分词、隐马尔科夫模型为方法的专利文献OCR 校对框架和专
利文献OCR 中文文本的拼写校对方法,降低了人力成本投入,提高了专利文献代码化效率和代码化质量。本文最
后给出了实验系统和实现结果。
更新日期/Last Update: 2011-04-08