基于DOM的中文人物WEB信息提取
陈晓云; 宋伟国; 苗胜法
2010-12-25
发表期刊微计算机信息
期号36页码:15-17
摘要本文面向中文人物WEB信息提取这个主题,将HTML文档解析成DOM树,扩展DOM树,增加主题相关度影响因子。提出特征权值计算方法计算主题相关度,并根据主题相关性因子进行剪枝,提取主题信息。进而通过句法分析、模式匹配提取中文人物的姓名、出生年月、性别等信息。结果表明,该方法有较好的查全率和准确率。
关键词信息提取 文档对象模型 影响因子 中文人物
作者部门兰州大学
收录类别CSCD
语种中文
CSCD记录号CSCD:4112149
IR记录号CNKI:0041733
Citation statistics
文献类型期刊论文
条目标识符http://ir.lzu.edu.cn/handle/262010/127952
Collection信息科学与工程学院
Recommended Citation:
GB/T 7714
陈晓云,宋伟国,苗胜法. 基于DOM的中文人物WEB信息提取[J]. 微计算机信息,2010(36):15-17.
APA 陈晓云,宋伟国,&苗胜法.(2010).基于DOM的中文人物WEB信息提取.微计算机信息(36),15-17.
MLA 陈晓云,et al."基于DOM的中文人物WEB信息提取".微计算机信息 .36(2010):15-17.
Files in This Item:
There are no files associated with this item.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Altmetrics Score
谷歌学术
谷歌学术Similar articles in Google Scholar
[陈晓云]'s Articles
[宋伟国]'s Articles
[苗胜法]'s Articles
百度学术
百度学术Similar articles in Google Scholar
[陈晓云]'s Articles
[宋伟国]'s Articles
[苗胜法]'s Articles
必应学术
必应学术Similar articles in Google Scholar
[陈晓云]'s Articles
[宋伟国]'s Articles
[苗胜法]'s Articles
Related Copyright Policies
Null
???item.sidebar.baidu.bookmark-share???
???jsp.display-item.all??? (0)
[???jsp.display-item.idea???]
???jsp.display-item.comment-text2???
Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.