专利名称:一种领域特征词确定方法和装置专利类型:发明专利发明人:于亮,张宇峰
申请号:CN201010100319.3申请日:20100122公开号:CN102135961A公开日:20110727
摘要:本发明实施例公开了一种领域特征词确定方法和装置。本发明实施例所提供的方案,预先通过参数确定阶段获取第一领域和第二领域的差异度阈值,而后,利用搜索引擎得到提取领域特征词的语料,从该语料中得到待确定领域特征词,分别计算待确定领域特征词在第一领域和第二领域的权值,分别根据权值进行排序,并根据权值位置的不同计算每个待确定领域特征词的差异度;将待确定领域特征词的差异度与差异度阈值进行比较,并结合权值位置信息,确定第一领域或者第二领域的领域特征词。本发明实施例所提供的方法,基于搜索引擎,利用统计的方法实现了领域特征词的自动提取,提高了获取领域特征词的效率和真实性。
申请人:北京金山软件有限公司,北京金山数字娱乐科技有限公司
地址:100085 北京市海淀区小营西路33号金山软件大厦1层西区
国籍:CN
代理机构:北京集佳知识产权代理有限公司
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容