您的当前位置:首页一种文本数据标注方法、装置、计算机装置及计算机可读存储介质[发明专利]

一种文本数据标注方法、装置、计算机装置及计算机可读存储介质[发明专利]

2021-05-03 来源:乌哈旅游
专利内容由知识产权出版社提供

专利名称:一种文本数据标注方法、装置、计算机装置及计算

机可读存储介质

专利类型:发明专利

发明人:赫中翮,王志超,左凌峰,何子洋申请号:CN201911406659.6申请日:20191231公开号:CN111159408A公开日:20200515

摘要:本发明适用于互联网技术领域,提供了一种文本数据标注方法、装置、计算机装置及计算机可读存储介质,该方法包括:获取含有主宾关键字对的网页文本,将网页文本按照段落结构分段,进行分句处理,得到待处理语句;对待处理语句进行主宾关键字对、正则表达式及穷举关键字匹配,在至少有一个匹配成功时,将待处理语句作为候选语句,将候选语句存入清单集合;循环遍历清单集合,对所清单集合中的候选语句进行处理,从候选语句中选择满足预设条件的语句作为有效语句,将有效语句存入数据库中;显示有效语句。本发明提供的文本数据标注方法,可以提高文本数据的词性标注的准确度。

申请人:湖南星汉数智科技有限公司

地址:410000 湖南省长沙市高新开发区岳麓西大道588号芯城科技园8栋1301房

国籍:CN

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容