您的当前位置:首页一种多维互联网文本风险数据识别方法[发明专利]

一种多维互联网文本风险数据识别方法[发明专利]

2024-04-17 来源:乌哈旅游
专利内容由知识产权出版社提供

专利名称:一种多维互联网文本风险数据识别方法专利类型:发明专利

发明人:王慧娟,王晓峰,印晓天申请号:CN202011307349.1申请日:20201120公开号:CN112287072A公开日:20210129

摘要:本发明公开了一种多维互联网文本风险数据识别方法,包括:S1、对训练样本进行文本预处理;S2、对步骤S1中预处理后的文本数据进行特征提取,生成词向量;S3、使用深度自编码网络对步骤S2中提取的特征进行降维,得到降维后的深度特征;S4、使用降维后的深度特征训练双向LSTM神经网络模型;S5、使用训练好的神经网络模型对待识别的互联网文本数据进行识别。本发明的方法尤其适用于海量多源的多维互联网文本数据的识别,可以准确、有效地识别出互联网文本风险数据。

申请人:公安部第一研究所

地址:100048 北京市海淀区首都体育馆南路1号

国籍:CN

代理机构:北京华仁联合知识产权代理有限公司

代理人:陈建

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容