专利名称:一种多维互联网文本风险数据识别方法专利类型:发明专利
发明人:王慧娟,王晓峰,印晓天申请号:CN202011307349.1申请日:20201120公开号:CN112287072A公开日:20210129
摘要:本发明公开了一种多维互联网文本风险数据识别方法,包括:S1、对训练样本进行文本预处理;S2、对步骤S1中预处理后的文本数据进行特征提取,生成词向量;S3、使用深度自编码网络对步骤S2中提取的特征进行降维,得到降维后的深度特征;S4、使用降维后的深度特征训练双向LSTM神经网络模型;S5、使用训练好的神经网络模型对待识别的互联网文本数据进行识别。本发明的方法尤其适用于海量多源的多维互联网文本数据的识别,可以准确、有效地识别出互联网文本风险数据。
申请人:公安部第一研究所
地址:100048 北京市海淀区首都体育馆南路1号
国籍:CN
代理机构:北京华仁联合知识产权代理有限公司
代理人:陈建
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容