专利详情
一种基于LSTM的中文文本语法纠错模型方法
CN109948152B
发明专利
专利简介
本发明公开了一种基于LSTM的中文文本语法纠错模型的方法,首先收集大量的中文文本语料用以计算5‑gram语言模型,保存的语言模型将会用作数据处理过程和模型输出的结果选择,然后收集语法纠错平行语料数据,语法纠错平行语料数据用作训练LSTM神经网络模型,实现模型对错误句子到正确句子的序列翻译过程;其次用保存好的5‑gram语言模型对平行语料数据进行预处理,修改掉明显的错误,最后构建LSTM神经网络并用预处理后的数据进行训练,训练结束保存网络参数,并用已训练好的网络,输出语法正确的文本序列。本发明数据容易获取,过程简单有效,LSTM神经网络自动抽取抽象特征,完成语法纠错任务,算法效率和准确度都相对较高,应用于中文学习过程和语音识别后端处理。
相关专利标签
LSTM gram 语法 中文文本 语料
相关专利
  • 一种基于松散条件下协同学习的中文微博情感分析方法
    发明专利
    CN108228569B
  • 中文词向量建模方法
    发明专利
    CN109992783B