作者|徐婧扬,单位:中国移动智慧家庭运营中心Labs导读中文文本纠错是针对中文文本拼写错误等进行检测与纠正的一项工作,是自然语言处理的重要应用领域之一。中文文本纠错的应用场景很多,诸如在搜索引擎,问答/对话系统,输入法等领域作为一个前置模块,或作为OCR和ASR检测的后置模块,亦或是公文写作场景,辅助进行公文审阅校对,纠错的质量对后续的处理非常重要。Part01 中文错别字类型有哪我们把常见的中文错别字总结分为三类:拼写错误,由于输入法,音转软件等原因导致的用字/词错误,其主要表现为错误使用了同音字,形近字等,也是纠错领域当前研究比较集中的方向;语法错误,该类错误主要是由于疏忽或对语言运用