给定一组词性标记的词,我想找到那些在主流英语中是淫秽的词。我该怎么做?我是否应该列出一个巨大的列表,然后检查列表中是否存在任何内容?我应该尝试使用正则表达式来捕获单个根上的一堆变体吗?如果它更容易,我不想过滤掉,只是为了得到一个计数。因此,即使存在一些误报,也不是世界末日,只要存在或多或少一致的夸大率即可。 最佳答案 庞大的列表和目标受众。您是否可以使用专门从事此方面的第3方服务,而不是自行推出?一些快速的想法:Scunthorpe问题(并点击“Swearfilter”的链接了解更多)英式英语还是美式英语?范妮、同性恋等政治正确性: