我有一个套接字服务器,它应该从客户端接收UTF-8有效字符。问题是一些客户端(主要是黑客)正在通过它发送所有错误类型的数据。我可以轻松区分真正的客户,但我会将发送的所有数据记录到文件中,以便稍后进行分析。有时我会得到像这样的字符œ导致UnicodeDecodeError错误。我需要能够使字符串带有或不带有这些字符的UTF-8。更新:对于我的特殊情况,套接字服务是MTA,因此我只希望接收ASCII命令,例如:EHLOexample.comMAILFROM:...我在JSON中记录了所有这些。然后一些没有好心的人决定发送各种垃圾。这就是为什么对于我的具体情况,去掉非ASCII字符是完全可以