草庐IT

python - 在什么世界中\\u00c3\\u00a9 会变成é?

我有一个来self无法控制的来源的可能编码不正确的json文档,其中包含以下字符串:d\u00c3\u00a9corbusiness\u00e2\u20ac\u2122activeaccountsthe\u00e2\u20ac\u0153MadeintheUSA\u00e2\u20ac\u009dlabel由此,我了解到他们打算将\u00c3\u00a9变成é,这将是utf-8hexC3A9.这是有道理的。对于其他人,我假设我们正在处理某些类型的方向引号。我的理论是,这要么使用了一些我以前从未遇到过的编码,要么以某种方式进行了双重编码。我可以编写一些代码将他们损坏的输入转换成我能理解的