草庐IT

c# - HTML Agility Pack strip 标签不在白名单中

我正在尝试创建一个函数来删除不在白名单中的html标签和属性。我有以下HTML:firsttextsecondtextheresometextheresometextheresometwxthere我正在使用HTML敏捷包,目前我拥有的代码是:staticListWhiteNodeList=newList{"b"};staticListWhiteAttrList=newList{};staticHtmlNodehtmlNode;publicstaticvoidRemoveNotInWhiteList(outstring_output,HtmlNodepNode,ListpWhiteLi

c# - Html Agility Pack 按类获取所有元素

我正在尝试htmlagilitypack,但找不到正确的方法来解决这个问题。例如:varfindclasses=_doc.DocumentNode.Descendants("div").Where(d=>d.Attributes.Contains("class"));但是,很明显你可以添加比div更多的类,所以我尝试了这个..varallLinksWithDivAndClass=_doc.DocumentNode.SelectNodes("//*[@class=\"float\"]");但这并不能处理您添加多个类并且“float”只是其中一个这样的情况..class="classNam