草庐IT

linksInArray

全部标签

php - 如何从网页中获取内部链接?

我使用XPath解析HTML网页以获取所有内部链接。DOMXPath将返回href中提供的所有链接。如何分离内部链接和外部链接?我介绍了一系列字符串检查来删除外部链接;但问题是有不同的方式来链接内部页面,例如page.html/page.htmlhttp://domain.com/page.htmlhttp://subdomain.domain.com/page.html....区分内部链接(指向当前域的任何链接,包括其子域)和外部链接(指向任何其他域)的最安全方法是什么。 最佳答案 这是我使用preg_match编写的一个小示例。