我构建了一个网络爬虫,它可以在网站上搜索该页面上的所有链接,然后获取该链接并在其中搜索更多链接,直到爬取整个页面。在我遇到一个特殊的站点之前一直运行良好。链接问题:正常情况1:绝对路径如'http://www.example.com/test'正常情况2:相对路径,如'/test'有问题的新案例:没有http://的绝对路径-只是'www.example.com'显示问题的示例代码:packagemainimport("fmt""log""net/url")funcmain(){u,err:=url.Parse("http://www.example.com")iferr!=nil{l
我构建了一个网络爬虫,它可以在网站上搜索该页面上的所有链接,然后获取该链接并在其中搜索更多链接,直到爬取整个页面。在我遇到一个特殊的站点之前一直运行良好。链接问题:正常情况1:绝对路径如'http://www.example.com/test'正常情况2:相对路径,如'/test'有问题的新案例:没有http://的绝对路径-只是'www.example.com'显示问题的示例代码:packagemainimport("fmt""log""net/url")funcmain(){u,err:=url.Parse("http://www.example.com")iferr!=nil{l
在下面example,URL的结尾/被删除了,有没有办法保留/?packagemainimport("fmt""net/url""path")funcmain(){u,_:=url.Parse("http://localhost:5100")relative,_:=url.Parse(path.Join("hello/"))fmt.Println(u.ResolveReference(relative))}输出:http://localhost:5100/hello 最佳答案 我想出了答案,那就是不使用path.Join:packa