草庐IT

索引库

全部标签

Elasticsearch单个索引数据量过大的优化

当Elasticsearch(ES)中的单个索引(index)的数据量变得过大时,可能会遇到性能下降、查询缓慢、管理困难等问题。为了优化和应对大索引的挑战,可以考虑以下策略:1.使用分片和副本分片(Sharding):ES自动将索引分成多个分片,分布式地存储和处理数据。对于大型索引,可以在创建时指定更多的主分片数量,以平衡数据和查询的负载。不过,一旦索引创建,其主分片的数量就不能更改,因此需要事先规划。副本(Replicas):增加副本分片数可以提高系统的容错能力和读取性能。写操作会在所有副本上执行,但读操作可以分散到不同的副本上,从而提升查询性能。Elasticsearch中的索引的分区(S

seo - 从我们的图像服务器中删除谷歌索引

我们做了很多电子邮件营销,有时开发人员会将html文件放在图像服务器上(我知道简单的答案是不这样做)但这些html文件最终会被Google索引并最终在搜索结果。这反过来又使SEO公司希望我们删除这些页面。是否可以让google不索引我们子域中的任何内容?我们有image.{ourUrl}.com,我们将所有这些文件放在那里。将robot.txt文件放在主目录中可以吗?或者我们是否需要在每个目录中添加该机器人文本文件?有没有简单的方法来解决这个问题? 最佳答案 robots.txt文件只会停止抓取,文件可能仍会被编入索引。noinde

php - 如何处理不存在的 Google 索引 'pages'

我构建动态网站,其中结构分层保存在数据库中(自己的CMS)。我正在使用邻接模型来管理这个数据库表(通过PDO的PHP和Mysql)我检测到Google正在为它不应该索引的页面编制索引。用于导航的树结构示例:homeaboutusproductsproductgroup1productgroup2contactsupportsales想象一下这个结构在一个带有页面链接的下拉菜单中。当我选择products->productgroup1时,我得到一个像www.domain.com/products/productgroup-1这样的url,它从数据库中提取数据(基于最后一个uri元素:pr

php - 谷歌会索引我的 "getdata.php"文件吗?

我有像/getdata.php?name=somebody&id=123这样的链接被.htaccess屏蔽了,像/somebody-123我发现谷歌(或其他机器人)在GoogleAnalytics中查看我的“getdata.php”文件。通常不可能得到那个文件(如果你不知道它存在,因为它没有在代码中的任何地方被提及,它只是根据$_GET生成内容,如果你单独调用它,它会产生一个MySQL错误。现在我很害怕,它被谷歌编入索引,人们开始点击它。我一定要害怕吗? 最佳答案 它可以被谷歌索引,因为它作为超链接放置在您的页面中,当有人点击它时,

php - 当一个页面由基于 php 的条目组成时,它是如何被索引的?

例如,如果一个页面充满了数据库条目行,它是如何被索引的,而不是拥有单独的网页,例如。example.com/page1content1content2example.com/page2content3content4对比example.com?c=1'."content2".'';?>example.com?c=2'."content4".'';?> 最佳答案 PHP是一种服务器端脚本语言,因此所有代码都在服务器端执行,浏览器或索引引擎无法识别这些代码。对于所有浏览器而言,服务器可能正在运行java/asp/php或其他任何东西,它

xml - 如何增加站点地图索引的数量

如果我可以有很多像这样的站点地图索引,我很感兴趣:https://domain.com/sitemap/destinatieTag.xml2015-02-01T05:00:34+02:00我的意思是1个站点地图索引来引用thor站点地图索引,或者站点地图的最大限制是多少?destinatieTag.xml是thor的例子https://domain.com/sitemap/myUrlXML.xml2015-02-01T05:00:34+02:00并且只有myUrlXML.xml包含一个urlxml示例:https://domain.com/romania我需要在我的网站上做一个站点地图

android - 谷歌应用索引,如何检查它是否在网站上有效

我已经根据教程here在我们的移动应用程序上完成了大量应用程序索引工作,它似乎在本地工作,当我在GoogleNow启动器框中键入内容时,历史结果显示,点击它会带到我们的应用程序。但是,我们跟踪我们在过去一个月进行应用索引时提交的weburl,没有显示googlebot的记录。那么我如何检查我是否正确地做事或机器人是否真正工作?谢谢 最佳答案 您可以做几件事:测试您的深层链接是否正确。您可以使用深度链接测试工具来做到这一点,请参阅this有关这方面信息的文档。您现在可以衡量深层链接的性能,请参阅here如何实现这一点,但基本上,引荐来

javascript - 我可以在 Google 索引中隐藏页面中的某些内容吗? (需要更新的答案)

看了一些旧的(2009年)问题,我预计答案是否定的,但我找不到最近足够明确的答案,所以我再次问...我在页面上有一些支持JavaScript的选项卡,可以通过在查询字符串中传递参数来自动预选这些选项卡,如下所示:www.example.com/landing-page?tab=tab1有没有办法阻止Google将当前不可见的选项卡中的内容编入索引?此外,如果在查询字符串中指定了不同的选项卡,我需要它将URL视为不同的页面。更新:我根据thispage理解您可以根据具有不同值的参数将特定参数设置为被视为唯一页面。所以现在唯一的问题是是否可以从Googlebot隐藏页面上的内容。根据一些旧

seo - 谷歌索引的图像文件类型 : is TIFF part of it or not?

Google索引的图片文件类型定义如下:在GoogleWebmaster/SearchConsoleHelp上如果不存在TIFF格式(2015年最新更新):Google可以为以下图片类型编制索引:BMPGIFJPEGPNGWebPSVG但是在GoogleSearchApplianceDocumentation存在TIFF格式(2013年最新更新):TIFF组5和6-tiff-版本到6TIFFCCITT组3和4-tiff-版本到6有人可以确认TIFF是否属于Google可以索引或不可以索引的受支持图像文件类型的一部分吗?或者提示我如何以简单、快速和高效的方式验证这一点?目前我的引用是Se

search - 谷歌不索引面包屑导航

我想寻求帮助。5个月前,我在我的网站上添加了这段代码:{"@context":"http://myweb.com","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"item":{"@id":"http://myweb.com","name":"Myweb"}},{"@type":"ListItem","position":2,"item":{"@id":"http://myweb.com/adverts/cars","name":"Cars"}}]}但Google仍未在我的网站上