对于一个学校项目,我在我的本地机器上安装了MediaWiki,并且需要使用SSL与本地MySQL数据库建立任何数据库连接。我不确定如何连接所有的点。这是我到目前为止所做的:我已经安装了OpenSSL,并创建了自签名证书和相关key。phpinfo()显示OpenSSL已启用。我已将其包含在my.ini的[mysqld]部分:ssl-key="C:/newcerts/server-key.pem"ssl-cert="C:/newcerts/server-cert.pem"ssl-ca="C:/newcerts/ca-cert.pem"运行MySQL命令行提示我输入root密码,输入后,我
我尝试使用SQL查询访问WikiMedia数据库以获取文章页面的内容。('old_text',fromthe'text'table)通过搜索其page_title(来自“页”表)。不幸的是,我没有看到page_id(来自页表)和old_id(来自“文本”表)之间的映射。那么,如何使用给定的页面标题从带有sql查询的文章中获取文本? 最佳答案 为了补充svick的回答,这里有一个实际的示例SQL查询:SELECTold_text,old_flagsFROMpageJOINrevisionONrev_id=page_latestJOIN
对于某些文本挖掘应用程序,我需要确定英文维基百科中每篇文章中每个单词的出现频率,并使用该数据填充MySQL数据库。Thisofficialpage建议在转储上使用mwdumper或xml2sql,但它们并不直接满足我的目的(除非有人可以解释它们如何做到)。使用WikiExtractor、用于Python的MySQLdb和本地MySQL服务器,另一方面,允许我做我想做的事,但它很慢,以至于需要一个月的时间来解析整个转储。对修改后的WikiExtractor程序进行分析表明,大部分运行时间都花在了它的嵌套正则表达式搜索和我的数据库插入上。理想情况下,我不希望处理文章的时间超过几天。我怎样才
我已经建立了一个维基百科数据库,其中:一(1)台主机正在运行mysqld,运行数据库;我已经安装了mariadb-server包。我在4个不同的表(页面、文本、修订、重定向;每个表有1600万行,后者大约有700万行)中存储了1600万页。/var/lib/mysql/ibdata1的大小:88GiB。请求通过http服务器(apache2)使用MediaWiki提供服务,就像在wikipedia.org中一样。另一台机器上的一个单线程worker正在通过http向数据库发送2.31亿个请求,超时为200-500毫秒;许多单个请求甚至在200毫秒时超时。问题是,由于“HTTP500”(
我在一个免费主机上托管了一个小型wiki,但它似乎被发送了垃圾邮件,主机将其关闭。他们给了我一个2GB的.sql文件。我正在寻找建立另一个wiki,将.sql加载到其中并清理困惑(或者找到好东西并将其复制出来)。我建立了一个新的mediawiki,然后我做了以下事情:mysql-u-hmysql.domain.com-p-e"dropdatabase;"mysql-u-hmysql.domain.com-p-e"createdatabase;"mysql-u-hmysql.domain.com-p这需要很长时间,但我没有收到任何错误,然后当我访问mediawiki网址时,我看到:Ada
我有一个仅供登录用户使用的MediaWiki安装,速度非常慢(每个请求大约持续2.5秒)我经历了我发现的所有缓存和优化步骤。我使用默认配置的APC,因为我没有发现任何改进,所以我运行了mediawiki分析,但我没有完全理解输出。forceprofile的输出如下所示。100.00%2.4757741--total90.51%2.2407091-Setup.php89.56%2.2171991-Setup.php-session88.85%2.199760163-LoadBalancer::getConnection88.64%2.194557163-LoadBalancer::ope
我正在here.建立一个Mediawiki一切顺利,但现在我想要一些文章来记录以小写字母开头的东西,例如Unix命令:“man”、“chmod”、“ls”、“iPod”等。我不希望他们出现,就像Mediawiki试图让所有页面标题和文章标题都以大写字母开头。此外,我不希望搜索区分大小写。我想搜索“apple”以找到“Apple”等。我相信我已经按照webpage.中的说明实现了不区分大小写的搜索。我相信这很好,但我对我必须做的事情有点反感:更改数据库表_pages的结构,将页面标题的类型更改为VARCHAR(255),并将排序顺序更改为一种不区分大小写的utf-8。将全局函数添加到gl
假设我的wiki(MediaWiki1.19.4)中有这些页面标题:SOMETHIngSómethìngSomêthÏngSÒmetHínG如果用户搜索something,我希望所有4个页面都作为结果返回。目前我唯一能想到的就是这个查询(MySQLPercona5.5.30-30.2):SELECTpage_titleFROMpageWHEREpage_titleLIKE'%something%'COLLATEutf8_general_ci它只返回SOMETHIng。我必须走在正确的道路上,因为如果我搜索sóméthíng或SÓMÉTHÍNG,我会得到SOMETHIng作为结果。我如何
Mediawiki在数据库“文本”中有一个包含页面内容的表格。它被保存为[BLOB]文件。我想运行一个查询来搜索网站上的所有文本,以查看哪些页面包含某个“字符串”。如何运行查询来搜索[blob]文件? 最佳答案 Mediawiki标记文本存储在old_text字段中,它是mediumblob类型。您可以像查询任何其他基于文本的字段一样查询它。MySQL会将您的字符串转换为二进制以供查询。请注意,这是区分大小写的搜索!selectold_idfromtextwhereold_textlike"%string%";如果您需要不区分大小写
我正在安装MediaWiki,但不知道要使用哪个字符集。我以前安装过MediaWiki,但从未注意过这个问题:我使用默认选择(二进制),它没有造成任何问题,但现在不同了,我不会出错。我安装的wiki主要使用阿拉伯语,语言是阿拉伯语。我应该使用哪个数据库字符集? 最佳答案 使用默认值,binary。从历史上看,当MySQL的Unicode支持被破坏到损坏时,它是唯一的选择non-BMP人物。后来,utf8被添加到MediaWiki作为实验,但它导致了一些奇怪语言的损坏。不久前,utf8mb4字符集终于在MySQL5.5中引入,解决了这