草庐IT

python - 从维基百科转储中提取平行文本

在我的研究项目中,我需要从维基百科转储中提取平行文档。换句话说,我已经下载了英语和意大利语维基百科转储。现在,我想解析它们,对于英语转储中的每篇文章,在意大利语转储中找到它的翻译(应该由Interlanguage链接完成),并将它们存储在同一个文件中,以便之后进行一些跨语言文本处理。我为此进行了一些搜索,但找不到用于此目的的任何代码。但是,由于我看过很多论文的作者都做了同样的事情,所以我认为在从头开始发明轮子之前可能值得先问一问。任何想法都会受到赞赏。谢谢。 最佳答案 使用此维基百科API,action=query&query=la

java - Java 中的意大利语词干提取库

我正在搜索Java库或其他东西来提取意大利语单词字符串。目标是比较意大利语单词。在这一刻,像“attacco”、“attacchi”、“attaccare”等词被认为是不同的,相反我想返回一个真实的比较。我找到了类似Lucene、snowball.tartarus.org等的东西。还有其他有用的东西吗?或者我如何在Java中使用它们?感谢您的回答。 最佳答案 下载Snowball对于Javahere.它包含一个名为org.tartarus.snowball.ext.italianStemmer的类,它扩展了SnowballStemm

localization - 如何使用国际互联网域名(.it、.co.uk、.es、...)以实现最佳 SEO

我开发了一个英语网络应用程序-你可以访问它,比如说,在www.example.com上。然后,我进行了意大利语本地化。基本上,如果您使用“意大利语”浏览器访问www.example.com,语言会自动切换为意大利语。我还购买了域名example.it。如果你去:http://www.example.it你会自动重定向到http://www.example.com/it/在那里您可以阅读意大利语网站。现在我在意大利做一些公关工作,用意大利语撰写客座博客文章。我的问题是:为了从SEO中获得最大yield,我应该从那些意大利语文章中链接www.example.it还是www.example.

java - 如何在 Hadoop 上的 OpenNLP 中训练意大利语模型?

我想在Hadoop上为意大利语实现一个自然语言处理算法我有两个问题;如何找到意大利语的词干提取算法?如何集成到hadoop中?这是我的代码StringpathSent=...taggedsentences...;StringpathChunk=....chunkedtrainpath....;FilefileSent=newFile(pathSent);FilefileChunk=newFile(pathChunk);InputStreaminSent=null;InputStreaminChunk=null;inSent=newFileInputStream(fileSent);in

php - NumberFormatter::SPELLOUT 俄语和意大利语拼写顺序

此代码适用于英语、西类牙语和德语序数,但不适用于俄语或意大利语序数。'ru-RU','it-IT'也不起作用例如,我得到俄语中的2->два(这是基数),但我想要序数,这里是2->второй。例如,我得到意大利语的2->due(这是基数),但我想要序数,这里是2->secondo。更新:我在法语、西类牙、德语和其他一些语言中找到了一个解决方案:maskuline序数:%spellout-ordinal-maskuline女性序数:%spellout-ordinal-feminine俄语和意大利语版本不起作用,我已经尝试使用-maskuline/-feminine$ru_ordinal

android - 如何在安卓上播放国际音标发音?

我有一个单词的IPA发音,我想向用户播放。这可以使用内置的TTS引擎来完成吗?如果没有,是否有支持它的TTS引擎? 最佳答案 据我所知,这是无法做到的,也没有支持此操作的应用程序。TTS引擎仅支持英语、法语、德语、意大利语和西类牙语(EFIGS)。除非你有一些语言知识,否则你可能会倒霉。如果这样做,您可能会尝试将IPA映射到最合适的语言(或者尝试意大利语),看看它有多糟糕。 关于android-如何在安卓上播放国际音标发音?,我们在StackOverflow上找到一个类似的问题:

iOS 本地化因升级 iOs 9 + Xcode 7 而中断

我使用Localizable.strings文件和NSLocalizedString宏将我的应用本地化为意大利语和英语。我还启用了baselocalization。在模拟器和iOS8设备上一切正常,但在iOS9上,应用程序始终是英文的,即使在iPhone设置中选择意大利语作为默认语言的设备上也是如此。iOS9是否通过本地化改变了什么?这是Xcode本地化设置的屏幕截图1以及用于测试的设备提前致谢 最佳答案 已解决,“问题”是info.plist文件中的关键“Localizationnativedevelopmentregion”。它

windows - 如何在 vim 中使用 block 号,或在意大利语键盘上使用反引号?

我正在使用gVim和意大利语键盘(没有反引号)。在Windows上输入反引号的唯一方法是block-num+alt+96,是的,很伤心。当你发现blocknum在gvim上不起作用时更难过:(你能告诉我如何在gvim上激活blocknum吗?或者在gvim中也是在Windows上键入beacktick的最快方法?谢谢 最佳答案 如果你的键盘布局与thatshownonWikipedia相同,你可以将`映射到\,并将\(例如,如果您将其用作领导键)映射到,例如,_(在该布局中输入比\更容易)。:noremap\`:letg:maple

java - 按匈牙利语字母顺序对匈牙利语字符串列表进行排序

我目前正在处理匈牙利人的一些数据。我必须对匈牙利字符串列表进行排序。根据thisCollationSequencepageHungarianalphabeticorderis:A=Á,B,C,CS,D,DZ,DZS,E=É,F,G,GY,H,I=Í,J,K,L,LY,M,N,NY,O=Ó,Ö=Ő,P,Q,R,S,SZ,T,TY,U=Ú,Ü=Ű,V,W,X,Y,Z,ZS所以元音被同等对待(A=Á,...)所以在结果中你可以使用Collator得到类似的结果:AbdffgÁdsdfgsdAegfghhrf到这里,没问题:)但是现在,我有根据Hungarianalphabet排序的需求AÁB