草庐IT

意大利语

全部标签

python - 从维基百科转储中提取平行文本

在我的研究项目中,我需要从维基百科转储中提取平行文档。换句话说,我已经下载了英语和意大利语维基百科转储。现在,我想解析它们,对于英语转储中的每篇文章,在意大利语转储中找到它的翻译(应该由Interlanguage链接完成),并将它们存储在同一个文件中,以便之后进行一些跨语言文本处理。我为此进行了一些搜索,但找不到用于此目的的任何代码。但是,由于我看过很多论文的作者都做了同样的事情,所以我认为在从头开始发明轮子之前可能值得先问一问。任何想法都会受到赞赏。谢谢。 最佳答案 使用此维基百科API,action=query&query=la

java - 为什么 Windows Server 2008 认为意大利应该在西欧时间?

为什么MSWindows(特别是这里的服务器2008)认为意大利是西欧时间,而(我认为)根据我能找到的所有其他来源它应该是中欧时间?TZUtil/g给出:W.EuropeStandardTime控制面板显示:(UTC+01:00)Amsterdam,Berlin,Bern,Rome,Stockholm,Vienna我在网上找到的所有其他资源,例如:http://www.timeanddate.com/worldclock/italy/rome声称意大利是中欧时间/中欧夏令时。(CET/CEST)。在Java中工作以给出正确时间的Olson名称是“Europe/Rome”,这与控制面板一

c++ - 如何将任意大整数从任意基数转换为不同的基数?

我有一个长度为数十万个字符的n进制(无符号)整数。如何将这个数字(从文件中读取的字符串)转换为2-256之间的任何基数?当然是在合理的时间内。GMP库仅支持2-62位碱基。 最佳答案 GMP使用acleverdivide-and-conquerradixchangealgorithm对于非常大的整数。使用相同的基本思想做一些事情并不难。调用您的基数r和输入数字x。让rp[i]=r^(2^i)对每个i直到rp[i]有大约一半原始数字的位数;调用最后一个rp[n-1]。减少你的数字模rp[n-1]。然后高2^(n-1)radix-r数字

windows - 以独立于语言环境的方式访问 Windows 性能计数器

我有一组混合服务器,一些运行英语Windows,一些运行意大利语Windows。有没有一种方法可以在不使用依赖于语言环境的字符串的情况下读取性能计数器的值?我在Zabbixdocumentation上阅读应该可以使用像\2\6这样的数字格式,但它对我不起作用,无论是在Zabbix还是Powershell中。我想监控CPU利用率(\Processore(_Total)\%Tempoprocessore)。欢迎提出任何建议。 最佳答案 解决方案很简单:唯一的问题是将所有信息放在一起。首先,打开注册表并转到以下键:HKEY_LOCAL_M

c# - 使用完成事件时如何避免意大利面条代码?

不知怎的,我不敢相信我是第一个遇到这个问题的人(我不想相信我是唯一一个愚蠢到不能直接看到解决方案的人),但我的搜索功能不是足够强大。我经常遇到这样一种情况,需要一个接一个地执行一些耗时的步骤。工作流程看起来像vardata=DataGetter.GetData();varprocessedData=DataProcessor.Process(data);varuserDecision=DialogService.AskUserAbout(processedData);//...我不想在每一步都阻塞UI,所以每个方法都会立即返回,并在完成后引发一个事件。现在欢闹接踵而至,因为上面的代码块

java - Java 中的意大利语词干提取库

我正在搜索Java库或其他东西来提取意大利语单词字符串。目标是比较意大利语单词。在这一刻,像“attacco”、“attacchi”、“attaccare”等词被认为是不同的,相反我想返回一个真实的比较。我找到了类似Lucene、snowball.tartarus.org等的东西。还有其他有用的东西吗?或者我如何在Java中使用它们?感谢您的回答。 最佳答案 下载Snowball对于Javahere.它包含一个名为org.tartarus.snowball.ext.italianStemmer的类,它扩展了SnowballStemm

java - 如何识别 Java 中文本文档的语言?

是否有现有的Java库可以告诉我字符串是否包含英语文本(例如,我需要能够区分法语或意大利语文本——该函数需要为法语和意大利语返回false,并返回true英语)? 最佳答案 有多种技术,一个稳健的方法会结合各种技术:查看文本中n个字母组(例如,3个字母组或trigrams)的频率,看看它们是否与您正在测试的语言的频率相似查看给定语言中的常用词实例是否与文本中的频率匹配(这对于较长的文本来说效果更好)文本中是否包含字符以将其缩小为特定语言?(例如,如果文本包含倒置的问号,则很有可能是西类牙语)您能否“松散地解析”文本中指示特定语言的某

asp.net-mvc - MVC SEO 从 .uk.com 域瞄准意大利

我的问题非常相似,但与我在这里找到的不完全匹配:InternationalizetargetcountryforSEOusinglanguageurlpath唯一的区别是默认(唯一)语言(意大利语)与域本地化不匹配。我的公司位于英国,我的MVC应用程序托管在“.uk.com”域中。该网站是专为意大利客户创建的软件,旨在仅针对意大利。从SEO的角度来看,我已经将路由配置为使用像“www.mysite.uk.com/it”这样的子目录,但我怀疑应该本地化默认URL“www.mysite.uk.com”也适用于意大利。如果是这样,在MVC中实现此目的的最佳方法是什么?提前致谢。

sitemap - 让谷歌根据搜索者的语言显示两个不同的网站

您好,我创建了一个googlewebmastertool帐户并发送了2个站点地图:一个用于我网站的意大利语,一个用于英语。现在,我的站点在索引中有一个脚本,如果用户是意大利人,它将重定向到mywebsite.it/it,否则它将转到mywebsite.it/en。问题是现在谷歌的爬虫(显然不是意大利语)只能看到网站的英文版本,而不是两者。有没有办法让它根据语言抓取并显示两个不同的网站?谢谢 最佳答案 您是否使用JavaScript来重定向用户?最好使用服务器端重定向,例如.htaccess但是,当您从索引页面链接两种语言版本并且Go

localization - 如何使用国际互联网域名(.it、.co.uk、.es、...)以实现最佳 SEO

我开发了一个英语网络应用程序-你可以访问它,比如说,在www.example.com上。然后,我进行了意大利语本地化。基本上,如果您使用“意大利语”浏览器访问www.example.com,语言会自动切换为意大利语。我还购买了域名example.it。如果你去:http://www.example.it你会自动重定向到http://www.example.com/it/在那里您可以阅读意大利语网站。现在我在意大利做一些公关工作,用意大利语撰写客座博客文章。我的问题是:为了从SEO中获得最大yield,我应该从那些意大利语文章中链接www.example.it还是www.example.