NLP

java - 应使用哪种罗马化标准来改进 ICU4j 的阿拉伯语-拉丁语音译？

我们需要将阿拉伯文本音译为拉丁字符(不带变音符号)并将其显示给用户。我们目前正在为此使用IBMICU4j。API不能很好地将阿拉伯文本翻译成正确可读的拉丁字符。请引用以下示例:例子阿拉伯语文本:صدامحسينالتكريتيGoogle的音译输出:萨达姆·侯赛因·提克里蒂ICU4J的音译输出:ṣdạmḥsynạltkryty我们如何改进ICU4j库的音译输出？ICU4J为我们提供了编写自己的规则的选项，但我们目前陷入困境，因为我们团队中没有人懂阿拉伯语，也无法找到任何可以遵循的合适标准。最佳答案我花了4个小时研究任何其他来源来

阿拉伯语拉丁语 section ARABIC java nlp transliteration transcription icu4j

java - 构建 Stanford CoreNLP 时出错

当我自己构建Core-NLP时，我收到以下消息:incompatibletypes;noinstance(s)oftypevariable(s)VALUEexistsothatVALUEconformstoMap违规行:MaproleMap=((CoreLabel)t1.label()).get(CoreAnnotations.CoNLLSRLAnnotation.class);违规功能:@SuppressWarnings("unchecked")public>VALUEget(Classkey){for(inti=size;i>0;){if(keys[--i]==key){retur

时出 Stanford section VALUE code java nlp stanford-nlp

java - 小词词干提取/词形还原

目前我使用“lucene”和“elasticsearch”，遇到下一个问题。我需要获得diminutive的词干形式或引理单词。例如:小狗->狗小猫->猫等等但我得到下一个结果:doggy->doggikitty->kitti有没有什么方法(不重要的现成库、任何算法、方法等)来获取diminutive的词根/原始词形式单词形式？目标语言:俄语。例如:собачка->собакакошечка->кошка提前致谢! 最佳答案首先，作为旁注:您尝试做的事情通常不称为词干提取或词形还原。您的第一个问题是将观察到的token(例如со

词形 java em section 例如 lucene elasticsearch nlp morphological-analysis

java - 如何为用户提供的国家名称预测正确的国家名称？

我计划对我的数据进行一些数据调整。情况-我有一个数据，其中有一个字段country。它包含用户输入的国家/地区名称(它可能包含拼写错误或同一国家/地区的不同国家/地区名称，例如US/U.S.A/UnitedStates代表美国)。我有一个正确的国家/地区名称列表。我想要的-预测它指的是哪个最近的国家。例如-如果给出U.S.，那么它将更改为USA(我们列表中的正确国家/地区名称)。有什么方法可以使用Java或opennlp或任何其他方法来实现吗？最佳答案您可以使用GettyAPI.它会给你国家名称的缩写。只需使用此API即可。或您

何为 java 地区名称 section strong nlp string-matching text-mining opennlp

源码阅读及理论详解《 Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting 》

Informer论文：https://arxiv.org/pdf/2012.07436.pdfInformer源码：GitHub-zhouhaoyi/Informer2020:TheGitHubrepositoryforthepaper"Informer"acceptedbyAAAI2021.Transformer笔记：《AttentionIsAllYouNeed》_郑烯烃快去学习的博客-CSDN博客目录0x01Transformer存在的问题0x02Informer研究背景0x03Informer整体架构（一）ProbSparseSelf-attention（二）Self-attention

Forecasting Transformer xff xff0c xff0 深度学习人工智能 Informer nlp

java - Java 中的 NP、VP 和 PP 短语分块 (CoreNLP)

我正在使用StanfordCoreNLP，我知道它不支持句子分块。我正在寻找的是，给定一个输入句子，将类似这样的内容作为输出:[NPHe][VPreckons][NPthecurrentaccountdeficit][VPwillnarrow][PPto][NPonly#1.8billion][PPin][NPSeptember].我也知道OpenNLP显然支持此功能，但我已经使用CoreNLP编写了很多代码，我不想切换。所以，我正在寻找的是一个可以为我做这件事的外部库，或者是关于以最简单的方式实现这个特性的想法(对出版物的引用、链接，一切都是受欢迎的)，从解析树开始。我不需要它像最先

短语 CoreNLP section stackoverflow java nlp

java - 斯坦福 CoreNLP 观点

我正在尝试在Eclipse中实现coreNLP情绪分析器。得到错误:Unabletoresolve"edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz"作为类路径、文件名或URL。我使用maven安装了所有NLP文件，所以我不确定它为什么要寻找其他东西。这是我遇到错误的代码。importjava.util.Properties;importedu.stanford.nlp.ling.CoreAnnotations;importedu.stanford.nlp.neural.rnn.RNNCoreAnnotations;importe

斯坦观点 stanford section sentiment java dependencies nlp stanford-nlp

java - 借助 NLP 分析句子并提取人名、组织和位置

我需要使用NLP解决以下问题，你能给我一些关于如何使用OpenNLPAPI实现这个的指示吗一个。如何判断一个句子是否暗示过去、现在或将来的某个Action。(e.g.)Iwasverysadlastweek-pastIfeellikehittingmyneighbor-presentIamplanningtogotoNewYorknextweek-future如何找到一个人或公司或国家对应的词(e.g.)JohnisplanningtospecializeinElectricalEngineeringinUCBerkleyandpursueacareerwithIBM).人=约翰公司=

并提人名 String printStackTrace section java nlp stanford-nlp opennlp

java - 根据调查构建人类可读的句子

以下是对类(class)参加者进行的调查，用于在类(class)结束时评估讲师。CommunicationSkills1.Theinstructorcommunicatedcoursematerialclearlyandaccurately.YesNo2.Theinstructorexplainedcourseobjectivesandlearningoutcomes.YesNo3.Intheeventofnotunderstandingcoursematerialstheinstructorwasavailableoutsideofclass.YesNo4.Wasinstructor

句子 java instructor section course parsing nlp semantics

java - 木槌主题建模

我一直在使用mallet为包含100,000行的文本文件(大约34MB的mallet格式)推断主题。但是现在我需要在一个包含一百万行(大约180MB)的文件上运行它并且我得到一个java.lang.outofmemory异常。有没有办法将文件拆分成更小的文件并为所有文件中存在的数据构建模型？提前致谢最佳答案在bin/mallet.bat中增加这一行的值:setMALLET_MEMORY=1G 关于java-木槌主题建模，我们在StackOverflow上找到一个类似的问题：

木槌 java section strong mallet nlp machine-learning

3 4 567 8 9