草庐IT

linux - Mallet 适用于 Linux 但不适用于 Windows

OK我正在尝试使用Mallet在Windows中对一些文档进行分类我已经在Linux中实现了它。只是无法让它在Windows中完成工作(目标环境)我已将数据导入.mallet文件。然后使用此输入数据创建分类器。-rw-r--r--1henryhenry15197116Feb2315:56nntp.classifier和07/03/201421:2815,197,116nntp.classifier但是当我在Linux中运行时:bin/malletclassify-dir--input./testfolder--output---classifiernntp.classifier它迭代测

java - MALLET:如何实现基于crf的编辑距离?

我正在寻找有人写/知道MALLET类的详细信息。我知道这是解决ML问题的好工具,现在我尝试实现此处AndrewMcCallum,KedarBellareandFernandoPereira描述的基于CRF的距离算法。作者告诉他们,他们已经将拟议的模型实现为MalletFST类。不幸的是,java不是我所熟知的Ruby语言,这就是为什么我在理解如何使用它们的模型时遇到一些问题,例如哪些类我在大型Mallet类结构中缺乏文档。听到一些指导信息如何使用Mallet实现该算法将非常高兴。 最佳答案 请查看Mallet0.4简介:http:/

java - Mallet 中的主题建模;文档

我正在为Mallet寻找一些好的文档,特别是它与主题建模相关的类。我查看了Java文档,但它们帮助不大。例如:estimatepublicvoidestimate()throwsjava.io.IOExceptionThrows:java.io.IOException仍然不知道此方法的作用(如果您知道请告诉我...)。另外,如果您对mallet有一些经验并且可以帮助我打印主题模型学习的主题(或代表主题的词组),请告诉我。欢迎所有建议!我看过getTopWords方法,但我一直无法调用它...也许是一个misingjar? 最佳答案

java - 如何加载和使用经过 Mallet 训练的 CRF?

我使用GenericAcrfTui训练了一个CRF,它将一个ACRF写入一个文件。我不太确定如何加载和使用经过训练的CRF但是importcc.mallet.grmm.learning.ACRF;importcc.mallet.util.FileUtils;ACRFc=(ACRF)FileUtils.readObject(Paths.get("acrf.ser.gz").toFile());似乎有效。但是,标签似乎不正确并且似乎依赖于我作为输入传递的标签。如何使用加载的ACRF进行标记?这是我做标签的方式:GenericAcrfData2TokenSequenceinstanceMak

java - 木槌主题建模

我一直在使用mallet为包含100,000行的文本文件(大约34MB的mallet格式)推断主题。但是现在我需要在一个包含一百万行(大约180MB)的文件上运行它并且我得到一个java.lang.outofmemory异常。有没有办法将文件拆分成更小的文件并为所有文件中存在的数据构建模型?提前致谢 最佳答案 在bin/mallet.bat中增加这一行的值:setMALLET_MEMORY=1G 关于java-木槌主题建模,我们在StackOverflow上找到一个类似的问题:

java - MALLET主题推理

我正在尝试根据MA​​LLET训练的主题模型来推断文档的主题。我在mallet目录中使用以下命令./malletinfer-topics--inferencertopic-model--inputindata.mallet--output-doc-topicsinfered_docs但它陷入了转换异常:java.lang.ClassCastException:cc.mallet.topics.ParallelTopicModel无法转换为cc.mallet.topics.TopicInferencer我该如何解决这个问题? 最佳答案

java - 在 Java 中运行 MALLET

我尝试在Java中运行Mallet,但出现以下错误。Couldn'topencc.mallet.util.MalletLoggerresources/logging.propertiesfile.Perhapsthe'resources'directoriesweren'tcopiedintothe'class'directory.Continuing.我正在尝试运行Mallet网站(http://mallet.cs.umass.edu/topics-devel.php)中的示例。下面是我的代码。任何帮助表示赞赏。packagescriptAnalyzer;importcc.malle