草庐IT

Stanford

全部标签

java - 执行和测试 stanford core nlp 示例

我下载了stanfordcorenlp包并尝试在我的机器上测试它。使用命令:java-cp"*"-mx1gedu.stanford.nlp.sentiment.SentimentPipeline-fileinput.txt我得到了positive或negative形式的情绪结果。input.txt包含要测试的句子。关于更多命令:java-cpstanford-corenlp-3.3.0.jar;stanford-corenlp-3.3.0-models.jar;xom.jar;joda-time.jar-Xmx600medu.stanford。nlp.pipeline.Stanford

java - 如何训练 Stanford NLP 情感分析工具

大家见鬼去吧!我正在使用StanfordCoreNLP软件包,我的目标是对实时推文流进行情绪分析。按原样使用情绪分析工具返回对文本“态度”的非常糟糕的分析..许多正面被标记为中性,许多负面被评为正面。我已经在一个文本文件中获取了超过一百万条推文,但我不知道如何实际训练该工具并创建我自己的模型。LinktoStanfordSentimentAnalysispage“可以使用PTB格式数据集使用以下命令重新训练模型:”java-mx8gedu.stanford.nlp.sentiment.SentimentTraining-numHid25-trainPathtrain.txt-devPa

java - 如何为 stanford tagger 创建自己的训练语料库?

我必须分析包含大量速记和本地行话的非正式英语文本。因此,我正在考虑为斯坦福标注器创建模型。我如何创建自己的一组标记语料库供stanford标注器训练?语料库的语法是什么?为了达到理想的性能,我的语料库应该有多长? 最佳答案 要训练PoS标注器,请参阅thismailinglistpost这也包含在JavaDocs中对于MaxentTagger类。edu.stanford.nlp.tagger.maxent.Trainclass的javadocs指定训练格式:Thetrainingfileshouldbeinthefollowingf

python - 如何使用 python nltk 加速 stanford NER 的 NE 识别

首先,我将文件内容标记为句子,然后对每个句子调用StanfordNER。但是这个过程真的很慢。我知道如果我在整个文件内容上调用它会更快,但我在每个句子上调用它,因为我想在NE识别之前和之后为每个句子建立索引。st=NERTagger('stanford-ner/classifiers/english.all.3class.distsim.crf.ser.gz','stanford-ner/stanford-ner.jar')forfilenameinfilelist:sentences=sent_tokenize(filecontent)#breakfilecontentintosen

python - NLTK和stanford中名词短语的中心查找根据NP的中心查找规则进行解析

一般来说,名词短语的中心词是NP最右边的名词,如下所示树是父NP的中心词。所以ROOT|S___|________________________NP|___|_____________||PPVP|____|________|___NP|NP|PRT___|_______||||DTJJNNNNINNNPVBDRP||||||||TheoldoaktreefromIndiafelldownOut[40]:Tree('S',[Tree('NP',[Tree('NP',[Tree('DT',['The']),Tree('JJ',['old']),Tree('NN',['oak']),Tr

python - NLTK 无法找到 stanford-postagger.jar!设置 CLASSPATH 环境变量

我正在从事一个需要我使用nltk和python标记token的项目。所以我想用这个。但是提出了一些问题。我经历了很多其他已经提出的问题和其他论坛,但我仍然无法解决这个问题。问题是当我尝试执行以下操作时:从nltk.tag导入StanfordPOSTaggerst=StanfordPOSTagger('english-bidirectional-distsim.tagger')我得到以下信息:Traceback(mostrecentcalllast):`File"",line1,inst=StanfordPOSTagger('english-bidirectional-distsim.t

全球名校AI课程库(15)| Stanford斯坦福 · 线性代数与矩阵方法导论课程『Introduction to Applied Linear Algebra』

🏆课程学习中心|🚧CS数学基础课程合辑|🌍课程主页|📺中英字幕视频|🚀项目代码解析课程介绍线性代数,是数据科学高阶课程的前置课程,也是前沿热门应用领域的根基。数据科学、机器学习、人工智能、信号和图像处理、层析成像、导航、金融等等,都建立在数学的基础之上。如果你想快速补充线性代数的相关知识,ENGR108这门课是非常好的选择!ENGR108(曾用名:EE103、CME103)是全球顶级院校斯坦福开设的以线性代数和矩阵论为主题的专业课程。不同于定理证明、矩阵运算的传统内容,这门课程更直观,用非常多的例子和图标,来表示向量、矩阵与复杂世界的关系,并能够解决现实问题。线性代数的相关知识,向量、矩阵与矩

java - 如何使用 Genia Corpus 训练 Stanford Parser?

我在为斯坦福解析器创建新模型时遇到了一些问题。我还从斯坦福下载了最新版本:http://nlp.stanford.edu/software/lex-parser.shtml这里,GeniaCorpus有2种格式,xml和ptb(PennTreebank)。StandfordParser可以使用ptd文件进行训练;然后我下载了GeniaCorpus,因为我想处理生物医学文本:http://categorizer.tmit.bme.hu/~illes/genia_ptb/(链接不再可用)(genia_ptb.tar.gz)然后,我有一个简短的Main类来获取一个生物医学句子的依赖表示:St

java - 如何将 Stanford CoreNLP Java 库与 Ruby 一起用于情感分析?

我正在尝试使用RubyonRails4、Ruby2.1.2和MongoidORM对本地MongoDB实例中的大型推文语料库进行情感分析。我使用了免费提供的https://loudelement-free-natural-language-processing-service.p.mashape.comMashape.com上的API,但是它在以快速发射序列推送数百条推文后开始超时-显然它不适合通过数万条推文,这是可以理解的。接下来我想我会使用这里推荐的斯坦福CoreNLP库:http://nlp.stanford.edu/sentiment/code.html默认用法,除了在Java1

全球名校AI课程库(15)| Stanford斯坦福 · 线性代数与矩阵方法导论课程『Introduction to Applied Linear Algebra』

?课程学习中心|?CS数学基础课程合辑|?课程主页|?中英字幕视频|?项目代码解析课程介绍线性代数,是数据科学高阶课程的前置课程,也是前沿热门应用领域的根基。数据科学、机器学习、人工智能、信号和图像处理、层析成像、导航、金融等等,都建立在数学的基础之上。如果你想快速补充线性代数的相关知识,ENGR108这门课是非常好的选择!ENGR108(曾用名:EE103、CME103)是全球顶级院校斯坦福开设的以线性代数和矩阵论为主题的专业课程。不同于定理证明、矩阵运算的传统内容,这门课程更直观,用非常多的例子和图标,来表示向量、矩阵与复杂世界的关系,并能够解决现实问题。线性代数的相关知识,向量、矩阵与矩