草庐IT

regex_extract

全部标签

c++ - boost::regex 和 std::regex 之间的不一致

这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:Nomatcheswithc++11regex我之前使用boost::regex来处理一些东西,而对于一些我想使用std::regex的新东西,直到我注意到以下不一致-所以问题哪个是正确的?#include#include#include#includevoidtest(std::stringprefix,std::stringstr){std::stringpat=prefix+"\\.\\*.*?";std::cout对我来说(gcc4.7.2,-std=c++11,boost:1.51),我看到了以下内

《SagDRE: Sequence-Aware Graph-Based Document-Level Relation Extraction with Adaptive Margin Loss》论文阅读笔记

代码原文地址关键参考文献:Document-LevelRelationExtractionwithAdaptiveThresholdingand LocalizedContextPooling摘要关系抽取(RE)是许多自然语言处理应用的重要任务,它的目标是从文档中抽取出实体之间的关系。文档级RE任务面临着许多挑战,因为它不仅需要跨句子进行推理,还要处理同一文档中存在的多种关系。为了更好地捕捉文档中的长距离相关性,现有的最先进的文档级RE模型都采用了图结构。本文提出了一种新的文档级RE模型,名为SagDRE,它能够有效地利用文本中的原始顺序信息。该模型通过学习句子级别的有向边来表示文档中的信息流

c++ - 如何在 cpp 中使用 std::regex_replace() 函数查找和替换

我正在做一个项目,我需要找到以$开头并以>$结尾的单词,并将其替换为存储在变量中的单词。例子stringa="hello";stringb="Fellow$$,fullof$$people"std::cout$)\\b",a);//shouldprint"Fellowhello,fullofhellopeople"但似乎这是不可能直接实现的。我该如何解决这个问题? 最佳答案 除了两点,你的代码没有问题:正则表达式-你没有转义$这意味着字符串结束,\b$前后的单词边界这需要一个单词字符出现在$旁边符号。regex_replace没有签

c++ - boost/ python : How can I use/convert extracted objects?

假设:usingnamespaceboost::python;voidmyClass::test(numeric::array&arrayParam){consttuple&shape=extract(arrayParam.attr("shape"));}例如,我想将其转换为int并进行打印。我尝试了intx=shape[0];但它给了我一条消息“无法在初始化中将‘boost::python::api::const_object_item’转换为‘int’”。 最佳答案 shape[0]为您提供一个Python对象。要将其转换为in

C++ regex_match 不工作

这是我的部分代码boolCSettings::bParseLine(constchar*input){//_asmINT3std::stringline(input);std::size_tposition=std::string::npos,comment;regexcvarPattern("\\.([a-zA-Z_]+)");regexparentPattern("^([a-zA-Z0-9_]+)\\.");regexcvarValue("\\.[a-zA-Z0-9_]+[]*=[]*(\\d+\\.*\\d*)");std::cmatchmatchedParent,matched

c++ - C/C++ : extract a subset of one enum to form a new enum

假设我有一个列出所有人员的主枚举:typedefenumall_personnel{//maleTONY,MIKE,JIM,//femaleJESSICA,MARY,}all_personnel_t;现在我想为male和female定义其他两个枚举(因为,例如,一些函数只接受males或females枚举参数),但我想使用与主枚举中相同的名称标识符。在C/C++中有可能吗?还是有其他方法?似乎以下内容不起作用(编译器提示redeclarationofenumerator‘TONY’等:typedefenummale_personnel{TONY,MIKE,JIM,}male_perso

c++ - 为什么我的 Boost.Regex 搜索只报告一次匹配迭代?

我试图找出一个字符串中有多少个正则表达式匹配项。我正在使用迭代器来迭代匹配项,并使用整数来记录有多少匹配项。longintbefore=GetTickCount();stringtext;boost::regexre("^(\\d{5})\\s(\\d{8})\\s(.*)\\s(.*)\\s(.*)\\s(\\d{8})\\s(.{1})$");char*buffer;longlength;longcount;ifstreamf;f.open("c:\\temp\\test.txt",ios::in|ios::ate);length=f.tellg();f.seekg(0,ios::

c++ - 为什么 regex_match 抛出 "complexity exception"?

我正在尝试测试(使用boost::regex)文件中的一行是否仅包含由空格分隔的数字条目。我遇到了一个我不明白的异常(见下文)。如果有人能解释为什么抛出它,那就太好了。也许我在这里以定义模式的方式做了一些愚蠢的事情?这是代码://regex_test.cpp#include#include#includeusingnamespacestd;usingnamespaceboost;intmain(){//Mybasicpatterntotestforasinglenumericexpressionconststringnumeric_value_pattern="(?:-|\\+)?[[

c++ - 为什么 Boost.Regex 不能在一个字符串中找到多个匹配项?

我正在编写一个小的命令行程序,它要求用户以ax^2+bx^1+cx^0的形式提供多项式。我稍后会解析数据,但现在我只是想看看我是否可以将多项式与正则表达式匹配(\+|-|^)(\d*)x\^([0-9*]*)我的问题是,它不匹配用户输入的多项式中的多个项,除非我将其更改为((\+|-|^)(\d*)x\^([0-9*]*))*(不同之处在于整个表达式被分组并且末尾有一个星号)。如果我键入诸如“4x^2”而不是“4x^2+3x^1+2x^0”之类的内容,则第一个表达式有效,因为它不多次检查。我的问题是,为什么Boost.Regex的regex_match()不能在同一个字符串中找到多个匹

《Learning from Context or Names?An Empirical Study on Neural Relation Extraction》论文阅读笔记

代码原文地址预备知识:1.什么是对比学习?对比学习是一种机器学习范例,将未标记的数据点相互并列,以教导模型哪些点相似,哪些点不同。也就是说,顾名思义,样本相互对比,属于同一分布的样本在嵌入空间中被推向彼此。相比之下,属于不同分布的那些则相互拉扯。摘要神经模型在关系抽取(RE)的基准任务上表现出色。但是,我们还不清楚文本中哪些信息对现有的RE模型的决策有影响,以及如何进一步提升这些模型的性能。为了解决这个问题,本文实证地分析了文本中两个主要的信息源:文本上下文和实体提及(名称)对RE的作用。本文发现,虽然上下文是预测的主要依据,但RE模型也高度依赖于实体提及中的信息,其中大多数是类型信息;以及现