草庐IT

Delimiter

全部标签

java - 在 Java 中查找一组值中的模式

有没有办法在Java中提取字符串列表中的通用模式?例如,如果我们有一个值列表:001-L1002-L2003-L3004-L4...有没有办法推断出我们有3位数字,然后是“-”,然后是字母L,最后是数字字符?我认为它与公共(public)子字符串或类似的东西有关,但我还没有找到任何东西。谢谢!编辑:显然这不会是一个完美的识别,它只会返回一个基于数据的推荐。我要构建的是接近this的东西.在视频中,当用户点击该列时,会建议将数据拆分为“:”。 最佳答案 我认为您可能想要“推断”一组字符串可能共有的模式,而不是使用正则表达式验证它们。这

java - 如何在第一个逗号之前拆分字符串?

我有一个覆盖字符串的方法,它以以下格式返回字符串:"abc,cde,def,fgh"我想把字符串内容分成两部分:第一个逗号和之前的字符串第一个逗号后的字符串我最重要的方法是:@OverrideprotectedvoidonPostExecute(StringaddressText){placeTitle.setText(addressText);}现在如何将字符串分成两部分,以便我可以使用它们在两个不同的TextView中设置文本? 最佳答案 您可以使用下面的代码片段Stringstr="abc,cde,def,fgh";Strin

Java CSVReader 忽略双引号中的逗号

我有一个CSV文件,但在解析时遇到问题。我正在使用opencsv图书馆。这是我的数据的样子以及我想要实现的目标。RPT_PE,CLASS,RPT_MKT,PROV_CTRCT,CENTER_NM,GK_TY,MBR_NM,MBR_PID"20150801","NULL","33612","00083249PPCP602","JOESMITHARNP","NULL","FRANK,LUCASE","50004655200"我遇到的问题是成员名称("FRANK,LUCASE")被分成两列,而成员名称应该是一列。我再次使用opencsv和逗号作为分隔符。有什么办法可以忽略双引号内的逗号吗?p

c++ - 我怎样才能使它与 C++ 中的每个定界符一起工作?

我刚刚编写了一个程序,使用指针对char数组进行标记。该程序只需要使用空格作为分隔符即可。我刚刚上交并获得了满分,但上交后,我意识到这个程序只有在分隔符是空格的情况下才有效。我的问题是,如何让这个程序使用任意定界符?我在下面向您展示的函数返回指向char数组中下一个单词的指针。这是我认为我需要更改的内容,以使其适用于任何定界符。谢谢!代码:char*StringTokenizer::Next(void){pNextWord=pStart;if(*pStart=='\0'){returnNULL;}while(*pStart!=delim){pStart++;}if(*pStart=='

c++ - boost::spirit 解析为 fusion 适应结构可选但独占

如果有一个结构:structrecord{std::stringtype;std::stringdelimiter;uint32_tlength;std::stringname;record(){type="";delimiter="";length=0;name="";}};使用boost::fusion和以下语法进行改编:structrecord_parser:qi::grammar{record_parser():record_parser::base_type(start){usingqi::lit;usingqi::uint_;usingqi::lexeme;usingasc

c++ - strtok 如何还包括分隔符作为标记

现在我已经设置了代码,将我的字符串分成带有分隔符,;=和空格的标记。我还想将特殊字符作为标记包括在内。char*cstr=newchar[str.length()+1];strcpy(cstr,str.c_str());char*p=strtok(cstr,"");while(p!=0){whichType(p);p=strtok(NULL,",;=");}所以现在如果我打印出一个字符串的标记,例如asdsdfqwewer,sdf;wer它将是asdsdfqwewersdfwer我希望它看起来像asdsdfqwewer,sdf;wer任何帮助都会很棒。谢谢

hadoop - HIVE:应用定界符直到指定的列

我正在尝试将数据从文件移动到配置单元表中。文件中的数据看起来像这样:-StringAStringBStringCStringDStringE其中每个字符串由空格分隔。问题是我想要单独的列用于StringA、StringB和StringC,而一列用于StringD,即StringD和StringE应该属于同一列。如果我使用ROWDELIMITEDBYFIELDSTERMINATEDBY'',Hive将为StringD和StringE生成单独的列。(StringD和StringE本身包含空格,而其他字符串本身不包含空格)hive中是否有任何特殊语法来实现此目的,或者我是否需要以某种方式预处

sql - Hive - 加载具有特殊字符的分隔数据导致关闭位置

假设我想在Hive中创建一个包含4列的简单表并加载一些竖线分隔的数据。CREATEtableTEST_1(COL1string,COL2string,COL3string,COL4string)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'|';原始数据:123|456|DasaniBottled\|Water|789我对Col3值的期望是“DasaniBottled\|Water”,中间有一些特殊字符“\|”,因此导致Hive表列关闭位置从COL3开始,因为我使用“|”作为分隔符创建表。特殊字符\|确实有一个管道|其中的字符。有什么方法可以解决这个问题,让

csv - Pig CSVExcelStorage 双引号逗号

我正在将csv格式的文件(字段以逗号分隔并用双引号引起来)接收到HDFS中,并开发了一个pig脚本,该脚本在我使用HQL脚本将数据插入Hive之前删除了标题行并去掉了双引号。这个过程一直运行良好;但是,今天我发现其中一个表存在数据问题。该表的文件特别有一个字符串字段,可以在双引号内包含多个逗号。这会导致某些记录的数据被错误地加载到Hive中的错误列中。我无法更改源文件的格式。目前我正在使用PiggyBankCSVExcelStorage来处理csv格式,如下所示。可以修改它以产生正确的结果吗?我还有哪些其他选择?我注意到现在还有一个CSVLoader,但还没有找到任何示例来说明如何使用

hadoop - 在 mrunit 中设置配置

我一直在mrunit文档中搜索,但到目前为止还没有找到。我如何在我的mrunit中传递配置参数。例如,如果我以wordcount为例。比方说,在我的驱动程序代码中我正在设置这个参数...conf.set("delimiter",args[2])在我的映射器代码中,我将其称为:Stringdelimiter=conf.get("delimiter");String[]tokens=value.toString().split(delimiter);for(Stringtoken:tokens)context.write(token,one);如何设置这个配置参数。我一直在研究这个例子:h