parsing

c++ - LR(1) 语法的状态、符号和规则的数量的合理上限是多少？

我正在制作一个LR(1)解析器，我在很多地方遇到了性能瓶颈。我想尝试优化解析器的数据结构，但为了做到这一点，我需要大致了解有多少状态、规则和终端符号对于(可能是复杂的)计算机语言是合理的，像C++。我的猜测是，复杂语言的典型语法应该是:≤100个终端符号每次生产≤50个符号≤2,000条规则≤10,000个州但我真的不知道他们有多正确。请注意，我假设每个规则都是nonterminal→symbolsymbolsymbol...,因此，看起来像foo:(bar|baz)+的单个复合“规则”实际上可能包含5条规则，而不仅仅是1条规则。它们合理吗？如果不是，我在哪里可以找到这些数字？

amp 43 section 生成器的 c++parsing lr

c++ - 使用 C++ 解析一个巨大的复杂 CSV 文件

我有一个很大的CSV文件，如下所示:23456，末日将至，毫无意义的愚蠢描述，http://www.example.com，45332，1998年7月5日，星期日，45:332这只是CSV文件的一行。其中大约有500k。我想用C++解析这个文件。我开始的代码是:#include#include#include#includeusingnamespacestd;intmain(){//opentheinputcsvfilecontainingtrainingdataifstreaminputFile("my.csv");stringline;while(getline(inputFile

amp 43 gt string section c++parsing csv

c++ - 有没有办法强制 "most vexing parse"成为错误，即使是逐个类？

是否有可能(对A类进行任何修改)进行以下工作？即，使最令人烦恼的解析错误？classA{};intmain(){Aa();//canthisbeforcedtobeanerror??Ab;//thisshouldwork} 最佳答案类A的任何修改都不会影响声明Aa();的解析方式。解析器甚至在查看A的定义之前就确定这是一个函数声明。事实上，A的定义甚至不需要可见来解析这个语句；预先声明就足够了。但是，编译器通常会对此发出警告，您可能会将其变成错误。例如，对于clang，您可以使用标志-Werror=vexing-parse。str

amp 逐个 code section pre c++most-vexing-parse

c++ - 从 QByteArray 解析 Qt5 JSON

我有QByteArray，包含这个JSON{"response":{"count":2,"items":[{"name":"somename","key":1"},{"name":"somename","key":1"}]}}需要解析并获取需要的数据:QJsonDocumentitemDoc=QJsonDocument::fromJson(answer);QJsonObjectitemObject=itemDoc.object();qDebug()第一次调试显示所有QByteArray的内容，记录在itemObject中，第二次调试不显示任何内容。我必须以其他方式解析它，或者为什么这个

QByteArray amp 34 section response c++parsing qt5 qjson

c++ - 将 C++ 字符串解析为元组

我正在开发一个简单的CSV解析器，它将文件的行存储在一个元组中。如果不是因为文件中各行的条目数及其类型都是变量，这将是一项简单的任务。因此，这些行可能是这样的:1,2.2,你好,18,世界解析器应该能够像这样工作:ifstreamfile("input.csv");SimpleCSVParserparser(file);当我尝试实现一个函数来解析实际行时，事情变得复杂了。我仍然没有找到一种方法来从参数列表中提取下一个类型以在调用file>>var之前声明变量。我还需要在循环中执行此操作，以某种方式从每次迭代的结果构建一个元组。那么如何使用纯C++11将字符串解析为元组？我试过这个:te

amp 43 code tuple gt c++parsing templates c++11 variadic-templates

c++ - 使用 boost spirit 语法构建错误(boost 1.43 和 g++ 4.4.1)第二部分

我在编译一个小的spirit/qi语法时遇到了问题。我正在使用boost1.43和g++4.4.1。输入语法头:构建错误似乎指向“指令”规则的定义，也许是“[sp::_val=sp::_1]”以某种方式破坏了它，但这或多或少基于精神文档教程是用xml节点解析器做的输入语法.h#include#include#include#include#include#include#include#include#include#include#include#include#includenamespacesp=boost::spirit;namespaceqi=boost::spirit::q

amp 43 boost variant void c++parsing boost-spirit

c++ - Bison :轮类减少冲突

我相信我无法理解轮类减少冲突的工作原理。我知道Bison可以向前看，所以我不明白为什么我会遇到这个问题。在我的语言中，列表被定义为[]之间的一组数字或列表。例如[][1][12][1[2]3]都是有效列表。这是导致问题的定义value:num|stringValue|list;list:LEFTBRACERIGHTBRACE|LEFTBRACElistRIGHTBRACE|numlist|RIGHTBRACE;冲突是从数开始的，不知道是按列表规则移位，还是按值规则归约。我很困惑，因为它不能检查列表是否跟在数字后面吗？任何关于我应该如何进行的建议都将不胜感激。

amp Bison section RIGHTBRACE code c++parsing grammar yacc

c++ - 使用 Boost JSON 解析器的 JSON 格式化错误

我正在尝试使用Boost从我的Firefox配置文件夹中读取一个名为sessionstore.js的JSON文件，其中保存了当前/上一个Firefoxsession的信息以供恢复之用。我写了一个基于XML-basedtutorial的程序从Boost网站，只需将XML部分换成JSON部分，如下所示#include#include#include#include#include#includeusingboost::property_tree::ptree;usingnamespacestd;conststringFILENAME="sessionstore.js";conststrin

JSON amp 34 true twitter c++parsing boost

c++ - 如何使用 libpcap 解析以太网数据包？

我在C++中使用libpcap从pcap文件中读取数据包，例如:rc=pcap_next_ex((pcap_t*)handle,&header,(constunsignedchar**)packet);我想解析包头(没有负载)。例如，我如何解析给定的数据包以提取其源和目标IP地址？谢谢最佳答案检查libpcap的代码示例http://www.tcpdump.org/pcap.html在got_packet(u_char*args,conststructpcap_pkthdr*header,constu_char*packet);

amp libpcap section code packet c++parsing

c++ - 解析/处理 C++ 文件的选项

所以我需要能够解析一些相对简单的带有注释的C++文件，并从中生成额外的源文件。举个例子，我可能有这样的东西://@servicestructMyService{intgetVal()const;};我需要找到//@服务注释，并获取其后结构的描述。我正在考虑是否可以利用LLVM/Clang，因为它似乎有库支持在第三方应用程序中嵌入编译器/解析功能。但就解析源代码而言，我真的一无所知，所以我不确定我到底需要寻找什么，或者从哪里开始。我知道AST是语言表示的核心，并且库支持从Clang中的源文件生成AST。但是注释不会真的成为AST的一部分，对吗？那么，找到遵循特定注释注释的结构表示的好方法

amp 43 section member C++c++parsing clang

137 138 139140141 142 143