草庐IT

javascript - 通过 Core Erlang 将 Erlang 编译为 Javascript

coder 2024-07-16 原文

所以开始在 LuvvieScript 上取得进展,然后一切都在 Twitter 上开始了......
https://twitter.com/gordonguthrie/status/389659700741943296

安东尼·拉明 https://twitter.com/nokusu指出我做错了,我应该通过 Core Erlang 而不是 Erlang AST 从 Erlang 编译到 JavaScript。这对我来说既是一个引人注目但又没有吸引力的选择...... Twitter 不是该讨论的正确媒介,我想我会在这里写下来并就此获得一些建议。

战略概览

LuvvieScript 有三个核心要求:

  • 一个有效的 Erlang 子集,可以编译为相同且高性能的 Javascript
  • 一个完整的 Source Map,以便它可以在 LuvvieScript 而不是 Javascript 的浏览器中调试
  • 一个“运行时”客户端 javascript 环境(带有服务器端通信)来执行 LuvvieScript 模块(一种页面内管理器...)

  • 这些选项中的第三个有点超出本次辩论的范围,但前两个是核心。

    有一个懒惰的 gits 推论 - 我想使用尽可能多的 Erlang 和 Javascript 语法工具(词法分析器、解析器、标记器、AST 转换等)并编写最少的代码。

    当前思维

    代码目前的编写方式如下结构:
  • 将代码编译为 Erlang AST(有行号)
  • 标记代码(保留注释和空格)并使用这些标记构建一个字典,将行/列信息映射到标记
  • 合并字典和 AST 以给出一个 line/col AST(有些想对不同参数的 fns 进行分组)
  • 将这个新的 Erlang AST 转换为在 SpiderMonkey Parser 中实现的 Javascript AST
    API https://developer.mozilla.org/en-US/docs/SpiderMonkey/Parser_API
  • 使用像 Brushtail 这样的 Javascript 实用程序来改变 Javascript AST 中的尾调用 https://github.com/puffnfresh/brushtail
  • 使用像 ESCodeGen 这样的 Javascript 工具来发出 javascript https://github.com/Constellation/escodegen

  • 基本上我得到一个 Erlang AST,它看起来像这样:
     [{function,
          {19,{1,9}},
          atom1_fn,0,
          [{clause,
               {19,none},
               [],
               [[]],
               [{match,
                    {20,none},
                    [{var,{20,{5,6}},'D'}],
                    [{atom,{20,{11,15}},blue}]},
                {var,{21,{5,6}},'D'}]}]}]},
    

    然后我将它转换成一个 Javascript JSON AST,如下所示:
    {
        "type": "Program",
        "body": [
            {
                "type": "VariableDeclaration",
                "declarations": [
                    {
                        "type": "VariableDeclarator",
                        "id": {
                            "type": "Identifier",
                            "name": "answer",
                            "loc": {
                                "start": {
                                    "line": 2,
                                    "column": 4
                                },
                                "end": {
                                    "line": 2,
                                    "column": 10
                                }
                            }
                        },
                        "init": {
                            "type": "BinaryExpression",
                            "operator": "*",
                            "left": {
                                "type": "Literal",
                                "value": 6,
                                "raw": "6",
                                "loc": {
                                    "start": {
                                        "line": 2,
                                        "column": 13
                                    },
                                    "end": {
                                        "line": 2,
                                        "column": 14
                                    }
                                }
                            },
                            "right": {
                                "type": "Literal",
                                "value": 7,
                                "raw": "7",
                                "loc": {
                                    "start": {
                                        "line": 2,
                                        "column": 17
                                    },
                                    "end": {
                                        "line": 2,
                                        "column": 18
                                    }
                                }
                            },
                            "loc": {
                                "start": {
                                    "line": 2,
                                    "column": 13
                                },
                                "end": {
                                    "line": 2,
                                    "column": 18
                                }
                            }
                        },
                        "loc": {
                            "start": {
                                "line": 2,
                                "column": 4
                            },
                            "end": {
                                "line": 2,
                                "column": 18
                            }
                        }
                    }
                ],
                "kind": "var",
                "loc": {
                    "start": {
                        "line": 2,
                        "column": 0
                    },
                    "end": {
                        "line": 2,
                        "column": 19
                    }
                }
            }
        ],
        "loc": {
            "start": {
                "line": 2,
                "column": 0
              },
            "end": {
                "line": 2,
                "column": 19
               }
        }
    }
    

    问题报

    Anthony 的观点很好——Core Erlang 是一种比 Erlang 更简单、更规范的语言,应该比普通的 Erlang 更容易转换为 Javascript,但它没有很好的文档记录。

    我可以很容易地得到一个类似于 AST 的 Core Erlang 表示:
    {c_module,[],
        {c_literal,[],basic_types},
        [{c_var,[],{atom1_fn,0}},
         {c_var,[],{atom2_fn,0}},
         {c_var,[],{bish_fn,1}},
         {c_var,[],{boolean_fn,0}},
         {c_var,[],{float_fn,0}},
         {c_var,[],{int_fn,0}},
         {c_var,[],{module_info,0}},
         {c_var,[],{module_info,1}},
         {c_var,[],{string_fn,0}}],
        [],
        [{{c_var,[],{int_fn,0}},{c_fun,[],[],{c_literal,[],1}}},
         {{c_var,[],{float_fn,0}},{c_fun,[],[],{c_literal,[],2.3}}},
         {{c_var,[],{boolean_fn,0}},{c_fun,[],[],{c_literal,[],true}}},
         {{c_var,[],{atom1_fn,0}},{c_fun,[],[],{c_literal,[],blue}}},
         {{c_var,[],{atom2_fn,0}},{c_fun,[],[],{c_literal,[],'Blue 4 U'}}},
         {{c_var,[],{string_fn,0}},{c_fun,[],[],{c_literal,[],"string theory"}}},
         {{c_var,[],{bish_fn,1}},
          {c_fun,[],
              [{c_var,[],'_cor0'}],
              {c_case,[],
                  {c_var,[],'_cor0'},
                  [{c_clause,[],
                       [{c_literal,[],bash}],
                       {c_literal,[],true},
                       {c_literal,[],berk}},
                   {c_clause,[],
                       [{c_literal,[],bosh}],
                       {c_literal,[],true},
                       {c_literal,[],bork}},
                   {c_clause,
                       [compiler_generated],
                           [{c_var,[],'_cor1'}],
                       {c_literal,[],true},
                       {c_primop,[],
                           {c_literal,[],match_fail},
                           [{c_tuple,[],
                                [{c_literal,[],case_clause},
                                 {c_var,[],'_cor1'}]}]}}]}}},
         {{c_var,[],{module_info,0}},
          {c_fun,[],[],
              {c_call,[],
                  {c_literal,[],erlang},
                  {c_literal,[],get_module_info},
                  [{c_literal,[],basic_types}]}}},
         {{c_var,[],{module_info,1}},
          {c_fun,[],
              [{c_var,[],'_cor0'}],
              {c_call,[],
                  {c_literal,[],erlang},
                  {c_literal,[],get_module_info},
                  [{c_literal,[],basic_types},{c_var,[],'_cor0'}]}}}]}
    

    但没有线 col/nos。所以我可以得到一个可以生成 JS 的 AST - 但关键不是 SourceMaps。

    问题 1 我怎样才能得到我需要的行信息 - (我已经可以从“正常”的 Erlang token 中获取列信息......)

    Erlang Core 在生产过程中与普通 Erlang 略有不同,因为它开始将函数调用中的变量名替换为自己内部的变量名,这也会导致一些 Source Map 问题。一个例子是这个 Erlang 子句:
    bish_fn(A) ->
        case A of
            bash -> berk;
            bosh -> bork
        end.
    

    Erlang AST 很好地保留了名称:
     [{function,
          {31,{1,8}},
          bish_fn,1,
          [{clause,
               {31,none},
               [{var,{31,{11,12}},'A'}],
               [[]],
               [{'case',
                    {32,none},
                    [{var,{32,{11,12}},'A'}],
                    [{clause,
                         {33,none},
                         [{atom,{33,{9,13}},bash}],
                         [[]],
                         [{atom,{34,{13,17}},berk}]},
                     {clause,
                         {35,none},
                         [{atom,{35,{9,13}},bosh}],
                         [[]],
                         [{atom,{36,{13,17}},bork}]}]}]}]}]},
    

    Core Erlang 已经改变了函数中调用的参数的名称:
    'bish_fn'/1 =
        %% Line 30
        fun (_cor0) ->
        %% Line 31
        case _cor0 of
          %% Line 32
          <'bash'> when 'true' ->
              'berk'
          %% Line 33
          <'bosh'> when 'true' ->
              'bork'
          ( <_cor1> when 'true' ->
            primop 'match_fail'
                ({'case_clause',_cor1})
            -| ['compiler_generated'] )
        end
    

    问题 2 我可以在 Core Erlang 中保留或映射变量名称吗?

    问题 3 我很欣赏 Core Erlang 的明确设计,使编译变得容易 进入 Erlang 并编写改变 Erlang 代码的工具 - 但问题是它真的会成功
    更容易编译 Erlang的?

    选项

    我可以 fork 核心 erlang 代码并添加源映射选项,但我玩了 懒人卡在这里...

    更新

    针对 Eric 的回应,我应该澄清我是如何生成 Core Erlang cerl 记录的。我首先使用以下命令将我的普通 Erlang 编译为核心 erlang:
    c(some_module, to_core)
    

    然后我使用 core_scancore_parse在此功能中,来自 compiler.erl :
    compile(File) ->
        case file:read_file(File) of
            {ok,Bin} ->
                case core_scan:string(binary_to_list(Bin)) of
                    {ok,Toks,_} ->
                        case core_parse:parse(Toks) of
                            {ok, Mod} ->
                                {ok, Mod};
                            {error,E} ->
                                {error, {parse, E}}
                        end;
                    {error,E,_} ->
                        {error, {scan, E}}
                end;
            {error,E} ->
                {error,{read, E}}
        end.
    

    问题是我/怎样才能让该工具链发出带注释的 AST。我怀疑我需要自己添加这些选项:(

    最佳答案

  • 行号作为注释提供。如果您查看我真正推荐您使用的 cerl 模块,您会发现几乎所有内容都需要一个注释列表。其中一个注释是代表行号的简单数字。如果我没有直接记错 Core AST 并且 atom1_fn 变量在第 10 行。AST 将如下所示:
    {c_var,[10],{atom1_fn,0}}
  • 不,你必须自己做所有的簿记。没有什么可以为你做的。
  • 我不确定我是否理解这个问题。

  • Anthony 所说的关于 Core Erlang 的一切都是真实的。这也是我选择 Core Erlang 作为 Joxa 目标语言的相同原因。我从中学到的教训是,虽然 Core Erlang 是一种非常容易定位的目标语言,但它有两个主要缺点,建议不要使用它。
  • Dialyzer 仅适用于 Beam 文件的抽象代码块中的 Erlang AST。在编译为 Core Erlang 时,无法将这样的 AST 放入抽象代码块中。因此,如果您的目标是 Core Erlang,Dialyzer 将不适合您。无论您是否生成正确的规范属性,都是如此。
  • 你无法使用在 Erlang AST 上工作的工具。例如,编译为 Erlang 源代码的能力。 Core Erlang 与源代码编译器之间的问题非常多,根本无法正常工作。这是许多实用领域的重大胜利。

  • 由于上述原因,我实际上正在将 Joxa 重定向到 Erlang AST。
    顺便说一句,你可能对这个项目感兴趣。 https://github.com/5HT/shen .它是一个用于 Erlang AST 的 JavaScript 编译器,该编译器已经存在并且正在运行。虽然我没有太多的经验。
    ** 编辑:您实际上可以看到从 Erlang 源代码生成的核心 erlang AST。这在学习如何编译到核心时有很大帮助。 ec_compileerlware_commons repo 有很多实用函数来帮助解决这个问题。

    关于javascript - 通过 Core Erlang 将 Erlang 编译为 Javascript,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19454247/

    有关javascript - 通过 Core Erlang 将 Erlang 编译为 Javascript的更多相关文章

    1. ruby - 通过 rvm 升级 ruby​​gems 的问题 - 2

      尝试通过RVM将RubyGems升级到版本1.8.10并出现此错误:$rvmrubygemslatestRemovingoldRubygemsfiles...Installingrubygems-1.8.10forruby-1.9.2-p180...ERROR:Errorrunning'GEM_PATH="/Users/foo/.rvm/gems/ruby-1.9.2-p180:/Users/foo/.rvm/gems/ruby-1.9.2-p180@global:/Users/foo/.rvm/gems/ruby-1.9.2-p180:/Users/foo/.rvm/gems/rub

    2. ruby - 通过 erb 模板输出 ruby​​ 数组 - 2

      我正在使用puppet为ruby​​程序提供一组常量。我需要提供一组主机名,我的程序将对其进行迭代。在我之前使用的bash脚本中,我只是将它作为一个puppet变量hosts=>"host1,host2"我将其提供给bash脚本作为HOSTS=显然这对ruby​​不太适用——我需要它的格式hosts=["host1","host2"]自从phosts和putsmy_array.inspect提供输出["host1","host2"]我希望使用其中之一。不幸的是,我终其一生都无法弄清楚如何让它发挥作用。我尝试了以下各项:我发现某处他们指出我需要在函数调用前放置“function_”……这

    3. ruby - 通过 ruby​​ 进程共享变量 - 2

      我正在编写一个gem,我必须在其中fork两个启动两个webrick服务器的进程。我想通过基类的类方法启动这个服务器,因为应该只有这两个服务器在运行,而不是多个。在运行时,我想调用这两个服务器上的一些方法来更改变量。我的问题是,我无法通过基类的类方法访问fork的实例变量。此外,我不能在我的基类中使用线程,因为在幕后我正在使用另一个不是线程安全的库。所以我必须将每个服务器派生到它自己的进程。我用类变量试过了,比如@@server。但是当我试图通过基类访问这个变量时,它是nil。我读到在Ruby中不可能在分支之间共享类变量,对吗?那么,还有其他解决办法吗?我考虑过使用单例,但我不确定这是

    4. ruby - 通过 RVM (OSX Mountain Lion) 安装 Ruby 2.0.0-p247 时遇到问题 - 2

      我的最终目标是安装当前版本的RubyonRails。我在OSXMountainLion上运行。到目前为止,这是我的过程:已安装的RVM$\curl-Lhttps://get.rvm.io|bash-sstable检查已知(我假设已批准)安装$rvmlistknown我看到当前的稳定版本可用[ruby-]2.0.0[-p247]输入命令安装$rvminstall2.0.0-p247注意:我也试过这些安装命令$rvminstallruby-2.0.0-p247$rvminstallruby=2.0.0-p247我很快就无处可去了。结果:$rvminstall2.0.0-p247Search

    5. ruby-on-rails - Enumerator.new 如何处理已通过的 block ? - 2

      我在理解Enumerator.new方法的工作原理时遇到了一些困难。假设文档中的示例:fib=Enumerator.newdo|y|a=b=1loopdoy[1,1,2,3,5,8,13,21,34,55]循环中断条件在哪里,它如何知道循环应该迭代多少次(因为它没有任何明确的中断条件并且看起来像无限循环)? 最佳答案 Enumerator使用Fibers在内部。您的示例等效于:require'fiber'fiber=Fiber.newdoa=b=1loopdoFiber.yieldaa,b=b,a+bendend10.times.m

    6. ruby - 寻找通过阅读代码确定编程语言的ruby gem? - 2

      几个月前,我读了一篇关于ruby​​gem的博客文章,它可以通过阅读代码本身来确定编程语言。对于我的生活,我不记得博客或gem的名称。谷歌搜索“ruby编程语言猜测”及其变体也无济于事。有人碰巧知道相关gem的名称吗? 最佳答案 是这个吗:http://github.com/chrislo/sourceclassifier/tree/master 关于ruby-寻找通过阅读代码确定编程语言的rubygem?,我们在StackOverflow上找到一个类似的问题:

    7. 通过 MacPorts 的 RubyGems 是个好主意吗? - 2

      从MB升级到新的MBP后,Apple的迁移助手没有移动我的gem。我这次是通过macports安装ruby​​gems,希望在下次升级时避免这种情况。有什么我应该注意的陷阱吗? 最佳答案 如果你想把你的gems安装在你的主目录中(在传输过程中应该复制过来,作为一个附带的好处,会让你以你自己的身份运行geminstall,而不是root),将gemhome:键设置为您在~/.gemrc中的主目录中的路径. 关于通过MacPorts的RubyGems是个好主意吗?,我们在StackOverf

    8. ruby - 通过 RVM 安装 Ruby 1.9.2 永远行不通! - 2

      当我执行>rvminstall1.9.2时一切顺利。然后我做>rvmuse1.9.2也很顺利。但是当涉及到ruby​​-v时..sam@sjones:~$rvminstall1.9.2/home/sam/.rvm/rubies/ruby-1.9.2-p136,thismaytakeawhiledependingonyourcpu(s)...ruby-1.9.2-p136-#fetchingruby-1.9.2-p136-#downloadingruby-1.9.2-p136,thismaytakeawhiledependingonyourconnection...%Total%Rece

    9. ruby - 可以通过多少种方法将方法添加到 ruby​​ 对象? - 2

      当谈到运行时自省(introspection)和动态代码生成时,我认为ruby​​没有任何竞争对手,可能除了一些lisp方言。前几天,我正在做一些代码练习来探索ruby​​的动态功能,我开始想知道如何向现有对象添加方法。以下是我能想到的3种方法:obj=Object.new#addamethoddirectlydefobj.new_method...end#addamethodindirectlywiththesingletonclassclass这只是冰山一角,因为我还没有探索instance_eval、module_eval和define_method的各种组合。是否有在线/离线资

    10. ruby - 分布式事务和队列,ruby,erlang,scala - 2

      我有一个涉及多台机器、消息队列和事务的问题。因此,例如用户点击网页,点击将消息发送到另一台机器,该机器将付款添加到用户的帐户。每秒可能有数千次点击。事务的所有方面都应该是容错的。我以前从未遇到过这样的事情,但一些阅读表明这是一个众所周知的问题。所以我的问题。我假设安全的方法是使用两阶段提交,但协议(protocol)是阻塞的,所以我不会获得所需的性能,我是否正确?我通常写Ruby,但似乎Redis之类的数据库和Rescue、RabbitMQ等消息队列系统对我的帮助不大——即使我实现某种两阶段提交,如果Redis崩溃,数据也会丢失,因为它本质上只是内存。所有这些让我开始关注erlang和

    随机推荐