草庐IT

13 Javac将源码编译为字节码的过程

拿了桔子跑-范德彪 2023-04-18 原文

目录

1 编译器分类

Java的编译过程:将源代码转化成机器可执行的二进制代码。实际上,编译过程,是分阶段进行的,由此产生了不同的编译器。

编译器分类:

类别 工作内容 代表
前端编译器 源代码转变成字节码 JDK的Javac、Eclipse编译器(ECJ)
即时编译器 运行时把字节码转变成本地机器码 HotSpot虚拟机的C1、C2编译器
提前编译器 直接把源代码编译成与目标机器指令集相关的二进制代码 JDK的Jaotc等

2 Javac编译器

2.1 Javac简介

  1. Javac是程序猿使用最多的一款编译器,但面向IDE编程使得我们很少直接使用javac,开发工具帮我们自动编译了
  2. 它由Java编写

IntelliJ IDEA ,支持几种编译器:Javac、Eclipse ECJ、Ajc 等,默认使用Javac

2.2 Javac与程序开发

编译器如何跟程序员打交道?

  1. 前端编译器对程序效率提升影响极少。虚拟机设计团队将性能优化放在即时编译器中,让那些不是由Javac产生的Class文件(如JRuby、Groovy等语言的Class文件)也能被编译器优化。
  2. 前端编译器对程序员开发效率提升影响极大:编译器的“语法糖”:泛型、自动拆箱、自动装箱、枚举类、Lambda表达式等特征,简化编码。

3 Javac工作过程

Javac工作过程就是源代码变为字节码的过程。

3.1 解析与填充符号表

3.1.1 词法分析

  1. 将源代码的字符流转变为标记集合(Token)。
  2. 单个字符是编码的最小元素,标记是编译时的最小元素。关键字、变量名、字面量、运算符都可以作为标记
  3. 因此:词法分析就是将源代码拆解关键字 。源代码->关键词集合
int a = 100 这句代码包含4个标记,分别是int、a、=、100,虽然关键字int由3个字符构成,但是它是一个独立的标记,不可拆分

3.1.2 语法分析

  1. 根据标记序列构造抽象语法树(AST)
  2. 每一个节点代表代码中的一个语法结构,例如包、类型、修饰符、运算符、接口、返回值
  3. 源代码->关键词集合->语法树

注意:生成语法树以后,编译器后续的操作都是基于语法树,不再操作源码

AST View 插件生成抽象语法树:

上图看着复杂,换个图
ps:我没分析javac源代码,借用网图:java编译器源码解析-语法分析(1)

3.1.3 填充符号表

先理解符号概念,参考:java编译器源码解析-语义分析-填充符号表

一、 符号是什么?

  1. java声明一个类,类中有属性和方法,计算机识别为符号;
  2. 符号有名称,如:类名、方法名、属性名;
  3. 符号有类型,如:int a=0;a是一个变量,但编译器认为a是一个VarSymbol,它的类型是JCPrimitiveType

二、符号表什么时候生成? 生成语法树之后

三、符号地址代表什么? 内存地址,在目标代码生成阶段,会对符号名进行地址分配

四、符号内容有什么? 地址、内容

五、填充前后有什么变化? 在语法树的基础上进一步完善信息


填充符号表

  1. 生成一组符号地址符号信息构成的数据结构(类比哈希表中键值对)

3.2 注解处理

插入式注解处理器,编译期间处理注解,读取,修改,删除语法树中的任意元素,编译器会根据修改与否,重新回到解析及符号表填充阶段进行处理。

Lombok:基于插入式注解处理器实现的插件,修改语法树元素
CheckStyle、FindBug、Klocwork:遍历和分析语法树,分析代码质量

3.3 语义分析

对语法树进行逻辑验证

3.3.1 标注检查

变量是否先声明后使用、变量类型与值对否匹配

常量折叠:“a=1+2”优化为“a=3”

3.3.2 数据及控制流分析

检验:局部变量先赋值后使用、方法的每条路径是否都有返回值

跟类加载时的校验过程类似

3.3.3 解语法糖

java虚拟机不支持泛型、装箱、拆箱、变长参数等语法
解语法糖:编译阶段还原到基础语法结构

3.4 生成字节码

将语法树、符号表转化成字节码指令,生成.class文件
将实例构造器()方法和类构造器()方法添加到语法树中

4 总结

Javac编译过程各节点及说明:

Javac编译过程中的主体代码及其功能:

有关13 Javac将源码编译为字节码的过程的更多相关文章

  1. Ruby - 如何将消息长度表示为 2 个二进制字节 - 2

    我正在使用Ruby,我正在与一个网络端点通信,该端点在发送消息本身之前需要格式化“header”。header中的第一个字段必须是消息长度,它被定义为网络字节顺序中的2二进制字节消息长度。比如我的消息长度是1024。如何将1024表示为二进制双字节? 最佳答案 Ruby(以及Perl和Python等)中字节整理的标准工具是pack和unpack。ruby的packisinArray.您的长度应该是两个字节长,并且按网络字节顺序排列,这听起来像是n格式说明符的工作:n|Integer|16-bitunsigned,network(bi

  2. UE4 源码阅读:从引擎启动到Receive Begin Play - 2

    一、引擎主循环UE版本:4.27一、引擎主循环的位置:Launch.cpp:GuardedMain函数二、、GuardedMain函数执行逻辑:1、EnginePreInit:加载大多数模块int32ErrorLevel=EnginePreInit(CmdLine);PreInit模块加载顺序:模块加载过程:(1)注册模块中定义的UObject,同时为每个类构造一个类默认对象(CDO,记录类的默认状态,作为模板用于子类实例创建)(2)调用模块的StartUpModule方法2、FEngineLoop::Init()1、检查Engine的配置文件找出使用了哪一个GameEngine类(UGame

  3. ruby - 安装libv8(3.11.8.13)出错,Bundler无法继续 - 2

    运行bundleinstall后出现此错误:Gem::Package::FormatError:nometadatafoundin/Users/jeanosorio/.rvm/gems/ruby-1.9.3-p286/cache/libv8-3.11.8.13-x86_64-darwin-12.gemAnerroroccurredwhileinstallinglibv8(3.11.8.13),andBundlercannotcontinue.Makesurethat`geminstalllibv8-v'3.11.8.13'`succeedsbeforebundling.我试试gemin

  4. ruby-on-rails - gem install rmagick -v 2.13.1 错误 Failed to build gem native extension on Mac OS 10.9.1 - 2

    我已经通过提供MagickWand.h的路径尝试了一切,我安装了命令工具。谁能帮帮我?$geminstallrmagick-v2.13.1Buildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingrmagick:ERROR:Failedtobuildgemnativeextension./Users/ghazanfarali/.rvm/rubies/ruby-1.8.7-p357/bin/rubyextconf.rbcheckingforRubyversion>=1.8.5...yescheckingfor/

  5. ruby - Sinatra:哈希的未定义方法字节大小 - 2

    很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visitthehelpcenter.关闭9年前。我正在创建一个Sinatra应用程序,它采用上传的CSV文件并将其内容放入哈希中。当我像这样在我的app.rb中引用这个散列时:hash=extract_values(path_to_filename)我不断收到此错误消息:undefinedmethod`bytesize'forHash:0x007fc5e28f2b90#object_idfile:utils.rblocation:bytesiz

  6. ruby - Ruby 中的 block 和过程 - 2

    我已经开始学习Ruby,我已经阅读了一些教程,甚至还买了一本书(“ProgrammingRuby1.9-ThePragmaticProgrammers'Guide”),我遇到了一些以前从未见过的新东西使用我知道的任何其他语言(我是一名PHP网络开发人员)。block和过程。我想我明白它们是什么,但我不明白的是为什么它们如此伟大,以及我应该在何时何地使用它们。我到处都看到他们说block和过程是Ruby中的一个很棒的特性,但我不理解它们。这里有人能给像我这样的Ruby新手一些解释吗? 最佳答案 block有很多好处。电梯演讲:bloc

  7. elasticsearch源码关于TransportSearchAction【阶段三】 - 2

    1.回顾.TransportServicepublicclassTransportServiceextendsAbstractLifecycleComponentTransportService:方法:1publicfinalTextendsTransportResponse>voidsendRequest(finalTransport.Connectionconnection,finalStringaction,finalTransportRequestrequest,finalTransportRequestOptionsoptions,TransportResponseHandlerT>

  8. (附源码)vue3.0+.NET6实现聊天室(实时聊天SignalR) - 2

    参考文章搭建文章gitte源码在线体验可以注册两个号来测试演示图:一.整体介绍  介绍SignalR一种通讯模型Hub(中心模型,或者叫集线器模型),调用这个模型写好的方法,去发送消息。  内容有:    ①:Hub模型的方法介绍    ②:服务器端代码介绍    ③:前端vue3安装并调用后端方法    ④:聊天室样例整体流程:1、进入网站->调用连接SignalR的方法2、与好友发送消息->调用SignalR的自定义方法 前端通过,signalR内置方法.invoke()  去请求接口3、监听接受方法(渲染消息)通过new signalR.HubConnectionBuilder().on

  9. ruby-on-rails - Rails 中 View 的解析过程 - 2

    rails中View的解析过程是怎样的?我对View中erb标记中原始html与ruby​​代码的解析顺序部分感兴趣。我认为这是View代码被解析并最终发送给请求者的顺序:Controller调用ViewView代码从上到下解析当Rails在解析过程中遇到erb标记时:rails解析它并将结果附加到解析的html(这包括erb标签引用助手)一旦整个View被解析,整体结果将发送给请求者这似乎并非如此。看来View代码会扫描任何erb片段并首先解析那些片段(包括对助手的引用)。之后,rails然后从上到下解析所有View代码并将结果发送给请求者。以这个View为例:#_form.html

  10. ruby-on-rails - Heroku 错误 H13 - 2

    自从我将我的应用程序部署到heroku以来,在过去的几天里,我一直在断断续续地收到这个错误。它发生在我开始使用unicorn作为服务器之前和之后。有时我可以通过使用herokurunrakedb:migrate然后herokurestart让它恢复运行,但这只修复了几个小时,它又坏了。至于网页,它说“应用程序错误”。日志不是很有用,但每次发生此错误时都会显示以下内容:[2014-10-27T21:13:31.675956#2]ERROR--:worker=1PID:8timeout(16s>15s),killing[2014-10-27T21:13:31.731646#14]INFO-

随机推荐