Java 에서 Hello World 를 출력하기까지 1
프로그래밍 세계에서는 항상 Hello World
라는 문장을 출력하면서 시작한다. 그게 국룰 암묵적인 규칙이다.
# hello.py
print("Hello World")
python hello.py
// Hello World
Python? 훌륭하다.
// hello.js
console.log("Hello World");
node hello.js
// Hello World
JavaScript? 나쁘지 않다.
public class VerboseLanguage {
public static void main(String[] args) {
System.out.println("Hello World");
}
}
javac VerboseLanguage.java
java VerboseLanguage
// Hello World
그런데 Java 는 마치 다른 세계에서 온 것 같다. class 이름과 파일 이름이 같아야 하는 점은 아직 언급도 안했다.
public
은 무엇이고 class
는 무엇이고, static
은 또 무엇이며, void
, main
, String[]
, System.out.println
을 거쳐야 드디어 "Hello World" 라는 문자열에 도달한다. 이제 다른 언어를 배우러 가자.1
단순한 "Hello World" 를 출력하는 것임에 도 Java 는 꽤 많은 배경 지식을 요구한다. Java 는 도대체 왜 이리 말 많은(verbose) 과정이 필요할까?
이번 시리즈는 3개의 챕터로 구성되어 있다. 목표는 "Hello World" 라는 2단어를 출력하기 위해 뒤에서는 무슨 일이 일어나는지 자세하게 살펴보는 것이다. 구체적인 챕터의 내용은 아래와 같다.
- 첫 번째 챕터에서는 의문의 시작이 되는 Hello World 를 살펴보면서 간단하게 이유를 소개한다.
- 두 번째 챕터에서는 실제로 컴파일된 class 파일을 살펴보며 컴퓨터가 java 코드를 어떻게 해석하고 실행하는지 살펴본다.
- 마지막으로
public static void main
을 JVM 이 어떻게 메모리에 어떻게 적재하고 실행할 수 있는지 그 동작 원리에 대해 살펴본다.
3개의 챕터 내용을 조합하면 그제서야 "Hello World" 에 대해 그림이 그려진다. 꽤 긴 여정이니, 호흡을 가다듬고 출발해보자.
Chapter 1. Why?
Java 에서 Hello World 를 출력하기 전까지 살펴봐야할 몇가지 why moment 가 있다.
왜 클래스 이름이 파일명이 되어야 하는가?
정확하게는 public
클래스의 이름이 파일명이어야 하는 것이다. 왜 그럴까?
Java 로 된 프로그램은 기본적으로 컴퓨터가 해석할 수 없다. JVM 이라는 가상 머신이 컴퓨터가 프로그램을 실행할 수 있도록 도와준다. 자바 프로그램을 컴퓨터가 실행할 수 있도록 하려면 몇 가지 과정을 통해 기계어로 변환해주어야 하는데, 그 시작이 컴파일러를 사용해 JVM 이 해석할 수 있는 바이트코드로 변환하는 것이다. 변환된 바이트코드는 JVM 내부에 존재하는 인터프리터(interpreter) 를 거쳐서 기계어로 변환되고, 실행된다.
우선 컴파일 과정을 간단하게 살펴보자.
public class Outer {
public static void main(String[] args) {
System.out.println("This is Outer class");
}
private class Inner {
}
}
javac Outer.java
Permissions Size User Date Modified Name
.rw-r--r-- 302 haril 30 Nov 16:09 Outer$Inner.class
.rw-r--r-- 503 haril 30 Nov 16:09 Outer.class
.rw-r--r-- 159 haril 30 Nov 16:09 Outer.java
위처럼 Java 는 컴파일 시점에 모든 class 를 .class
파일로 생성한다.
이제 JVM 은 프로그램의 실행을 위해 main
메서드를 찾아야 한다. 어디에 main
메서드가 있는지 어떻게 알 수 있을까?
왜 하필 main
을 찾아야하냐고? 조금만 기다려주시라.
Java 파일 이름이 public class 와 동일하지 않다면 Java interpreter 는 모든 class 파일을 읽어서 main
메서드를 찾아야 한다. 파일 이름과 public class 의 이름이 같다면 Java interpreter 는 해석해야하는 파일을 더 잘 식별할 수 있다.
Java1000
이라는 파일이 있고, 이 파일 내부에 1000개의 클래스가 존재한다고 생각해보자. 1000 개의 클래스 중 어디에 main()
이 있는지 식별하기 위해서는 모든 클래스 파일을 살펴봐야 한다.
하지만 파일 이름 과 public class 이름이 같다면 main()
에 더 빠르게 접근할 수 있고(main
은 public class 에 존재하므로), 모든 로직이 main()
에서부터 시작하기 때문에 쉽게 다른 클래스로 접근할 수 있다.
왜 public 이어야 할까?
JVM 은 클래스 안에 존재하는 main
메서드를 찾아야 한다. 클래스 외부에서 접근하는 JVM 이 클래스 내부의 메서드를 찾아야한다면 그 메서드는 public
이어야 할 것이다. 실제로 접근제어자를 private
으로 바꾸면 main
을 public
으로 선언하라는 에러 메세지가 출력된다.
Error: Main method not found in class VerboseLanguage, please define the main method as:
public static void main(String[] args)
왜 static 이어야 할까?
public main()
이라는 메서드는 찾았다. 하지만 이 메서드를 호출시키기 위해서는 먼저 객체를 생성해야 한다. JVM 입장에서 이 객체는 필요한 객체일까? 아니다, main
을 호출할 수 있기만 하면 된다. static
으로 선언함으로서 JVM 은 불필요한 객체를 생성할 필요가 없고, 메모리를 절약할 수 있다.
왜 void 여야 할까?
main
메서드의 종료는 Java 의 실행종료를 의미한다. JVM 은 main
메서드의 반환값으로 아무 것도 할 수 없으며, 따라서 반환값의 존재가 무의미하다. 그렇다면 void
로 선언하는게 자연스러울 것이다.
왜 main 이어야 할까?
main
이라는 메서드 이름은 JVM 이 애플리케이션을 실행하기 위해 찾는 진입점으로 설계되어 있다.
설계라는 거창한 표현을 썼지만, 실제로는 main 이라는 method 를 찾도록 하드코딩 되어 있을 뿐이다. OpenJDK 8 의 java.c
를 살펴보면 C 언어로 작성된 아래 코드를 발견할 수 있다.
mainClassName = GetMainClassName(env, jarfile);
mainClass = LoadClass(env, classname);
// main 메소드의 아이디를 찾는다.
mainID = (*env)->GetStaticMethodID(env, mainClass, "main", "([Ljava/lang/String;)V");
jbject obj = (*env)->ToReflectedMethod(env, mainClass, mainID, JNI_TRUE);
찾아야 하는 이름이 main 이 아니라 haril 이였다면, haril 이라는 메서드를 찾았을 것이다. 물론 Java 창시자 입장에서는 main 이라는 단어를 선택한 이유가 있겠지만, 단지 그 뿐이다.
args 의 존재 이유?
지금까지 생략하여 표현했지만, main()
에는 String[] args
라는 arguments 를 명시해야 한다. 이 인자(arguments)는 명령행 인자(command-line arguments)라고 한다. 왜 문자열 배열로 선언되어 있고 명시하지 않으면 에러가 발생할까?
public static void main(String[] args)
이 자바 애플리케이션의 실행지점인 이상, 이 인자는 반드시 자바 외부에서 들어오게 된다.
표준 입력 을 통해 입력하는 모든 타입은 문자열로 입력된다.
이것이 args 가 문자열 배열로 선언된 이유이다. 생각해보면 당연하다. 자바 애플리케이션이 실행되지도 않았는데, 직접 정의한 객체 타입을 생성할 수 있을까? 🤔
그럼 왜 args 가 있어야할까?
args 들을 단순한 방식으로 외부에서 내부로 넘겨줌으로써 자바 애플리케이션의 동작 방식을 바꿔줄 수 있고, 이런 메커니즘은 C 프로그램의 초창기부터 프로그램의 동작을 제어하기 위해 널리 쓰이던 방식이였다. 특히 간단하게 구현된 애플리케이션은 이 방법이 매우 효과적이다. Java 는 단순히 널리 쓰이던 방식을 채택했을 뿐이다.
String[] args
를 생략할 수 없는 이유는 Java 의 진입 지점으로 public static void main(String[] args)
단 하나만 허용되기 때문이다. Java 의 창시자들은 사용하지 않는 args 를 생략할 수 있게 하는 것보다 선언하고 사용하지 않는 방식이 덜 헷갈린다고 생각했던 것 같다.
System.out.println
드디어 출력과 관련된 메서드에 대해 이야기를 시작할 수 있다.
굳이 다시 언급하자면, Python 은 print("Hello World")
였다.2
자바 프로그램은 OS 에서 바로 실행되는 것이 아니라 JVM 이라는 가상 머신 위에서 실행된다. 이 점은 JVM 을 사용하는 언어라면 OS 에 상관없이 어디서나 애플리케이션을 실행할 수 있다는 장점이 된 다.
동시에 OS 가 제공하는 특정 기능을 JVM 에서 사용하기 어렵다는 단점이 된다. Java 로 CLI 를 만들거나 OS 메트릭을 수집하는 등의 시스템 레벨의 코딩이 어렵다고 하는 이유가 이 때문이다.
하지만 제한적이나마 OS 기능을 빌려쓸 수 있는데(JNI), 이 기능을 제공하는 것이 바로 System
이다. 대표적인 기능은 아래와 같은 것들이 있다.
- 표준 입력
- 표준 출력
- 환경변수 설정
- 수행 중인 응용프로그램 종료하고 status 코드를 반환
Hello World
를 출력하기 위해 System
의 표준 출력 기능을 빌려 사용하는 것이다.
실제로 System.out.println
의 흐름을 따라가다보면 native
키워드가 달려있는 writeBytes
메서드를 만나게 되는데, 이 메서드 이후 C언어로 작성된 코드에 동작이 위임되며 표준 출력으로 넘어가게 된다.
// FileOutputStream.java
private native void writeBytes(byte b[], int off, int len, boolean append)
throws IOException;
native 키워드가 붙은 메서드의 호출은 Java Native Interface(JNI) 를 통해 동작한다. 이에 대해서는 이후 챕터에서 다룬다.
String
Java 에서 문자열은 조금 특별하다. 아니, 많이 특별한 것 같다3. 메모리 레벨에서 별도의 공간을 할당 받을 정도니 분명히 특별취급을 받고 있다. 왜 그럴까?
문자열은 아래 속성을 가지고 있다는 점에 주목할 필요가 있다.
- 크기가 매우 커질 수 있다.
- 비교적 재사용 빈도가 높다.
따라서 문자열은 한 번 생성한 이후 어떻게 재사용할 것인가에 주안점을 두고 설계되어 있다. 크기가 큰 문자열 데이터를 어떻게 관리하는지에 대해 완벽하게 이해하기 위해서는 이후 챕터에서 다룰 내용에 대한 이해가 필요하다. 지금은 간단하게 메모리 공간 절약의 관점에서만 짚고 넘어가보자.
먼저 자바에서 문자열을 선언하는 방식에 대해 살펴보자.
String greeting = "Hello World";
내부적으로는 아래처럼 동작한다.
문자열은 String Constant Pool 이라는 곳에 생성되며, 불변 속성을 지니고 있다. 한 번 생성된 문자열은 변하지 않으며, 이 후 문자열을 생성하려고 할 때 같은 문자열이 Constant Pool 에 있다면 재활용하게 된다.
JVM Stack, Frame, Heap 에 관해서는 다음 챕터에서 다룬다
문자열을 선언하는 또 다른 방법은, 인스턴스화 하는 방식이다.
String greeting = new String("Hello World");
일반적으로 이 방법은 거의 사용되지 않는다. 내부 동작에 차이가 있기 때문인데 아래와 같다.
new 키워드 없이 문자열을 직접 사용했을 때에는 String Constant Pool 에 생성되어 재사용이 가능했다. 하지만 new 키워드를 통해 인스턴스화하면 Constant Pool 에 생성되지 않는다. 이 말은 같은 문자열을 몇 번이고 생성할 수 있다는 뜻이고, 메모리 공간을 쉽게 낭비하게 될 수 있다.
정리
이번 챕터를 통해 다음과 같은 질문에 대답해봤다.
- 왜
.java
파일과 class 이름이 같아야할까? - 왜
public static void main(String[] args)
이어야 할까? - 출력 동작의 흐름
- 문자열의 특징과 생성 및 사용 기초 원리
다음 챕터에서는 자바를 직접 컴파일해보며 바이트코드가 어떤 식으로 생성되고 메모리 영역과 어떤 상관이 있는지를 다뤄본다.
Reference
- OpenJDK java.c
- OpenJDK
- https://www.geeksforgeeks.org/java-main-method-public-static-void-main-string-args/
- https://www.geeksforgeeks.org/myth-file-name-class-name-java/
- https://www.includehelp.com/java/why-does-java-file-name-must-be-same-as-public-class-name.aspx
- https://www.devkuma.com/docs/java/system-class/
- Inpa blog
- https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-2.html#jvms-2.5
- https://www.baeldung.com/java-jvm-run-time-data-areas
- https://sgcomputer.tistory.com/64
- https://johngrib.github.io/wiki/java/run-time-constant-pool/
- https://johngrib.github.io/wiki/jvm-stack/
- https://code-run.tistory.com/8
- https://www.baeldung.com/java-command-line-arguments