문자 인코딩(Encoding)이란?
문자 인코딩?
컴퓨터는 정보들을 0과 1로 이루어진 바이너리로 정보들을 저장한다.
사람이 입력한 문자를 컴퓨터가 알아볼 수 있도록 바이너리로 바꿔주는 것을 문자 인코딩이라고 한다.
└바이너리 : 0과 1로 이루어진 이진법을 의미
사람이 입력 한 것은 어떻게 화면에 보여지게 되는지?
사람이 문자를 입력하면 바이너리로 변환하여 컴퓨터에 저장하고(인코딩),
화면에 보여줄 때는 문자열 세트에 있는 이진법에 해당하는 글자를 찾아 텍스트를 보여주는 방식(디코딩).
유니코드의 배경
문자열 세트는 여러가지가 있다. 7비트만 사용하는 ASCII와 ASCII에서 8비트로 확장한 ANSI코드 등 여러가지 문자열 세트가 있는데,
└컴퓨터의 기본 저장 단위는 1바이트(8비트)인데, 아스키 코드에서 1비트는 통신 에러 검출을 위해 사용되기 때문에 7비트만 활용된다.
그 중 가장 초창기에 미국에서 만든 ASCII 라는 문자열 세트는 알파벳과 숫자 등만 들어있기 때문에 한글이나 다른 문자는 표현할 수 없음.
그래서 여러 나라에서 서로의 문자를 표현할 수 있는 문자열 세트를 만들다 보니 서로 통신할때 문자열 세트와 인코딩 방식이 안맞기 때문에 글자가 깨지는 현상이 나타나게 되었음.
이 이슈를 해결하기 위해 유니코드라는 문자열 세트가 만들어졌는데.
여러 나라의 모든 문자들을 하나의 문자열 세트에 통일을 했기 때문에 유니코드에 맞는 인코딩 방식인 UTF-8 등을 사용해서 컴퓨터에 바이너리를 저장하면 그에 맞는 통일된 문자열 세트에 맞는 사용자에게 텍스트를 보여주게 되었다.
인코딩 방식이란 ?
사용자가 입력한 문자를 바이너리 신호로 반환하여 컴퓨터에 저장할 때 몇 비트를 사용할 것인지, 몇 바이트를 사용할 것인지 정한 것을 인코딩 방식이라고 한다.