프로그래밍/IT 이것저것

아스키 코드와 유니 코드 간단 요약

이자다 2023. 2. 13. 18:05
반응형

1. 아스키 코드

 

아스키 코드는 7비트 공간에 128개의 고유한 값을 기록한 코드다. 1비트는 '패리티 비트'라 해서 오류 검출용 비트로 사용하고 총 8비트짜리 코드다. 그리고 8비트는 1바이트다.

 

아스키 코드

위의 그림처럼 0부터 127번까지 총 128가지의 값으로 미국의 키보드에서 입력할 수 있는 값을 전부 담았다.

 

다만 단점이 있는데, 지나치게 미국 중심적이라 알파벳에 악센트를 사용하는 다른 서구권 국가들이나 아시아쪽 국가들은 이 아스키 코드로 언어를 표현하기 어렵다는 점이다.

 

그래서 나온 것이 '유니 코드'다.

 

 

 

2. 유니 코드

 

위에서 서술한 아스키 코드의 문제점을 해결하기 위해 비영어권 국가들의 언어를 표현하기 위해 '유니코드'가 만들어졌다.

 

유니코드의 목적은 현존하는 모든 문자 인코딩 방법을 유니코드로 교체하는 것이라 아프리카권을 포함한 전 세계의 문자뿐만이 아니라 이모티콘도 들어가게 되어 문자수가 10만이 넘어간다.

 

최신 버전인 유니코드 15.0의 문자 개수는 149,186개인걸 보면 얼마나 방대한 양인지 감이 잡힌다.

반응형