문자 인코딩에 대해서 알아보자
이글의 목적, 문자인코딩에 대해서 공부 및 정리후 공유한다.
문자인코딩에대해서 알아보자.
어플리케이션에 대한 지역화를 수행할 때 발생하는 전형적인 문제의 원인은 다양한 문자 집합을 고려해야 한다는 것.
대부분의 개발자들은 문자열을 0으로 끝나는 1byte 문자의 집합으로 생각하고 개발해옴.
여기서 문제가 발생하는데...
- 우리가 사용하는 많은 언어와 글쓰기 방법이 엄청나게 많은 문자들로 구성되어 있기때문에, 1byte 로 최대한 나타낼수 있는 256가지의 경우의 수를 초과한다는 것!
다시말해서, 1byte 는 충분하지 않다!
그래서, 언어와 글쓰기 방법을 지원하기 위해 DBCS(double-bytes character set) 가 만들어짐.
DBCS 를 이용하게 되면, 각각의 문자는 1byte or 2byte 가 될 수 있음.
그러나, DBCS 를 사용하는 것은 하나의 문자가 1byte or 2byte 넓이로 구성되어 있기때문에, 개발자에게는 악몽같은 일임. ㅡ,.ㅡ
그러나 광명이 있으니, 바로 윈도우 함수/C런타임 라이브러리 함수들이 유니코드를 지원하기 때문에, DBCS 는 잊어버려도 됨..^^;;
(...생략...)
자세한 내용은 아래 블로그에 정리해두었습니다.
혹시 이글이 도움이 되셨다면,
좋아요와 짧은 댓글 남겨주시고..
좋아요와 짧은 댓글은 제가 더 좋은 컨텐츠를 공유하는데 큰 힘이 됩니다.
항상 행복하시고, 오늘하루도 좋은 하루되시길 기원합니다.
(더욱 좋은 컨텐츠로 찾아뵙도록 노력하겠습니다.)
감사합니다.
로그인 후 댓글 쓰기가 가능합니다
쓰기