인코딩과 문자 집합/KS X 1001

위키책, 위키책

KS X 1001은 대한민국에서 사용되는 문자 집합으로, x2121 - x7E7E 영역에서 8,836문자가 있으며, 특수 문자, 괘선 조각, 숫자, 한글 낱자, 한글 글자 마디, 한자, 기본 로마 문자, 확장 로마 문자, 그리스 문자, 가나 문자, 키릴 문자가 포함되어 있다. 한글의 문자수는 2350자이다. 특수 문자 영역은 개정판마다 계속 추가되고 있다. KS X 1001:1998에서는 ®('등록 상표' 줄임표), €(유로 기호)가, KS X 1001:2002에서는 ㉾('우편 번호' 줄임표, U+327E[1])가 추가되었다.

전반적으로 매우 비판받고 있으며, 어처구니 없는 실수로 2004년 개정에서, 유니코드에 없는 문자를 컴퓨터 조판 과정에서 잘못된 문자로 인쇄하는 오류도 있었다.

문제점[+/-]

받침 없는 문자[+/-]

한글 글자 마디 가운데 5개 문자(뢨, 썅, 쏀, 쓩, 쭁)는 입력과정에서 필요한 받침없는 문자가 없다.

한글 확장[+/-]

2350자 이외의 한글 처리방법이 규정은 되어 있지만 불편하며, 지원이 안되고 있다.

한자[+/-]

한글 독음이 다르고 모습이 같은 한자가 중복되어 있다. 이로인해 유니코드에서도 이러한 문자가 한중일 호환용한자에 추가되었다.

특수 문자[+/-]

2-38의 점무늬 사각형표의 경우 유니코드에 등재되어 있지 않은데, 많은 매핑 테이블은 이 문자의 의미를 곡해하여, U+2592의 Medium Shade에 잘못 매핑하고 있다., 이로인해 2004년 개정에서 조판과정의 실수로 잘못된 모양을 규격으로 출력하는 일도 생겼다. 우편번호 줄임표와 달리 유니코드에 등재하려는 노력도 안하고 있다.

이외에도 역슬래시와 원화기호가 따로 들어가지 않았다.

이외에도 한글이 지나치게 적다는 비판이 있다. 하얗다의 활용인 하얬다, 아뢨다등은 표준어인데도 등재되지 않은 글자가 포함되어 입력이 불가능하다.

주석[+/-]

  1. 유니코드에서는 이후에 추가됨