인코딩과 문자 집합/유니코드: 두 판 사이의 차이

위키책, 위키책
내용 삭제됨 내용 추가됨
16번째 줄: 16번째 줄:
** U+002A: ASTERISK
** U+002A: ASTERISK
** U+002B: PLUS SIGN
** U+002B: PLUS SIGN
** U+002C: COMMA
* 0080~00FF: Latin-1 Supplement
* 0080~00FF: Latin-1 Supplement
* 0100~017F: Latin Extended-A
* 0100~017F: Latin Extended-A

2022년 11월 22일 (화) 10:04 버전

유니코드는 이세상의 모든 문자 집합을 통합하기 위해 만들어진 문자 집합이다.

유니코드의 처음 256자는 ISO/IEC 8859과 동일하며, 이후의 문자들은 규칙에 따라 배정되어 있다.

유니코드 문자 영역

  • 0000~007F: Basic Latin
    • U+0021: EXCLAMATION MARK
    • U+0022: QUOTATION MARK
    • U+0023: NUMBER SIGN
    • U+0024: DOLLAR SIGN
    • U+0025: PERCENT SIGN
    • U+0026: AMPERSAND
    • U+0027: APOSTROPHE
    • U+0028: LEFT PARENTHESIS
    • U+0029: RIGHT PARENTHESIS
    • U+002A: ASTERISK
    • U+002B: PLUS SIGN
    • U+002C: COMMA
  • 0080~00FF: Latin-1 Supplement
  • 0100~017F: Latin Extended-A
  • 0180~024F: Latin Extended-B
  • 0250~02AF: IPA Extensions

0000~00FF까지는 ISO/IEC 8859와 동일하다.