10. 텍스트의 표현 방법
1) 텍스트의 개요
텍스트의 정의는 심리학 정보통신 문학 경제 사회학 등 텍스트를 어떤 관점에서
이해하느냐에 따라 제각각 다르다.
멀티미디어에서의 텍스트 : 사람이 이해할 수 있게 인공적으로 만든 2차원 형태의 미디어.
문자, 기호, 단어, 구, 문장, 다이어그램(Diagram), 도표, 인터넷 주소 등과 같이 문자의 배열 형태로 나타남
단순한 기호들의 집합은 텍스트가 아니다.
텍스트는 기호들을 선택하고 배열하는 규칙이 있어야 한다 이 . 규칙을 ‘코드’ 라고 한다.
멀티미디어의 텍스트의 특징
멀티미디어 데이터 중 가장 많이 사용되며 가장 수월하게 조작할 수 있는 데이터
다른 종류의 멀티미디어 데이터보다 기억 용량을 적게 차지함
사용하는 언어에 제한을 받는다는 특징이 있음
플레인 텍스트(Plain Text)
일반 텍스트라고도 하며 그래픽 표현이나 그림 등이 포함되지 않고 오로지 읽을 수
있는 자료의 문자열만을 포함하고 있는 데이터를 일컫는다.
플레인 텍스트는 컴퓨터 프로그래밍에서 언어의 지시를 담고 있는 소스 코드 파일로 사용된다.
주석 파일 , txt . 등이 있다
플레인 텍스트를 작성할 수 있는 대표적 문서 편집기는 윈도우의 ‘메모장’(Notepad) 이다
2) 텍스트의 디지털 표현 방법
(1) 코드 시스템
컴퓨터에서 문자를 표현하기 위해 일정한 규칙에 따라 이진코드를 각 문자에 할당해 놓은 것.
텍스트는 컴퓨터 내부에서는 이진코드로 Encoding 인코딩 되어 처리된다
다시 이진코드를 화면에 출력하기 위해서는 ‘복호화 되어 ’ 본래의 문자나 기호로 변환된다.
코드 시스템은 언어에 따라 다르게 표현되며 알파벳은 8 (1 ) 비트 바이트 코드를 사용
하고 한자는 16 (2 ) . 비트 바이트 코드를 사용한다
한글은 2 , 2 , n , 3 ,7 바이트 완성형 바이트 조합형 바이트형 바이트형 비트 조합형 등
다양하다.
2 95 바이트 조합형은 한글윈도 운영체제에서 더 이상 조합형을 지원하지 않아 사용
되지 않고 있다.
2 KS X 1001 EUC-KR . 바이트 완성형으로 현재 과 이 표준으로 사용되고 있다
(2) 표준 코드 시스템
컴퓨터에서 텍스트 데이터를 처리하고 정보 시스템 상호간의 정보 교환용으로 사용
하도록 정한 표준 코드로는 아스키 코드 유니코드 , EBDIC, . 등이 있다
아스키 코드(ASCII, American Standard Code for Information Interchange
Code)
1962 ANSI - American National Standards Institute ( ) 년에 미국 규격 협회 가 정의
한 미국 표준 정보 교환 코드로 1967 ISO( ) 년에 국제표준화기구 에 의해 국제표준
으로 제정되었다.
아스키코드의 사용으로 컴퓨터의 다양한 환경에서도 정보 호환성이 좋아지고 시스
템 통신이 단순화되었다.
7 2 7 128 비트 이진수 조합으로 표현할 수 있는 문자의 수는 의 제곱으로 총 자를
표현한다.
컴퓨터 환경은 8 1 (Parity) 비트용이라 비트는 패리티 비트로 오류 검출용으로 사용된다.
(ASCII ) 코드표
- 패리티 비트
텍스트를 전송할 때 에러를 검출하기 위해 패리티 비트를 사용한다.
패리티 비트는 짝수 패리티와 홀수 패리티가 있다.
문자 데이터에 포함되는 논리 "1"의 수를 세어서 그 합이 짝수인지 홀수인지에 따
라 패리티 비트의 값을 결정하는 방법이다.
다만 오류는 , . 검출할 수 있으나 오류 수정은 할 수가 없다
짝수 패리티를 사용하면,
0101001 -à 01010011
홀수 패리티를 사용하면,
0101001 -à 01010010
EBCDIC (Extended Binary Coded Decimal Interchange Code)
확장 이진화 십진법 교환 부호 (‘앱시딕’으로 읽는다)
IBM 1963 8 . 에서 년에 개발한 비트 인코딩 방식을 사용한다
8 4 Zone , 4 Digit . 비트는 비트는 비트 비트는 비트로 구분되어 사용되었다
1 바이트로 영자(A ~ Z) 숫자0 ~9) 특수기호 등 총 256종의 문자를 표현할 수
있다.
유니코드(Unicode)
유니코드는 전 세계의 모든 문자를 컴퓨터에서 2바이트로 일관되게 표현하고 다룰
수 있도록 설계된 산업 표준으로 1993 ISO . 년에 의 표준이 되었다
기존의 아스키코드로 나라마다 다른 독특한 문자들을 다 표현할 수가 없었다.
인터넷에서 정보가 서로 호환되도록 통합된 코드체계로 개발되었다.
유니코드는 사용중인 운영체제 프로그램 언어에 , , 관계없이 문자마다 고유한 코드
값을 제공하는 새로운 개념의 코드
모든 문자를 1비트로 표현하여 최대 16 65,536자를 표현할 수 있다.
‘ ’ 한 의 유니코드는 D55C이고 ‘ ’ ‘ 글 의 유니코드는 AE00’ 이다.
'멀티미디어 개론' 카테고리의 다른 글
멀티미디어학과, 콘텐츠 제작 등 필수 멀티미디어개론 요점 정리 12. 텍스트의 저장 방식 (52) | 2023.05.25 |
---|---|
멀티미디어학과, 콘텐츠 제작 등 필수 멀티미디어개론 요점 정리 11. 폰트의 종류 (23) | 2023.05.24 |
멀티미디어학과, 콘텐츠 제작 등 필수 멀티미디어개론 요점 정리 9. 멀티미디어 시스템 소프트웨어 (0) | 2023.05.23 |
멀티미디어학과, 콘텐츠 제작 등 필수 멀티미디어개론 요점 정리 8. 멀티미디어 입출력장치 (1) | 2023.05.23 |
멀티미디어학과, 콘텐츠 제작 등 필수 멀티미디어개론 요점 정리 7. 컴퓨터 보조기억장치 (1) | 2023.05.22 |