혹시 이런 경험 있으신가요?
“한글이 깨져서 ▯▯ 이런 이상한 글자가 보여요!”
“영문은 잘 보이는데, 갑자기 문자들이 물음표(?)로 바뀌었어요!”
사실 이건 ‘문자 인코딩’ 문제 때문이에요.
그중에서도 가장 오래된 인코딩 방식인 아스키코드(ASCII),
그리고 전 세계 거의 모든 문자를 다룰 수 있는 유니코드(Unicode)가 있어요.
이 두 가지의 차이를 아주 쉽게 알려드릴게요!
목차
🧠 컴퓨터는 문자를 숫자로 기억해요!
컴퓨터는 우리가 보는 ‘글자’를 직접 이해하지 못해요.
대신, 글자를 숫자로 바꿔서 기억해요.
그리고 이 숫자를 어떤 규칙에 따라 저장하고,
다시 꺼낼 때 원래의 글자로 바꾸는 방식을
문자 인코딩(Character Encoding)이라고 해요.
그런 문자 인코딩 방식 중에서
가장 널리 알려진 두 가지가 바로
아스키코드(ASCII)와 유니코드(Unicode)랍니다!
🔡 아스키코드란?
아스키코드(ASCII: American Standard Code for Information Interchange)는
영어 알파벳, 숫자, 기호만 표현할 수 있어요.
1960년대에 미국에서 만들어졌고, 가장 오래된 문자 인코딩 방식이에요.
✅ 특징
7비트(0부터 127까지 총 128개 문자만 표현 가능)
영어권에서는 충분했지만, 한글, 일본어, 중국어 등은 표현할 수 없어요.
💡 예시

| 자연어(문자) | 아스키코드(10진수) | 기계어(2진수) |
|---|---|---|
| A | 65 | 01000001 |
| a | 97 | 01100001 |
| 0 | 48 | 00110000 |
| (스페이스) | 32 | 00100000 |
💡 아날로그 세계의 글자를 디지털 숫자로 바꾼다고 생각하면 돼요!
🧩 확장 아스키
기본 아스키코드의 한계인 7비트(128개 문자)를 넘어서기 위해,
8비트(1바이트)를 모두 활용하는 방식으로 확장한 것이 ‘확장 아스키’예요.
8비트로 확장해, 남는 1비트(128~255 영역)에
한글 등 다른 언어나 특수 문자를 끼워 넣었어요.
| 구분 | 범위 | 설명 |
|---|---|---|
| 기본 아스키 | 0~127 | 영어, 숫자, 기호 등 |
| 확장 영역 | 128~255 | 한글, 일본어 등 다른 언어, 특수문자 |
🔧 단점도 있어요!
| 문제점 | 설명 |
|---|---|
| ❌ 표준이 없음 | 같은 숫자(예: 130)가 시스템마다 다른 문자로 해석됨 |
| ❌ 문자 종류 한정 | 언어마다 버전이 달라서 통합 불가능 |
| ❌ 호환성 문제 | 파일을 옮기면 글자가 깨지는 현상 발생 |
🌍 유니코드란?
유니코드(Unicode)는 전 세계 모든 문자를 표현할 수 있게 만든 통합 문자 인코딩 시스템이에요.
(대표적으로 UTF-8)
1990년대부터 사용되기 시작했고,
한글, 일본어, 이모지, 중국어, 아랍어 등 거의 모든 문자를 표현할 수 있어요!
✅ 특징
1, 2, 3, 4바이트 다양하게 사용
한글도 OK! 이모지도 OK! 😊
현재 기준 14만 개 이상의 문자를 표현할 수 있어요.
💡 예시
| 문자 | 유니코드 값 (16진수) |
|---|---|
| 가 | U+AC00 |
| 나 | U+B098 |
| 😊 | U+1F60A |
| A | U+0041 |
🚀 유니코드의 활약

지금은 스마트폰에서 💬 이모지 쓰고, 한국어/영어/일본어 다 섞어 쓰죠?
예: “안녕! 😄 Hello! こんにちは!”
이렇게 다양한 언어와 기호, 이모지를 한 문장에 쓸 수 있는 건 유니코드 덕분이에요.
📌 유튜브 댓글, 블로그 글, 카카오톡 대화창 등
전부 유니코드를 기반으로 한 시스템이에요!
❓ 자주 묻는 질문 (Q&A)
Q1. “UTF-8″은 뭐예요?
UTF-8은 유니코드를 표현하는 방식 중 하나예요.
정식 명칭은 Unicode Transformation Format – 8bit, 그래서 줄여서 UTF-8이라고 부른답니다!
영어는 1바이트, 한글이나 이모지는 2~4바이트로 표현해서,
필요한 만큼만 공간을 쓰는 점이 참 효율적이에요!
또한 아스키코드와 완벽하게 호환되기 때문에 기존 시스템과 충돌 없이 사용할 수 있고,
범용성이 뛰어나서 웹에서는 사실상 표준처럼 사용되고 있어요.
Q2. 아직도 아스키코드를 쓰는 곳이 있나요?
일부 단순한 시스템(예: 센서 장치, 마이크로컨트롤러)은 처리 속도가 중요해서
구조가 단순하고 가볍게 동작하는 아스키코드가 더 효율적일 수 있어요.
👋 마무리 한마디
컴퓨터는 숫자만 읽을 수 있기 때문에, “문자를 숫자로 표현하는 약속”이 꼭 필요했어요.
그 첫걸음이 ASCII, 전 세계를 아우른 발전형이 Unicode!
우리가 쓰는 ‘가나다’부터 😊 같은 이모지까지,
모두 숫자로 변환되어 저장되고 있다는 사실, 놀랍지 않나요? 😊