電腦文字編碼發展史
重要里程碑
| 年份 | 事件 | 重要性 |
|---|---|---|
| 1946 | ENIAC | 第一台電子計算機 |
| 1951 | UNIVAC I | 第一台商用電腦 |
| 1971 | Intel 4004 | 第一顆微處理器 |
| 1981 | IBM PC | 個人電腦標準 |
| 1984 | Macintosh | 圖形使用者介面普及 |
| 1991 | World Wide Web | 網際網路革命 |
ASCII 編碼 (1967)
ASCII = American Standard Code for Information Interchange
設計理念
- 英文字母只有 26 個,加上大小寫、符號、數字
- 在 1 byte (8 bits) 中,可以用的綽綽有餘
- 使用 7 bits 編碼:
0000 0000到0111 1111 - 總共可表示 2^7 = 128 個字符
編碼範圍
0 ~ 127 (十進位)
0000 0000 ~ 0111 1111 (二進位)
特點
- 簡單高效
- 適合英文環境
- 向下相容性好
UTF-8 編碼 (1992)
背景
1983 年左右,網路開始盛行,網頁上需要支援多國語言內容。兩位程式設計師「肯·湯普遜」和「羅布·派克」提出了 Unicode 標準。
問題與挑戰
- Unicode 問題:從 1 byte 擴展到 4 bytes
- 記憶體浪費:英文系國家只用到前面 1 byte,後面 3 bytes 被浪費
- 向下相容性:需要與現有的 ASCII 系統相容