Кодирование (декодирование) текстовой информации
Кодирование — отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов. Код (от французского слова code — кодекс, свод законов) — правило по которому выполняется кодирование. Мас — кодировка в ПК фирмы Apple, работающих под управлением операционной системы Mac OS. КОИ-7, КОИ-8 — кодирование русских букв и символов (семи-, восьмибитное кодирование… Читать ещё >
Кодирование (декодирование) текстовой информации (реферат, курсовая, диплом, контрольная)
Методические рекомендации:
В задачах такого типа используются понятия:
Кодирование — отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов.
Код (от французского слова code — кодекс, свод законов) — правило по которому выполняется кодирование.
Кодовая таблица (или кодовая страница) — таблица, устанавливающая соответствие между символами алфавита и двоичными числами.
Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович):
· КОИ-7, КОИ-8 — кодирование русских букв и символов (семи-, восьмибитное кодирование).
Рис. 1 Кодировка КОИ 8-Р
- 1) #154 — неразрывный пробел.
- · ASCII — American Standard Code for Information Interchange (американский стандарт кодов для обмена информацией) — это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 — национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).
Рис. 2. Международная кодировка ASCII
- 1) #32 — пробел.
- · Unicode — стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские). C его помощью можно закодировать не 256, а 65 536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.
- · СР 1251 — наиболее распространенной в настоящее время является кодировка Microsoft Windows, («CP» означает «Code Page», «кодовая страница»).
Рис. 3. Кодировка CP1251
- 1) #160 неразрывный пробел,
- 2) #173 мягкий перенос.
- · СР 866 — кодировка под MS DOS
Рис. 4. Кодировка СР 866
- 1) #255 неразрывный пробел.
- · Мас — кодировка в ПК фирмы Apple, работающих под управлением операционной системы Mac OS.
Рис. 5. Кодировка Mac
- 1) #202 неразрывный пробел.
- · ISO 8859−5 -Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.
Рис. 6. Кодировка ISO 8859−5
- 1) Коды 128−159 не используются;
- 2) #160 неразрывный пробел,
- 3) #173 мягкий перенос.
Используем кодировочные таблицы.