Фотогалерея

Кодировки символов

Кодировки символов

Говоря о кодировках в целом, прежде всего нужно отметить самое основное. Современные компьютеры используют технологию двоичной системы исчисления. Общий объем информации при таком раскладе получается 8 бит. Для сохранения на компьютере текстовой информации, необходимо определиться с тем, какими байтами информация о символах будет закодирована. Именно эта взаимосвязь символов и кодирующих их байтов, называется кодировкой символов. Разумеется, любая кодировка создается для определенного языка, вернее его письменности, соответственно число возможных придуманных вариантов кодировок ничем не ограничено. Поскольку человек всегда склонен придумывать что-то новое, то естественно число кодировок на сегодняшний день придумано более чем достаточно. На сегодняшний день придумано более ста семидесяти разных кодировок.

В нашей стране чаще всего используются два вида кодировок - это латиница и кириллица. Основные кодировки присущие латинице - это ASCII и EBCDIC. ASCII для кодирования информации использует семь бит. Она часто применяется в веб-технологиях. EBCDIC для кодирования использует восемь бит, она является стандартной для компьютеров IBM.

В кириллице информация кодируется с помощью восьми битовой таблицы символов. Один байт здесь равняется одному символу. Благодаря продуманному подходу к созданию кириллических кодировок, информация написанная на латинице так же будет отображаться на компьютере. В сети очень часто используется кириллическая кодировка Windows 1251. Это происходит потому, что большинство компьютеров работают под операционной системой Windows, а она в свою очередь использует эту кодировку для создания текстовых документов содержащую информацию на кириллице. Однако на данный момент самой распространенной кодировкой является UTF-8.