Вернуться   Компьютерный форум > Блоги > Базаров
Оценить эту запись

Настройка на особенности различных стран

Запись от Базаров размещена 23.02.2014 в 03:24

(Информация датирована 1996 г.)
Кодировки символов

Компьютеры могут обрабатывать только информацию, представленную в числовой форме. При вводе документов, текстов программ и т.д. (например, вводе с клавиатуры) вводимые символы кодируются определенными числами, а при выводе их для чтения человеком (на монитор, принтер и т.д.) по каждому числу (коду символа) строится изображение символа. Соответствие между набором символов и их кодами называется кодировкой символов.
Как правило, код символа хранится в одном байте, поэтому коды символов могут принимать значения от 0 до 255. Такие кодировки называются однобайтными, они позволяют использовать до 256 различных символов. Впрочем, в настоящее время все большее распространение приобретает двухбайтная кодировка Unicode, в ней коды символов могут принимать значения от 0 до 65535. В этой кодировке (ее поддерживает, например, ОС Windows NT) имеются номера для практически всех применяемых символов (букв алфавитов разных языков, математических, декоративных символов и т.д.).
Кодировка IBM
При разработке IBM PC фирма IBM заложила в эти компьютеры (точнее, в знакогенераторы видеоконтроллеров) кодировку символов, показанную на рисунке.



Например, при выводе на экран символа с кодом 74 на экране изображалась буква J, при выводе символа с кодом 171 - дробь ½ и т.д. Разумеется, производители принтеров и других устройств также стали следовать предложенной фирмой IBM кодировке, так что она стала фактическим стандартом.
В кодировке IBM символы с кодами 32-127 соответствовали общеупотребительной кодировке ASCII, содержащей латинские буквы, знаки препинания, скобки, специальные знаки и пробел. А на позиции 128-255 и 0-31 фирма IBM поместила символы западноевропейских алфавитов, символы псевдографики, позволяющие рисовать на экране рамки и диаграммы, некоторые греческие буквы и специальные символы.
Настройка компьютера на особенности страны
Хотя фирма IBM и предусмотрела в своей кодировке символов символы основных западноевропейских алфавитов (немецкого, французского, испанского и др.), данные символы надо было еще уметь вводить с клавиатуры - ведь на стандартной "американской" клавиатуре этих символов не было. Поэтому для этих стран были разработаны специальные клавиатуры с дополнительной клавишей AltGr и специальные драйверы, позволяющие вводить различные специфические символы типа Ö, Ü, ç или Ñ нажатиями комбинаций типа AltGr+обычная клавиша.
Хуже дело обстояло в тех странах, для которых нужных символов в кодировке IBM не оказалось. Так дело обстояло в Греции, Израиле, Скандинавии, арабских странах, восточноевропейских странах и т.д. Там программисты начали менять кодировку IBM, приспосабливая ее под свои нужды, и создавать резидентные программы и драйверы, позволяющие вводить необходимые символы с клавиатуры и загружать измененную кодировку в знакогенератор компьютера.
Кодировки, содержащие русские буквы
Именно таким образом дело обстояло и в России. Поскольку в кодировке IBM отсутствуют символы кириллицы (русские буквы), в нашей стране были созданы различные модификации таблицы кодов IBM, содержащие символы кириллицы. Некоторое время применялось несколько разных таблиц кодировок, что создавало значительные неудобства. Однако очень скоро подавляющим большинством пользователей стала применяться кодировка, показанная на рисунке - так называемая "модифицированная альтернативная кодировка ГОСТа".


В этой кодировке русские буквы расположены на тех позициях, где в кодировке IBM находятся относительно редко используемые символы национальных алфавитов и греческие буквы. А остальные символы (псевдографические символы и некоторые математические символы) имеют те же коды, что в кодировке символов IBM, что обезпечивает возможность использования зарубежных DOS-программ без изменений.
Замечания. 1. Кодировка, названная "основной кодировкой ГОСТа" навязывалась в начале и середине 80-х годов различными официальными органами (наверное из-за желания "пойти другим путем"), но она не прижилась: в ней символы кириллицы перекрывали диапазон псевдографических символов в кодировке IBM, что сильно мешало использовать зарубежные программы. Впрочем, было выпущено некоторое количество отечественных компьютеров (Искра, Нейрон и др.), в которой использовалась основная кодировка ГОСТа. Пользователи переделывали в них кодировку при первой возможности.
2. При стандартизации альтернативной кодировки ГОСТа (применение которой допускалось, но не поощрялось), также не обошлось без желания "пойти другим путем": в коды 242-249 были заложены ненужные или уже имеющиеся символы.


Поэтому в исходном виде альтернативная кодировка ГОСТа применяется крайне редко, а вместо этого обычно используется ее модифицированный вариант.
Поддержка национальных особенностей в MS DOS
Поскольку пользователи в разных странах были вынуждены адаптировать MS DOS к особенностям своей страны, фирма Microsoft решила упорядочить этот процесс и обезпечить для него стандартные средства. Для этого в MS DOS были введены:
  • команда Country файла CONFIG.SYS, позволяющая установить поддержку принятых в той или иной стране стандартов для отображения времени, даты, денежных сумм, перевода прописных букв в строчные и обратно и т.д.;
  • средства, позволяющие загружать различные кодировки символов (фирма Microsoft стала называть их кодовыми страницами) в знакогенератор компьютера и переключаться между этими кодировками;
  • средства, позволяющие использовать различные раскладки клавиатуры и переключаться между ними.
В версии 6.22 (в 1994 г.) в MS DOS наконец-то появились настройки и для России. Далее будет идти речь о том, какие команды надо внести в файлы CONFIG.SYS и AUTOEXEC.BAT для обезпечения поддержки русских букв.
Замечания. 1. К средствам национальной поддержки относятся драйвер DISPLAY.SYS, команды CHCP, NLSFUNC и специальные режимы команды MODE, драйвер клавиатуры KEYB, файлы с информацией о национальных стандартах (COUNTRY.SYS), шрифтах символов (EGA.CPI, EGA2.CPI, EGA3.CPI и т.д.), раскладках клавиатуры (KEYBOARD.SYS, KEYBRD2.SYS и т.д.). Мы не будем рассматривать все возможности этих средств, ограничившись применением их для России.
2. При создании кодовой страницы (ее номер - 866) для России фирма Microsoft в очередной раз поменяла многострадальные символы с кодами 242-255, поместив туда некоторые символы украинского и белорусского алфавита, а также знак номера.



3. В Windows и Windows 95 употребляются совершенно иные кодировки символов.
Размещено в Без категории
Просмотров 2865 Комментарии 0 Отправить другу ссылку на эту запись
Всего комментариев 0

Комментарии

 

Текущее время: 07:07. Часовой пояс GMT +4. Powered by vBulletin® Version 5.8.9
Copyright ©2000 - 2016, Jelsoft Enterprises Ltd.