dae66d46

Кодовая страница


Таблица, содержащая набор символов для поддержки одного или нескольких национальных языков. Многие операционные системы для персональных компьютеров поддерживают одновременно несколько кодовых страниц и позволяют переключаться между ними.

Когда вы нажимаете клавишу на клавиатуре (букву, цифру или знак), компьютер принимает числовой код, соответствующий нажатой клавише. Эти числовые коды хранятся в кодовых таблицах.

Кодовая страница, использующая однобайтные коды, может содержать до 256 кодов для представления прописных и строчных букв, цифр, знаков пунктуации и математических символов, изображенных на клавиатуре.

Однако, 256 кодов символов не хватает для представления всех букв и символов, которые используются в разных языках. Алфавиты некоторых романских языков, наряду с обычными символами, содержат символы с диакритическими знаками.

Так, общая кодовая страница (кодовая страница 437) может использоваться для нескольких языков романской группы, включая английский, французский, немецкий. Португальский язык, например, требует использования другого набора символов. Кодовая страница 860 (португальский язык) вместо символа Ј (фунт стерлингов) содержит символ У (О со штрихом).

Языки других групп, такие как китайский, японский, корейский, содержат совершенно другой набор символов. Наборы этих языков содержат тысячи символов и требуют использования двухбайтной кодовой страницы.

Различия между любыми двумя однобайтными кодовыми страницами могут вызвать затруднения при отображении и прочтении символов. Различие между однобайтными и двухбайтными кодовыми страницами вызывают такие проблемы практически всегда.

Для решения этих проблем были приняты следующие шаги:

  • Для романских языков используется общая кодовая страница 850, содержащая большинство символов.
    Этот набор не содержит некоторых символов псевдографики, а некоторые символы имеют нестандартные коды.
  • Был принят стандарт Unicode*, позволяющий использовать 64000 символов.
    Unicode обеспечивает достаточное количество кодов для поддержки романских языков, китайского и прочих языков.


Неважно, используете ли вы общую кодовую страницу или Unicode, при выводе на экран нераспознанные символы заменяются: в DOS на символ "сердечко", а в MS Windows на "квадратик".

Измененные символы могут помешать распознанию объектов в NDS. Например, вы создаете объект контейнера Подразделение, представляющий денежный знак в Восточной Европе, и используете кодовую страницу 852 для вставки в имя объекта общего символа валюты (OU=¤W-Euro).

При попытке обращения к этому объекту из кодовой страницы 437 происходит замена неподдерживаемого символа валюты (¤), и новое имя посылается в NDS. NDS не распознает новое имя и возвращает отказ в доступе, так что объект не может быть открыт - потенциально серьезная проблема.

Единственным решением этой проблемы может быть определение кодовой страницы, использованной при создании объекта и просмотр объекта с помощью этой кодовой страницы. Определение правильной кодовой страницы может занять значительное время.

См. также: .


Содержание раздела