Кодовая страница
Кодовая страница (англ. code page) — это компьютерная кодировка символов, в которой каждый символ кодируется одним байтом. Байт, как правило, состоит из 8 битов, поэтому кодовая страница содержит не более 256 символов, чем обусловлена невозможность представления многоязычных текстов посредством какой-либо одной 8-битной кодовой страницы. Кроме того, часть символов используется как управляющие, из-за чего число печатных символов в кодовой странице редко превышает 223.

Исторически термин code page был введён корпорацией IBM; сменные кодовые страницы использовались для поддержки различных языков с алфавитными системами письма. В последнее время наблюдается путаница между термином «кодовая страница» и более общими понятиями набора и кодировки символов.
Кодовые страницы сегодня
В настоящее время в основном используются кодовые страницы двух типов: совместимые с ASCII и совместимые с EBCDIC, с подавляющим преобладанием первых. В ASCII-совместимых кодовых страницах (так называемом [англ.]) нижняя половина кодовой таблицы (128 позиций 0x00—0x7F), как правило, полностью совпадает с ASCII, а верхняя половина (128 позиций 0x80—0xFF) используется для различных символов, не входящих в ASCII.
Для кодирования текстов на русском языке (то есть букв кириллицы) наиболее широко применяются следующие кодовые страницы:
- Windows-1251 — в операционных системах Windows;
- Варианты альтернативной кодировки — в операционных системах DOS, а также в консоли Windows (см. ниже);
- Семейство кодировок КОИ-8 — в Unix-подобных операционных системах (при ручной настройке пользователем);
- MacCyrillic — на компьютерах Macintosh.
Использование различных кодовых страниц создаёт много неудобств как для пользователей, так и для программистов. Например, при попытке прочесть текстовый файл, используя кодовую страницу, несовместимую с той, в которой он был создан, получается нечитаемый текст (так называемые [англ.]). В последние годы широкое распространение получил Юникод как альтернатива традиционным кодовым страницам.
В системе Microsoft Windows
В системах Microsoft Windows кодовые страницы являются важным компонентом локализации и определяются в ветви реестра HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage.
Исторически (в системах Windows 3.x и Windows 9x) имелось два типа кодовых страниц:
- Кодовые страницы ANSI (англ. ANSI code page, ключ реестра:
ACP), также называемые Windows — «родные» кодовые страницы Windows. Содержат много символов типографики, но почти не содержат псевдографику по причине того, что предназначены для использования в графическом окружении. Впоследствии корпорация Microsoft признала, что название ANSI было использовано по недоразумению. К кодовым страницам ANSI относят, в частности, Windows-1252 и вышеупомянутую Windows-1251. Также к данному типу относят кодировки, некоторые кодовые позиции которых требуют второй (завершающий) байт для формирования символа, то есть использующие двухбайтовое представление некоторых символов, хотя они, строго говоря, являются кодировками с переменной длиной символа.
- Кодовые страницы OEM (англ. OEM code page, ключ реестра:
OEMCP) основаны на CP437 и содержат VGA-совместимую псевдографику. К кодовым страницам OEM относят, в частности, CP866 — используемый в Windows вариант вышеупомянутой альтернативной кодировки.
Начиная с Windows NT появился третий тип кодовых страниц — Macintosh (англ. Macintosh code page, ключ реестра: MACCP), совместимые с системой MacOS.
Примечания
Комментарии
- Одним из немногих исключений является кодировка VISCII?! для вьетнамской латиницы, совместимая с ASCII за вычетом шести управляющих символов, заменённых на буквы (см. RFC 1456), и содержащая, таким образом, 229 печатных символов.
- Кодировки на базе EBCDIC (например, ДКОИ) используются только на некоторых мэйнфреймах.
- Ключ, расположенный в вышеупомянутой ветви реестра и определяющий, какая из кодовых страниц данного типа используется системой.
Источники
- REG: CurrentControlSet, PART 1 (англ.). Дата обращения: 2 марта 2010. Архивировано из оригинала 17 июня 2014 года.
- Code Pages (англ.). Дата обращения: 2 марта 2010. Архивировано 20 мая 2016 года.
- Code Pages (англ.). Дата обращения: 2 марта 2010. Архивировано из оригинала 7 марта 2016 года.
- MSDN Glossary of Terms (англ.). Дата обращения: 2 марта 2010. Архивировано из оригинала 8 декабря 2018 года.
- Code Pages Supported by Windows (англ.). Дата обращения: 2 марта 2010. Архивировано из оригинала 22 июля 2016 года.
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Кодовая страница, Что такое Кодовая страница? Что означает Кодовая страница?
Kodovaya stranica angl code page eto kompyuternaya kodirovka simvolov v kotoroj kazhdyj simvol kodiruetsya odnim bajtom Bajt kak pravilo sostoit iz 8 bitov poetomu kodovaya stranica soderzhit ne bolee 256 simvolov chem obuslovlena nevozmozhnost predstavleniya mnogoyazychnyh tekstov posredstvom kakoj libo odnoj 8 bitnoj kodovoj stranicy Krome togo chast simvolov ispolzuetsya kak upravlyayushie iz za chego chislo pechatnyh simvolov v kodovoj stranice redko prevyshaet 223 Kodovaya stranica CP866 Istoricheski termin code page byl vvedyon korporaciej IBM smennye kodovye stranicy ispolzovalis dlya podderzhki razlichnyh yazykov s alfavitnymi sistemami pisma V poslednee vremya nablyudaetsya putanica mezhdu terminom kodovaya stranica i bolee obshimi ponyatiyami nabora i kodirovki simvolov Kodovye stranicy segodnyaV nastoyashee vremya v osnovnom ispolzuyutsya kodovye stranicy dvuh tipov sovmestimye s ASCII i sovmestimye s EBCDIC s podavlyayushim preobladaniem pervyh V ASCII sovmestimyh kodovyh stranicah tak nazyvaemom angl nizhnyaya polovina kodovoj tablicy 128 pozicij a href wiki D0 A8 D0 B5 D1 81 D1 82 D0 BD D0 B0 D0 B4 D1 86 D0 B0 D1 82 D0 B5 D1 80 D0 B8 D1 87 D0 BD D0 B0 D1 8F D1 81 D0 B8 D1 81 D1 82 D0 B5 D0 BC D0 B0 D1 81 D1 87 D0 B8 D1 81 D0 BB D0 B5 D0 BD D0 B8 D1 8F title Shestnadcaterichnaya sistema schisleniya 0x a 00 a href wiki D0 A8 D0 B5 D1 81 D1 82 D0 BD D0 B0 D0 B4 D1 86 D0 B0 D1 82 D0 B5 D1 80 D0 B8 D1 87 D0 BD D0 B0 D1 8F D1 81 D0 B8 D1 81 D1 82 D0 B5 D0 BC D0 B0 D1 81 D1 87 D0 B8 D1 81 D0 BB D0 B5 D0 BD D0 B8 D1 8F title Shestnadcaterichnaya sistema schisleniya 0x a 7F kak pravilo polnostyu sovpadaet s ASCII a verhnyaya polovina 128 pozicij a href wiki D0 A8 D0 B5 D1 81 D1 82 D0 BD D0 B0 D0 B4 D1 86 D0 B0 D1 82 D0 B5 D1 80 D0 B8 D1 87 D0 BD D0 B0 D1 8F D1 81 D0 B8 D1 81 D1 82 D0 B5 D0 BC D0 B0 D1 81 D1 87 D0 B8 D1 81 D0 BB D0 B5 D0 BD D0 B8 D1 8F title Shestnadcaterichnaya sistema schisleniya 0x a 80 a href wiki D0 A8 D0 B5 D1 81 D1 82 D0 BD D0 B0 D0 B4 D1 86 D0 B0 D1 82 D0 B5 D1 80 D0 B8 D1 87 D0 BD D0 B0 D1 8F D1 81 D0 B8 D1 81 D1 82 D0 B5 D0 BC D0 B0 D1 81 D1 87 D0 B8 D1 81 D0 BB D0 B5 D0 BD D0 B8 D1 8F title Shestnadcaterichnaya sistema schisleniya 0x a FF ispolzuetsya dlya razlichnyh simvolov ne vhodyashih v ASCII Dlya kodirovaniya tekstov na russkom yazyke to est bukv kirillicy naibolee shiroko primenyayutsya sleduyushie kodovye stranicy Windows 1251 v operacionnyh sistemah Windows Varianty alternativnoj kodirovki v operacionnyh sistemah DOS a takzhe v konsoli Windows sm nizhe Semejstvo kodirovok KOI 8 v Unix podobnyh operacionnyh sistemah pri ruchnoj nastrojke polzovatelem MacCyrillic na kompyuterah Macintosh Ispolzovanie razlichnyh kodovyh stranic sozdayot mnogo neudobstv kak dlya polzovatelej tak i dlya programmistov Naprimer pri popytke prochest tekstovyj fajl ispolzuya kodovuyu stranicu nesovmestimuyu s toj v kotoroj on byl sozdan poluchaetsya nechitaemyj tekst tak nazyvaemye angl V poslednie gody shirokoe rasprostranenie poluchil Yunikod kak alternativa tradicionnym kodovym stranicam V sisteme Microsoft WindowsV sistemah Microsoft Windows kodovye stranicy yavlyayutsya vazhnym komponentom lokalizacii i opredelyayutsya v vetvi reestra HKEY LOCAL MACHINE SYSTEM CurrentControlSet Control Nls CodePage Istoricheski v sistemah Windows 3 x i Windows 9x imelos dva tipa kodovyh stranic Kodovye stranicy ANSI angl ANSI code page klyuch reestra ACP takzhe nazyvaemye Windows rodnye kodovye stranicy Windows Soderzhat mnogo simvolov tipografiki no pochti ne soderzhat psevdografiku po prichine togo chto prednaznacheny dlya ispolzovaniya v graficheskom okruzhenii Vposledstvii korporaciya Microsoft priznala chto nazvanie ANSI bylo ispolzovano po nedorazumeniyu K kodovym stranicam ANSI otnosyat v chastnosti Windows 1252 i vysheupomyanutuyu Windows 1251 Takzhe k dannomu tipu otnosyat kodirovki nekotorye kodovye pozicii kotoryh trebuyut vtoroj zavershayushij bajt dlya formirovaniya simvola to est ispolzuyushie dvuhbajtovoe predstavlenie nekotoryh simvolov hotya oni strogo govorya yavlyayutsya kodirovkami s peremennoj dlinoj simvola Kodovye stranicy OEM angl OEM code page klyuch reestra OEMCP osnovany na CP437 i soderzhat VGA sovmestimuyu psevdografiku K kodovym stranicam OEM otnosyat v chastnosti CP866 ispolzuemyj v Windows variant vysheupomyanutoj alternativnoj kodirovki Nachinaya s Windows NT poyavilsya tretij tip kodovyh stranic Macintosh angl Macintosh code page klyuch reestra MACCP sovmestimye s sistemoj MacOS PrimechaniyaKommentarii Odnim iz nemnogih isklyuchenij yavlyaetsya kodirovka VISCII dlya vetnamskoj latinicy sovmestimaya s ASCII za vychetom shesti upravlyayushih simvolov zamenyonnyh na bukvy sm RFC 1456 i soderzhashaya takim obrazom 229 pechatnyh simvolov Kodirovki na baze EBCDIC naprimer DKOI ispolzuyutsya tolko na nekotoryh mejnfrejmah Klyuch raspolozhennyj v vysheupomyanutoj vetvi reestra i opredelyayushij kakaya iz kodovyh stranic dannogo tipa ispolzuetsya sistemoj Istochniki REG CurrentControlSet PART 1 angl Data obrasheniya 2 marta 2010 Arhivirovano iz originala 17 iyunya 2014 goda Code Pages angl Data obrasheniya 2 marta 2010 Arhivirovano 20 maya 2016 goda Code Pages angl Data obrasheniya 2 marta 2010 Arhivirovano iz originala 7 marta 2016 goda MSDN Glossary of Terms angl Data obrasheniya 2 marta 2010 Arhivirovano iz originala 8 dekabrya 2018 goda Code Pages Supported by Windows angl Data obrasheniya 2 marta 2010 Arhivirovano iz originala 22 iyulya 2016 goda
