Кодировки UTF-8 и Windows 1251 — просто о сложном. Виндовс 1251


Таблица кодов символов Windows-1251

Windows-1251 — набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для всех русских версий Microsoft Windows. Данная кодировка пользуется довольно большой популярностью в восточно-европейских странах. Windows-1251 выгодно отличается от других 8-битных кириллических кодировок (таких как CP866, KOI8-R и ISO 8859-5) наличием практически всех символов, использующихся в традиционной русской типографике для обычного текста (отсутствует только знак ударения). Кириллические символы идут в алфавитном порядке.Windows-1251 также содержит все символы для близких к русскому языку языков: белорусского, украинского, сербского, македонского и болгарского.На практике этого оказалось достаточно, чтобы кодировка Windows-1251 закрепилась в интернете вплоть до распространения UTF-8.

Таблица кодов символов Windows-1251

DecHexСимвол DecHexСимвол
 
00000NOP  12880Ђ
00101SOH  12981Ѓ
00202STX  13082
00303ETX  13183ѓ
00404EOT  13284
00505ENQ  13385
00606ACK  13486
00707BEL  13587
00808BS  13688
00909TAB  13789
0100ALF  1388AЉ
0110BVT  1398B
0120CFF  1408CЊ
0130DCR  1418DЌ
0140ESO  1428EЋ
0150FSI  1438FЏ
01610DLE  14490ђ
01711DC1  14591
01812DC2  14692
01913DC3  14793
02014DC4  14894
02115NAK  14995
02216SYN  15096
02317ETB  15197
02418CAN  15298
02519EM  15399
0261ASUB  1549Aљ
0271BESC  1559B
0281CFS  1569Cњ
0291DGS  1579Dќ
0301ERS  1589Eћ
0311FUS  1599Fџ
03220SP  160A0 
03321!  161A1 Ў
03422"  162A2ў
03523#  163A3Ћ
03624$  164A4¤
03725%  165A5Ґ
03826&  166A6¦
03927'  167A7§
04028(  168A8Ё
04129)  169A9©
0422A*  170AAЄ
0432B+  171AB«
0442C,  172AC¬
0452D-  173AD­
0462E.  174AE®
0472F/  175AFЇ
048300  176B0°
049311  177B1±
050322  178B2І
051333  179B3і
052344  180B4ґ
053355  181B5µ
054366  182B6
055377  183B7·
056388  184B8ё
057399  185B9
0583A:  186BAє
0593B;  187BB»
0603C<  188BCј
0613D=  189BDЅ
0623E>  190BEѕ
0633F?  191BFї
06440@  192C0 А
06541 A  193C1 Б
06642B  194C2 В
06743C  195C3 Г
06844D  196C4 Д
06945E  197C5 Е
07046F  198C6 Ж
07147G  199C7 З
07248H  200C8 И
07349I  201C9 Й
0744AJ  202CA К
0754BK  203CB Л
0764CL  204CC М
0774DM  205CD Н
0784EN  206CE О
0794FO  207CF П
08050P  208D0 Р
08151Q  209D1 С
08252R  210D2 Т
08353S  211D3 У
08454T  212D4 Ф
08555U  213D5 Х
08656V  214D6 Ц
08757W  215D7 Ч
08858X  216D8 Ш
08959Y  217D9 Щ
0905AZ  218DA Ъ
0915B[  219DB Ы
0925C\  220DC Ь
0935D]  221DD Э
0945E^  222DE Ю
0955F_  223DF Я
09660`  224E0 а
09761a  225E1 б
09862b  226E2 в
09963c  227E3 г
10064d  228E4 д
10165e  229E5 е
10266f  230E6 ж
10367g  231E7 з
10468h  232E8 и
10569i  233E9 й
1066Aj  234EA к
1076Bk  235EB л
1086Cl  236EC м
1096Dm  237ED н
1106En  238EE о
1116Fo  239EF п
11270p  240F0 р
11371q  241F1 с
11472r  242F2 т
11573s  243F3 у
11674t  244F4 ф
11775u  245F5 х
11876v  246F6 ц
11977w  247F7 ч
12078x  248F8 ш
12179y  249F9 щ
1227Az  250FA ъ
1237B{  251FB ы
1247C|  252FC ь
1257D}  253FD э
1267E~  254FE ю
1277FDEL  255FF я

Описание специальных (управляющих) символов

Первоначально управляющие символы таблицы ASCII (диапазон 00-31, плюс 127) были разработаны для того, чтобы управлять устройствами аппаратных средств, таких как телетайп, ввод данных на перфоленту и др.Управляющие символы (кроме горизонтальной табуляции, перевода строки и возврата каретки) не используются в HTML-документах.

Cпециальные (управляющие) символы

КодОписание
NUL, 00Null, пустой
SOH, 01Start Of Heading, начало заголовка
STX, 02Start of TeXt, начало текста
ETX, 03End of TeXt, конец текста
EOT, 04End of Transmission, конец передачи
ENQ, 05Enquire. Прошу подтверждения
ACK, 06Acknowledgement. Подтверждаю
BEL, 07Bell, звонок
BS, 08Backspace, возврат на один символ назад
TAB, 09Tab, горизонтальная табуляция
LF, 0ALine Feed, перевод строкиСейчас в большинстве языков программирования обозначается как \n
VT, 0BVertical Tab, вертикальная табуляция
FF, 0CForm Feed, прогон страницы, новая страница
CR, 0DCarriage Return, возврат кареткиСейчас в большинстве языков программирования обозначается как \r
SO, 0EShift Out, изменить цвет красящей ленты в печатающем устройстве
SI, 0FShift In, вернуть цвет красящей ленты в печатающем устройстве обратно
DLE, 10Data Link Escape, переключение канала на передачу данных
DC1, 11 DC2, 12DC3, 13DC4, 14Device Control, символы управления устройствами
NAK, 15Negative Acknowledgment, не подтверждаю
SYN, 16Synchronization. Символ синхронизации
ETB, 17End of Text Block, конец текстового блока
CAN, 18Cancel, отмена переданного ранее
EM, 19End of Medium, конец носителя данных
SUB, 1ASubstitute, подставить. Ставится на месте символа, значение которого было потеряно или испорчено при передаче
ESC, 1BEscape Управляющая последовательность
FS, 1CFile Separator, разделитель файлов
GS, 1DGroup Separator, разделитель групп
RS, 1ERecord Separator, разделитель записей
US, 1FUnit Separator, разделитель юнитов
DEL, 7FDelete, стереть последний символ.

Смотрите также:

URL коды символов ACSII

URL коды символов UTF-8 диапазон от U+0400 до U+04FF

HTML Кодирование URL

Таблица кодов символов кирилицы UTF-8

Please enable JavaScript to view the comments powered by Disqus.

wm-school.ru

что это и как используется

Здравствуйте, уважаемые читатели моего блога. Сегодня мы поговорим с вами про кодировку. Если вы читали мою статью о том, как посмотреть код страницы в браузере, то знаете, что любой документ в интернете хранится не в том виде, в каком мы привыкли его видеть. Он записан при помощи непонятных человеку символов и знаков. С текстом все точно также.

Существует несколько кодировок, а потому, иногда увидев непонятные символы при открытии книги в мобильном приложении или запилив статью на сайт, вы, поменяв кое-какие значения в настройках, увидите привычный глазу алфавит.

Кодировка windows-1251 – что это такое, какое значение она имеет при создании сайта, какие символы будут доступны и является ли она лучшим решением на сегодняшний день? Обо всем этом в сегодняшней статье. Как всегда, простым языком, максимально понятно и с минимальным количеством терминов.

Немного теории

Любой документ на компьютере или в интернете, как я уже сказал, хранится в виде двоичного кода. К примеру, если вы используете кодировку ASCII, то буква «К» будет записана как 10001010, а windows 1251 под этим числом скрывается символ – Љ. В итоге, если браузер или программа обратится к другой таблице и считает вместо ASCII коды windows 1251, то читатель увидит совершенно непонятные ему символ.

Логичен вопрос, нафига было придумывать множество таблиц с кодами? Дело в том, что помимо русского алфавита существует еще и английский, немецкий, китайский. По некоторым подсчетам, существует около 200 000 символов. Хотя, я не очень доверяю этой статистике, вспоминая про японский.

Не забывайте, что для заглавной и строчной буквы нужно придумать свой код, есть запятые, тире и так далее.

Чем больше в таблице символов, тем длиннее код каждого из них, а значит и вес документа становится больше.

Представьте, если бы одна книга весила 4 Гб! Она бы очень долго загружалась, занимала все свободное место на компьютере. Решение о скачивании представлялось бы делом нелегким.

Если вспомнить о сайтах, то вообще страшно подумать, что бы произошло. Каждая страничка открывалась даже на скоростном оптоволокне по часу с лишним! Думаю, мобильные телефоны можно было бы смело выкидывать. Пользоваться ими на улице даже с 4G? Сомневаюсь.

По этим причинам каждый программист в свое время старался придумать свою таблицу символов. Чтобы было удобно для использования и вес сохранялся оптимальным.

Microsoft, к примеру, для русскоязычного сегмента создали windows-1251. В ней, конечно же, есть свои достоинства и недостатки. Как и у любого другого продукта.

Сейчас уже, лишь 2% всех страниц в интернете написано на 1251. Большинство веб-мастеров используют UTF-8. Почему так?

Недостатки и достоинства

UTF-8, в отличие от windows-1251 универсальная кодировка, в ней содержатся буквы различных алфавитов. Существует даже UTF-128, где есть вообще все языки – теулу, суахили, лаосский, мальтийский и так далее.

UTF-8 победнее, буквы занимают в разы меньше места и занимают всего один байт памяти, как и в 1251. В УТФ есть редкие символы из других языков или специальные символы. Они-то и весят по 5-6 байтов, но в документе используются крайне редко.

Эта кодировка более продумана, а потому ее использует большинство приложений по умолчанию. То есть, если вы не указываете программе, какую кодировку вы используете, то первым делом он проверит именно UTF-8 .

Когда вы создаете html документ для сайта, то указываете браузерам на какую таблицу им обращать внимание при расшифровке записей.

Для этого необходимо вставить в тег head следующие данные. После символов «charset=» идет либо утф, либо виндовс, как в примере ниже.

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">

Если в дальнейшем вы захотите что-то поменять и вставить фразу на албанском, используя эту таблицу расшифровок, то ничего не получится, ведь этого языка кодировка не поддерживает. UTF‑8 без проблем позволит вам это сделать.

Если вас заинтересовало правильное создание сайта, то я могу порекомендовать вам курс Михаила Русакова «Создание и Раскрутка сайта от А до Я».

Создание и раскрутка сайта от А до Я

Он содержит в себе очень много – 256 уроков, затрагивающих HTML, CSS, JavaScript, PHP, MySQL и XML. Помимо языков программирования вы сможете понять как монетизировать сайт, то есть скорее и больше получать прибыль. Один из немногих курсов, в котором было бы так подробно разъяснено все, что нужно.

Сам я вот уже год обучаюсь в школе блоггеров Александра Борисова. Это занимает в разы больше времени, конца и края пока не видно, но зато не менее исчерпывающе и дисциплинирует. Мотивирует продолжать разработку.

Ну а если возникают вопросы, не нужно искать по интернету. Всегда есть грамотный наставник.

Школа блоггеров Александра Борисова

Что-то я отошел от темы. Давайте вернемся к кодировкам.

Базы банных

Когда речь идет о php, все вообще страшно. Я уже рассказывал про базы данных, они используются для ускорения работы сайта. Обычно, вы к ним не обращаетесь, но когда появляется необходимость в переносе сайта становится не по себе.

Сложности случаются у всех, не важно какой у вас опыт работы, стаж и выслуга лет. Некоторые странички в базе могут содержать в себе все доступные символы для виндовс-1251, другие, к примеру, в шаблонах страниц, в другой кодировке.

Пока не нужен перенос все работает и функционирует, хоть и не совсем правильно. Но после переезда начинаются неприятности. В идеале вы должны использовать либо только УТФ, либо виндовс-1251, но по факту всегда и у всех случаются вот такие недочеты.

Чтобы расшифровка согласовалась необходимо вписать код mysql_query(«SET NAMES cp1251»). В этом случае преобразование будет осуществлять по другому протоколу – cp1251.

Htaccess

Если на сайте вы настойчиво решили использовать именно 1251, то вам следует найти или создать файл htaccess. Он отвечает за настройки конфигурации. В него придется добавить еще три строчки, чтобы все сошлось.

DefaultLanguage ru; AddDefaultCharset windows-1251; php_value default_charset "cp1251"

DefaultLanguage ru; AddDefaultCharset windows-1251; php_value default_charset "cp1251"

Я все же настоятельно рекомендую вам задумать о использовании UTF-8. Он более популярен, прост и богат. Какие бы решения вы не приняли сейчас, важно, чтобы впоследствии можно было все исправить. Добавить англоязычную версию сайта на этой кодировке будет в разы проще. Ничего не нужно исправлять.

Решение остается за вами. Подписывайтесь на рассылку, чтобы узнавать как можно быстрее создавать правильные сайты, где учиться, чтобы не повторять чужих ошибок, а также какие блоггеры получают больше посетителей.

До новых встреч и удачи в ваших начинаниях.

start-luck.ru

Windows 1251 - это... Что такое Windows 1251?

  • Windows-1251 — (a.k.a. code page CP1251) is a popular 8 bit character encoding, designed to cover languages that use the Cyrillic alphabet such as Russian, Bulgarian, Serbian Cyrillic and other languages. It is the most widely used for encoding the Bulgarian,… …   Wikipedia

  • Windows-1251 — набор символов и кодировка, являющаяся стандартной 8 битной кодировкой для всех русских версий Microsoft Windows. Пользуется довольно большой популярностью. Была создана на базе кодировок, использовавшихся в ранних «самопальных» русификаторах… …   Википедия

  • Windows-1251 — (a.k.a. CP1251) es un popular juego de caracteres de 8 bits, diseñado para cubrir lenguajes que usan el alfabeto cirilico como son el lenguaje Ruso y otros lenguajes. Este es la codifiación más ampliamente usada para codificar Búlgaro, Serbio y… …   Wikipedia Español

  • Windows-1251 — Windows Codepages 874  Thai 932  Japanisch 936  Vereinfachtes Chinesisch 949  Koreanisch 950  Traditionelles Chinesisch 1250  Mitteleuropäisch 1251  Kyrillisch 1252 …   Deutsch Wikipedia

  • Windows (значения) — Windows: Microsoft Windows  семейство проприетарных операционных систем корпорации Microsoft, ориентированных на применение графического интерфейса при управлении. Windows (клавиша)  клавиша на клавиатурах ПК совместимых компьютеров,… …   Википедия

  • Windows-1252 — ISO 8859 1 Latin 1, Westeuropäisch 2 Latin 2, Mitteleuropäisch 3 Latin 3, Südeuropäisch 4 Latin 4, Baltisch 5 Kyrillisch 6 Arabisch 7 Griechisch 8 …   Deutsch Wikipedia

  • Windows-1252 — ISO/IEC 8859 1 (также известная как ISO 8859 1 и Latin 1) кодовая страница, предназначенная для западноевропейских языков; она базируется на символьном наборе популярных в прошлом терминалов ISO 8859. ISO 8859 1 кодировка, зарегистрированная… …   Википедия

  • Windows code page — Windows code pages are sets of characters or code pages (known as character encodings in other operating systems) used in Microsoft Windows from the 1980s and 1990s. Windows code pages were gradually superseded when Unicode was implemented in… …   Wikipedia

  • Windows Glyph List 4 — (сокр. WGL4, также известен как Общеевропейский набор символов англ. Pan European character set) определённый компанией Майкрософт набор из 652 типографических символов Юникода, призванный помочь разработчикам шрифтов в обеспечении… …   Википедия

  • Windows-1254 — Windows 1254  кодовая страница, используемая Microsoft Windows для представления турецкого языка. Символы с кодами от A0 до FF совместимы с ISO 8859 9. Для современных приложений UTF 8 предпочтительней windows 1254. Таблица кодов Символы с… …   Википедия

  • dic.academic.ru

    Кодировка текста ASCII (Windows 1251, CP866, KOI8-R) и Юникод (UTF 8, 16, 32) — как исправить проблему с кракозябрами

    Обновлено: 13 сентября 2017

    Здравствуйте, уважаемые читатели блога KtoNaNovenkogo.ru. Сегодня мы поговорим с вами про то, откуда берутся кракозябры на сайте и в программах, какие кодировки текста существуют и какие из них следует использовать. Подробно рассмотрим историю их развития, начиная от базовой ASCII, а также ее расширенных версий CP866, KOI8-R, Windows 1251 и заканчивая современными кодировками консорциума Юникод UTF 16 и 8.

    Кодировки русского языка и проблема кракозябров

    Кому-то эти сведения могут показаться излишними, но знали бы вы, сколько мне приходит вопросов именно касаемо вылезших кракозябров (не читаемого набора символов). Теперь у меня будет возможность отсылать всех к тексту этой статьи и самостоятельно отыскивать свои косяки. Ну что же, приготовьтесь впитывать информацию и постарайтесь следить за ходом повествования.

    ASCII — базовая кодировка текста для латиницы

    Развитие кодировок текстов происходило одновременно с формированием отрасли IT, и они за это время успели претерпеть достаточно много изменений. Исторически все начиналось с довольно-таки не благозвучной в русском произношении EBCDIC, которая позволяла кодировать буквы латинского алфавита, арабские цифры и знаки пунктуации с управляющими символами.

    Но все же отправной точкой для развития современных кодировок текстов стоит считать знаменитую ASCII (American Standard Code for Information Interchange, которая по-русски обычно произносится как «аски»). Она описывает первые 128 символов из наиболее часто используемых англоязычными пользователями — латинские буквы, арабские цифры и знаки препинания.

    Еще в эти 128 знаков, описанных в ASCII, попадали некоторые служебные символы навроде скобок, решеток, звездочек и т.п. Собственно, вы сами можете увидеть их:

    Пример кодировки ASCII

    Именно эти 128 символов из первоначального вариант ASCII стали стандартом, и в любой другой кодировке вы их обязательно встретите и стоять они будут именно в таком порядке.

    Но дело в том, что с помощью одного байта информации можно закодировать не 128, а целых 256 различных значений (двойка в степени восемь равняется 256), поэтому вслед за базовой версией Аски появился целый ряд расширенных кодировок ASCII, в которых можно было кроме 128 основных знаков закодировать еще и символы национальной кодировки (например, русской).

    Тут, наверное, стоит еще немного сказать про системы счисления, которые используются при описании. Во-первых, как вы все знаете, компьютер работает только с числами в двоичной системе, а именно с нулями и единицами («булева алгебра», если кто проходил в институте или в школе). Один байт состоит из восьми бит, каждый из которых представляет из себя двойку в степени, начиная с нулевой, и до двойки в седьмой:

    Преобразование двоичных чисел в шестнадцатиричные при кодировании

    Не трудно понять, что всех возможных комбинаций нулей и единиц в такой конструкции может быть только 256. Переводить число из двоичной системы в десятичную довольно просто. Нужно просто сложить все степени двойки, над которыми стоят единички.

    В нашем примере это получается 1 (2 в степени ноль) плюс 8 (два в степени 3), плюс 32 (двойка в пятой степени), плюс 64 (в шестой), плюс 128 (в седьмой). Итого получает 233 в десятичной системе счисления. Как видите, все очень просто.

    Но если вы присмотритесь к таблице с символами ASCII, то увидите, что они представлены в шестнадцатеричной кодировке. Например, «звездочка» соответствует в Аски шестнадцатеричному числу 2A. Наверное, вам известно, что в шестнадцатеричной системе счисления используются кроме арабских цифр еще и латинские буквы от A (означает десять) до F (означает пятнадцать).

    Ну так вот, для перевода двоичного числа в шестнадцатеричное прибегают к следующему простому и наглядному способу. Каждый байт информации разбивают на две части по четыре бита, как показано на приведенном выше скриншоте. Т.о. в каждой половинке байта двоичным кодом можно закодировать только шестнадцать значений (два в четвертой степени), что можно легко представить шестнадцатеричным числом.

    Причем, в левой половине байта считать степени нужно будет опять начиная с нулевой, а не так, как показано на скриншоте. В результате, путем нехитрых вычислений, мы получим, что на скриншоте закодировано число E9. Надеюсь, что ход моих рассуждений и разгадка данного ребуса вам оказались понятны. Ну, а теперь продолжим, собственно, говорить про кодировки текста.

    Расширенные версии Аски — кодировки CP866 и KOI8-R с псевдографикой

    Итак, мы с вами начали говорить про ASCII, которая являлась как бы отправной точкой для развития всех современных кодировок (Windows 1251, юникод, UTF 8).

    Изначально в нее было заложено только 128 знаков латинского алфавита, арабских цифр и еще чего-то там, но в расширенной версии появилась возможность использовать все 256 значений, которые можно закодировать в одном байте информации. Т.е. появилась возможность добавить в Аски символы букв своего языка.

    Тут нужно будет еще раз отвлечься, чтобы пояснить — зачем вообще нужны кодировки текстов и почему это так важно. Символы на экране вашего компьютера формируются на основе двух вещей — наборов векторных форм (представлений) всевозможных знаков (они находятся в файлах со шрифтами, которые установлены на вашем компьютере) и кода, который позволяет выдернуть из этого набора векторных форм (файла шрифта) именно тот символ, который нужно будет вставить в нужное место.

    Понятно, что за сами векторные формы отвечают шрифты, а вот за кодирование отвечает операционная система и используемые в ней программы. Т.е. любой текст на вашем компьютере будет представлять собой набор байтов, в каждом из которых закодирован один единственный символ этого самого текста.

    Программа, отображающая этот текст на экране (текстовый редактор, браузер и т.п.), при разборе кода считывает кодировку очередного знака и ищет соответствующую ему векторную форму в нужном файле шрифта, который подключен для отображения данного текстового документа. Все просто и банально.

    Значит, чтобы закодировать любой нужный нам символ (например, из национального алфавита), должно быть выполнено два условия — векторная форма этого знака должна быть в используемом шрифте и этот символ можно было бы закодировать в расширенных кодировках ASCII в один байт. Поэтому таких вариантов существует целая куча. Только лишь для кодирования символов русского языка существует несколько разновидностей расширенной Аски.

    Например, изначально появилась CP866, в которой была возможность использовать символы русского алфавита и она являлась расширенной версией ASCII.

    Т.е. ее верхняя часть полностью совпадала с базовой версией Аски (128 символов латиницы, цифр и еще всякой лабуды), которая представлена на приведенном чуть выше скриншоте, а вот уже нижняя часть таблицы с кодировкой CP866 имела указанный на скриншоте чуть ниже вид и позволяла закодировать еще 128 знаков (русские буквы и всякая там псевдографика):

    Русская кодировка CP866

    Видите, в правом столбце цифры начинаются с 8, т.к. числа с 0 до 7 относятся к базовой части ASCII (см. первый скриншот). Т.о. русская буква «М» в CP866 будет иметь код 9С (она находится на пересечении соответствующих строки с 9 и столбца с цифрой С в шестнадцатеричной системе счисления), который можно записать в одном байте информации, и при наличии подходящего шрифта с русскими символами эта буква без проблем отобразится в тексте.

    Откуда взялось такое количество псевдографики в CP866? Тут все дело в том, что эта кодировка для русского текста разрабатывалась еще в те мохнатые года, когда не было такого распространения графических операционных систем как сейчас. А в Досе, и подобных ей текстовых операционках, псевдографика позволяла хоть как-то разнообразить оформление текстов и поэтому ею изобилует CP866 и все другие ее ровесницы из разряда расширенных версий Аски.

    CP866 распространяла компания IBM, но кроме этого для символов русского языка были разработаны еще ряд кодировок, например, к этому же типу (расширенных ASCII) можно отнести KOI8-R:

    Пример кодировки русского языка KOI8-R

    Принцип ее работы остался тот же самый, что и у описанной чуть ранее CP866 — каждый символ текста кодируется одним единственным байтом. На скриншоте показана вторая половина таблицы KOI8-R, т.к. первая половина полностью соответствует базовой Аски, которая показана на первом скриншоте в этой статье.

    Среди особенностей кодировки KOI8-R можно отметить то, что русские буквы в ее таблице идут не в алфавитном порядке, как это, например, сделали в CP866.

    Если посмотрите на самый первый скриншот (базовой части, которая входит во все расширенные кодировки), то заметите, что в KOI8-R русские буквы расположены в тех же ячейках таблицы, что и созвучные им буквы латинского алфавита из первой части таблицы. Это было сделано для удобства перехода с русских символов на латинские путем отбрасывания всего одного бита (два в седьмой степени или 128).

    Windows 1251 — современная версия ASCII и почему вылезают кракозябры

    Дальнейшее развитие кодировок текста было связано с тем, что набирали популярность графические операционные системы и необходимость использования псевдографики в них со временем пропала. В результате возникла целая группа, которая по своей сути по-прежнему являлись расширенными версиями Аски (один символ текста кодируется всего одним байтом информации), но уже без использования символов псевдографики.

    Они относились к так называемым ANSI кодировкам, которые были разработаны американским институтом стандартизации. В просторечии еще использовалось название кириллица для варианта с поддержкой русского языка. Примером такой может служить Windows 1251.

    Она выгодно отличалась от используемых ранее CP866 и KOI8-R тем, что место символов псевдографики в ней заняли недостающие символы русской типографики (окромя знака ударения), а также символы, используемые в близких к русскому славянских языках (украинскому, белорусскому и т.д.):

    Windows 1251

    Из-за такого обилия кодировок русского языка, у производителей шрифтов и производителей программного обеспечения постоянно возникала головная боль, а у нас с вам, уважаемые читатели, зачастую вылезали те самые пресловутые кракозябры, когда происходила путаница с используемой в тексте версией.

    Очень часто они вылезали при отправке и получении сообщений по электронной почте, что повлекло за собой создание очень сложных перекодировочных таблиц, которые, собственно, решить эту проблему в корне не смогли, и зачастую пользователи для переписки использовали транслит латинских букв, чтобы избежать пресловутых кракозябров при использовании русских кодировок подобных CP866, KOI8-R или Windows 1251.

    По сути, кракозябры, вылазящие вместо русского текста, были результатом некорректного использования кодировки данного языка, которая не соответствовала той, в которой было закодировано текстовое сообщение изначально.

    Допустим, если символы, закодированные с помощью CP866, попробовать отобразить, используя кодовую таблицу Windows 1251, то эти самые кракозябры (бессмысленный набор знаков) и вылезут, полностью заменив собой текст сообщения.

    Пример кракозябров

    Аналогичная ситуация очень часто возникает при создании сайтов на WordPress и Joomla, форумов или блогов, когда текст с русскими символами по ошибке сохраняется не в той кодировке, которая используется на сайте по умолчанию, или же не в том текстовом редакторе, который добавляет в код отсебятину не видимую невооруженным глазом.

    В конце концов такая ситуация с множеством кодировок и постоянно вылезающими кракозябрами многим надоела, появились предпосылки к созданию новой универсальной вариации, которая бы заменила собой все существующие и решила бы, наконец, на корню проблему с появлением не читаемых текстов. Кроме этого существовала проблема языков подобных китайскому, где символов языка было гораздо больше, чем 256.

    Юникод (Unicode) — универсальные кодировки UTF 8, 16 и 32

    Эти тысячи знаков языковой группы юго-восточной Азии никак невозможно было описать в одном байте информации, который выделялся для кодирования символов в расширенных версиях ASCII. В результате был создан консорциум под названием Юникод (Unicode — Unicode Consortium) при сотрудничестве многих лидеров IT индустрии (те, кто производит софт, кто кодирует железо, кто создает шрифты), которые были заинтересованы в появлении универсальной кодировки текста.

    Первой вариацией, вышедшей под эгидой консорциума Юникод, была UTF 32. Цифра в названии кодировки означает количество бит, которое используется для кодирования одного символа. 32 бита составляют 4 байта информации, которые понадобятся для кодирования одного единственного знака в новой универсальной кодировке UTF.

    В результате чего, один и тот же файл с текстом, закодированный в расширенной версии ASCII и в UTF-32, в последнем случае будет иметь размер (весить) в четыре раза больше. Это плохо, но зато теперь у нас появилась возможность закодировать с помощью ЮТФ число знаков, равное двум в тридцать второй степени (миллиарды символов, которые покроют любое реально необходимое значение с колоссальным запасом).

    Но многим странам с языками европейской группы такое огромное количество знаков использовать в кодировке вовсе и не было необходимости, однако при задействовании UTF-32 они ни за что ни про что получали четырехкратное увеличение веса текстовых документов, а в результате и увеличение объема интернет трафика и объема хранимых данных. Это много, и такое расточительство себе никто не мог позволить.

    В результате развития Юникода появилась UTF-16, которая получилась настолько удачной, что была принята по умолчанию как базовое пространство для всех символов, которые у нас используются. Она использует два байта для кодирования одного знака. Давайте посмотрим, как это дело выглядит.

    В операционной системе Windows вы можете пройти по пути «Пуск» — «Программы» — «Стандартные» — «Служебные» — «Таблица символов». В результате откроется таблица с векторными формами всех установленных у вас в системе шрифтов. Если вы выберете в «Дополнительных параметрах» набор знаков Юникод, то сможете увидеть для каждого шрифта в отдельности весь ассортимент входящих в него символов.

    Кстати, щелкнув по любому из них, вы сможете увидеть его двухбайтовый код в формате UTF-16, состоящий из четырех шестнадцатеричных цифр:

    Юникод в формате UTF-16

    Сколько символов можно закодировать в UTF-16 с помощью 16 бит? 65 536 (два в степени шестнадцать), и именно это число было принято за базовое пространство в Юникоде. Помимо этого существуют способы закодировать с помощью нее и около двух миллионов знаков, но ограничились расширенным пространством в миллион символов текста.

    Но даже эта удачная версия кодировки Юникода не принесла особого удовлетворения тем, кто писал, допустим, программы только на английском языке, ибо у них, после перехода от расширенной версии ASCII к UTF-16, вес документов увеличивался в два раза (один байт на один символ в Аски и два байта на тот же самый символ в ЮТФ-16).

    Вот именно для удовлетворения всех и вся в консорциуме Unicode было решено придумать кодировку переменной длины. Ее назвали UTF-8. Несмотря на восьмерку в названии, она действительно имеет переменную длину, т.е. каждый символ текста может быть закодирован в последовательность длиной от одного до шести байт.

    На практике же в UTF-8 используется только диапазон от одного до четырех байт, потому что за четырьмя байтами кода ничего уже даже теоретически не возможно представить. Все латинские знаки в ней кодируются в один байт, так же как и в старой доброй ASCII.

    Что примечательно, в случае кодирования только латиницы, даже те программы, которые не понимают Юникод, все равно прочитают то, что закодировано в ЮТФ-8. Т.е. базовая часть Аски просто перешла в это детище консорциума Unicode.

    Кириллические же знаки в UTF-8 кодируются в два байта, а, например, грузинские — в три байта. Консорциум Юникод после создания UTF 16 и 8 решил основную проблему — теперь у нас в шрифтах существует единое кодовое пространство. И теперь их производителям остается только исходя из своих сил и возможностей заполнять его векторными формами символов текста. Сейчас в наборы даже эмодзи смайлики добавляют.

    В приведенной чуть выше «Таблице символов» видно, что разные шрифты поддерживают разное количество знаков. Некоторые насыщенные символами Юникода шрифты могут весить очень прилично. Но зато теперь они отличаются не тем, что они созданы для разных кодировок, а тем, что производитель шрифта заполнил или не заполнил единое кодовое пространство теми или иными векторными формами до конца.

    Кракозябры вместо русских букв — как исправить

    Давайте теперь посмотрим, как появляются вместо текста кракозябры или, другими словами, как выбирается правильная кодировка для русского текста. Собственно, она задается в той программе, в которой вы создаете или редактируете этот самый текст, или же код с использованием текстовых фрагментов.

    Для редактирования и создания текстовых файлов лично я использую очень хороший, на мой взгляд, Html и PHP редактор Notepad++. Впрочем, он может подсвечивать синтаксис еще доброй сотни языков программирования и разметки, а также имеет возможность расширения с помощью плагинов. Читайте подробный обзор этой замечательной программы по приведенной ссылке.

    В верхнем меню Notepad++ есть пункт «Кодировки», где у вас будет возможность преобразовать уже имеющийся вариант в тот, который используется на вашем сайте по умолчанию:

    Как исправить кракозябры в кодировке utf-8

    В случае сайта на Joomla 1.5 и выше, а также в случае блога на WordPress следует во избежании появления кракозябров выбирать вариант UTF 8 без BOM. А что такое приставка BOM?

    Дело в том, что когда разрабатывали кодировку ЮТФ-16, зачем-то решили прикрутить к ней такую вещь, как возможность записывать код символа, как в прямой последовательности (например, 0A15), так и в обратной (150A). А для того, чтобы программы понимали, в какой именно последовательности читать коды, и был придуман BOM (Byte Order Mark или, другими словами, сигнатура), которая выражалась в добавлении трех дополнительных байтов в самое начало документов.

    В кодировке UTF-8 никаких BOM предусмотрено в консорциуме Юникод не было и поэтому добавление сигнатуры (этих самых пресловутых дополнительных трех байтов в начало документа) некоторым программам просто-напросто мешает читать код. Поэтому мы всегда при сохранении файлов в ЮТФ должны выбирать вариант без BOM (без сигнатуры). Таким образом, вы заранее обезопасите себя от вылезания кракозябров.

    Что примечательно, некоторые программы в Windows не умеют этого делать (не умеют сохранять текст в ЮТФ-8 без BOM), например, все тот же пресловутый Блокнот Windows. Он сохраняет документ в UTF-8, но все равно добавляет в его начало сигнатуру (три дополнительных байта). Причем эти байты будут всегда одни и те же — читать код в прямой последовательности. Но на серверах из-за этой мелочи может возникнуть проблема — вылезут кракозябры.

    Поэтому ни в коем случае не пользуйтесь обычным блокнотом Windows для редактирования документов вашего сайта, если не хотите появления кракозябров. Лучшим и наиболее простым вариантом я считаю уже упомянутый редактор Notepad++, который практически не имеет недостатков и состоит из одних лишь достоинств.

    В Notepad ++ при выборе кодировки у вас будет возможность преобразовать текст в кодировку UCS-2, которая по своей сути очень близка к стандарту Юникод. Также в Нотепаде можно будет закодировать текст в ANSI, т.е. применительно к русскому языку это будет уже описанная нами чуть выше Windows 1251. Откуда берется эта информация?

    Она прописана в реестре вашей операционной системы Windows — какую кодировку выбирать в случае ANSI, какую выбирать в случае OEM (для русского языка это будет CP866). Если вы установите на своем компьютере другой язык по умолчанию, то и эти кодировки будут заменены на аналогичные из разряда ANSI или OEM для того самого языка.

    После того, как вы в Notepad++ сохраните документ в нужной вам кодировке или же откроете документ с сайта для редактирования, то в правом нижнем углу редактора сможете увидеть ее название:

    Как узнать тип кодировки текстового документа

    Чтобы избежать кракозябров, кроме описанных выше действий, будет полезным прописать в его шапке исходного кода всех страниц сайта информацию об этой самой кодировке, чтобы на сервере или локальном хосте не возникло путаницы.

    Вообще, во всех языках гипертекстовой разметки кроме Html используется специальное объявление xml, в котором указывается кодировка текста.

    <?xml version="1.0" encoding="windows-1251"?>

    Прежде, чем начать разбирать код, браузер узнает, какая версия используется и как именно нужно интерпретировать коды символов этого языка. Но что примечательно, в случае, если вы сохраняете документ в принятом по умолчанию юникоде, то это объявление xml можно будет опустить (кодировка будет считаться UTF-8, если нет BOM или ЮТФ-16, если BOM есть).

    В случае же документа языка Html для указания кодировки используется элемент Meta, который прописывается между открывающим и закрывающим тегом Head:

    <head> ... <meta charset="utf-8"> ... </head>

    Эта запись довольно сильно отличается от принятой в стандарте в Html 4.01, но полностью соответствует новому внедряемому потихоньку стандарту Html 5, и она будет стопроцентно правильно понята любыми используемыми на текущий момент браузерами.

    По идее, элемент Meta с указание кодировки Html документа лучше будет ставить как можно выше в шапке документа, чтобы на момент встречи в тексте первого знака не из базовой ANSI (которые правильно прочитаются всегда и в любой вариации) браузер уже должен иметь информацию о том, как интерпретировать коды этих символов.

    Удачи вам! До скорых встреч на страницах блога KtoNaNovenkogo.ru

    Твитнуть

    Поделиться

    Плюсануть

    Поделиться

    Отправить

    Класснуть

    Линкануть

    Запинить

    Подборки по теме:

    Рубрика: Вебмастеру

    ktonanovenkogo.ru

    Таблица Windows-1251

    Windows-1251 (cp1251) — это стандартная 8-битная кодировка, разработанная компанией Microsoft. Она содержит практически все символы, которые Вы можете встретить на стандартной русской клавиатуре. Также 1251 имеет символы для таких языков, как белорусский, украинский, болгарский и сербский.

    DEC

    HEX

    СИМВ

    DEC

    HEX

    СИМВ

    DEC

    HEX

    СИМВ

    000

    00

    NOP

    086

    56

    V

    171

    AB

    «

    001

    01

    SOH

    087

    57

    W

    172

    AC

    ¬

    002

    02

    STX

    088

    58

    X

    173

    AD

    003

    03

    ETX

    089

    59

    Y

    174

    AE

    ®

    004

    04

    EOT

    090

    5A

    Z

    175

    AF

    Ї

    005

    05

    ENQ

    091

    5B

    [

    176

    B0

    °

    006

    06

    ACK

    092

    5C

    \

    177

    B1

    ±

    007

    07

    BEL

    093

    5D

    ]

    178

    B2

    І

    008

    08

    BS

    094

    5E

    ^

    179

    B3

    і

    009

    09

    Табуляция

    095

    5F

    _

    180

    B4

    ґ

    010

    0A

    LF

    096

    60

    `

    181

    B5

    µ

    011

    0B

    VT

    097

    61

    a

    182

    B6

    012

    0C

    FF

    098

    62

    b

    183

    B7

    ·

    013

    0D

    CR

    099

    63

    c

    184

    B8

    Ё

    014

    0E

    SO

    100

    64

    d

    185

    B9

    015

    0F

    SI

    101

    65

    e

    186

    BA

    Є

    016

    10

    DLE

    102

    66

    f

    187

    BB

    »

    017

    11

    DC1

    103

    67

    g

    188

    BC

    ј

    018

    12

    DC2

    104

    68

    h

    189

    BD

    Ѕ

    019

    13

    DC3

    105

    69

    i

    190

    BE

    Ѕ

    020

    14

    DC4

    106

    6A

    j

    191

    BF

    Ї

    021

    15

    NAK

    107

    6B

    k

    192

    C0

    А

    022

    16

    SYN

    108

    6C

    l

    193

    C1

    Б

    023

    17

    ETB

    109

    6D

    m

    194

    C2

    В

    024

    18

    CAN

    110

    6E

    n

    195

    C3

    Г

    025

    19

    EM

    111

    6F

    o

    196

    C4

    Д

    026

    1A

    SUB

    112

    70

    p

    197

    C5

    Е

    027

    1B

    ESC

    113

    71

    q

    198

    C6

    Ж

    028

    1C

    FS

    114

    72

    r

    199

    C7

    З

    029

    1D

    GS

    115

    73

    s

    200

    C8

    И

    030

    1E

    RS

    116

    74

    t

    201

    C9

    Й

    031

    1F

    US

    117

    75

    u

    202

    CA

    К

    032

    20

    Пробел

    118

    76

    v

    203

    CB

    Л

    033

    21

    !

    119

    77

    w

    204

    CC

    М

    034

    22

    «

    120

    78

    x

    205

    CD

    Н

    035

    23

    #

    121

    79

    y

    206

    CE

    О

    036

    24

    $

    122

    7A

    z

    207

    CF

    П

    037

    25

    %

    123

    7B

    {

    208

    D0

    Р

    038

    26

    &

    124

    7C

    |

    209

    D1

    С

    039

    27

    125

    7D

    }

    210

    D2

    Т

    040

    28

    (

    126

    7E

    ~

    211

    D3

    У

    041

    29

    )

    127

    7F

    

    212

    D4

    Ф

    042

    2A

    *

    128

    80

    Ђ

    213

    D5

    Х

    043

    2B

    +

    129

    81

    Ѓ

    214

    D6

    Ц

    044

    2C

    ,

    130

    82

    215

    D7

    Ч

    045

    2D

    131

    83

    ѓ

    216

    D8

    Ш

    046

    2E

    .

    132

    84

    217

    D9

    Щ

    047

    2F

    /

    133

    85

    218

    DA

    Ъ

    048

    30

    0

    134

    86

    219

    DB

    Ы

    049

    31

    1

    135

    87

    220

    DC

    Ь

    050

    32

    2

    136

    88

    221

    DD

    Э

    051

    33

    3

    137

    89

    222

    DE

    Ю

    052

    34

    4

    138

    8A

    Љ

    223

    DF

    Я

    053

    35

    5

    139

    8B

    224

    E0

    а

    054

    36

    6

    140

    8C

    Њ

    225

    E1

    б

    055

    37

    7

    141

    8D

    Ќ

    226

    E2

    в

    056

    38

    8

    142

    8E

    Ћ

    227

    E3

    г

    057

    39

    9

    143

    8F

    Џ

    228

    E4

    д

    058

    3A

    :

    144

    90

    Ђ

    229

    E5

    е

    059

    3B

    ;

    145

    91

    230

    E6

    ж

    060

    3C

    <

    146

    92

    231

    E7

    з

    061

    3D

    =

    147

    93

    232

    E8

    и

    062

    3E

    >

    148

    94

    233

    E9

    й

    063

    3F

    ?

    149

    95

    234

    EA

    к

    064

    40

    @

    150

    96

    235

    EB

    л

    065

    41

    A

    151

    97

    236

    EC

    м

    066

    42

    B

    152

    98 ˜

    237

    ED

    н

    067

    43

    C

    153

    99

    238

    EE

    о

    068

    44

    D

    154

    9A

    љ

    239

    EF

    п

    069

    45

    E

    155

    9B

    240

    F0

    р

    070

    46

    F

    156

    9C

    њ

    241

    F1

    с

    071

    47

    G

    157

    9D

    ќ

    242

    F2

    т

    072

    48

    H

    158

    9E

    ћ

    243

    F3

    у

    073

    49

    I

    159

    9F

    џ

    244

    F4

    ф

    074

    4A

    J

    160

    A0

    245

    F5

    х

    075

    4B

    K

    161

    A1

    Ў

    246

    F6

    ц

    076

    4C

    L

    162

    A2

    ў

    247

    F7

    ч

    077

    4D

    M

    163

    A3

    Ј

    248

    F8

    ш

    078

    4E

    N

    164

    A4

    ¤

    249

    F9

    щ

    079

    4F

    O

    165

    A5

    Ґ

    250

    FA

    ъ

    080

    50

    P

    166

    A6

    ¦

    251

    FB

    ы

    081

    51

    Q

    167

    A7

    §

    252

    FC

    ь

    082

    52

    R

    168

    A8

    Ё

    253

    FD

    э

    083

    53

    S

    169

    A9

    ©

    254

    FE

    ю

    084

    54

    T

    170

    AA

    Є

    255

    FF

    я

    085

    55

    U

    Похожие записи:

    kvodo.ru

    Таблица ASCII (кодировка Windows-1251)

    (0)(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)(15)(16)
    (17)(18)(19)(20)(21)(22)(23)(24)(25)(26)(27)(28)(29)(30)(31) (32)!(33)
    "(34)#(35)$(36)%(37)&(38)'(39)((40))(41)*(42)+(43),(44)-(45).(46)/(47)0(48)1(49)2(50)
    3(51)4(52)5(53)6(54)7(55)8(56)9(57):(58);(59)(60)=(61)>(62)?(63)@(64)A(65)B(66)C(67)
    D(68)E(69)F(70)G(71)H(72)I(73)J(74)K(75)L(76)M(77)N(78)O(79)P(80)Q(81)R(82)S(83)T(84)
    U(85)V(86)W(87)X(88)Y(89)Z(90)[(91)\ (92)](93)^(94)_(95)`(96)a(97)b(98)c(99)d(100)e(101)
    f(102)g(103)h(104)i(105)j(106)k(107)l(108)m(109)n(110)o(111)p(112)q(113)r(114)s(115)t(116)u(117)v(118)
    w(119)x(120)y(121)z(122){(123)|(124)}(125)~(126)(127)Ђ(128)Ѓ(129)‚(130)ѓ(131)„(132)…(133)†(134)‡(135)
    €(136)‰(137)Љ(138)‹(139)Њ(140)Ќ(141)Ћ(142)Џ(143)ђ(144)‘(145)’(146)“(147)”(148)•(149)–(150)—(151)˜(152)
    ™(153)љ(154)›(155)њ(156)ќ(157)ћ(158)џ(159) (160)Ў(161)ў(162)Ј(163)¤(164)Ґ(165)¦(166)§(167)Ё(168)©(169)
    Є(170)«(171)¬(172)­(173)®(174)Ї(175)°(176)±(177)І(178)і(179)ґ(180)µ(181)¶(182)·(183)ё(184)№(185)є(186)
    »(187)ј(188)Ѕ(189)ѕ(190)ї(191)А(192)Б(193)В(194)Г(195)Д(196)Е(197)Ж(198)З(199)И(200)Й(201)К(202)Л(203)
    М(204)Н(205)О(206)П(207)Р(208)С(209)Т(210)У(211)Ф(212)Х(213)Ц(214)Ч(215)Ш(216)Щ(217)Ъ(218)Ы(219)Ь(220)
    Э(221)Ю(222)Я(223)а(224)б(225)в(226)г(227)д(228)е(229)ж(230)з(231)и(232)й(233)к(234)л(235)м(236)н(237)
    о(238)п(239)р(240)с(241)т(242)у(243)ф(244)х(245)ц(246)ч(247)ш(248)щ(249)ъ(250)ы(251)ь(252)э(253)ю(254)
    я(255)(256)(257)(258)(259)(260)(261)(262)(263)(264)(265)(266)(267)(268)(269)(270)(271)
    Версия для печати — версия для печатиОпределение ASCII (англ. American Standard Code for Information Interchange) — американская стандартная таблица для кодирования печатных символов и некоторых специальных кодов.
    Если у вас есть мысли по поводу данной страницы или предложение по созданию математической (см. раздел «Математика») вспомогательной памятки, мы обязательно рассмотрим ваше предложение. Просто воспользуйтесь обратной связью.

    © Школяр. Математика (при поддержке «Ветвистого древа») 2009—2016

    scolaire.ru

    windows-1251 кодировка, таблица символов, коды, символы

    НО-МЕРwindows-1251СИМВОЛДЕСЯТИЧ-НЫЙ КОДHTML КОДОПИСАНИЕ, РАЗНИЦАМЕЖДУ СИМВОЛОМИ HTML КОДОМНО-МЕРwindows-1251СИМВОЛДЕСЯТИЧ-НЫЙ КОДHTML КОДОПИСАНИЕ, РАЗНИЦАМЕЖДУ СИМВОЛОМИ HTML КОДОМНО-МЕРОПИСАНИЕДЕСЯТИЧ-НЫЙ КОДНО-МЕРОПИСАНИЕДЕСЯТИЧ-НЫЙ КОД

     Используйте имя пользователя: Guest, Anonymous, Programmer

    128Ђ&#1026;&#128; есть € 192А&#1040;&Agrave;&Agrave; и &#192 есть À
    129Ѓ&#1027;&#129; есть  193Б&#1041;&Aacute;&Aacute; и &#193 есть Á
    130&#130;Дополнительный код ‚есть &#8218; 194В&#1042;&Acirc;&Acirc; и &#194 есть Â
    131ѓ&#1107;&#131; есть ƒ 195Г&#1043;&Atilde;&Atilde; и &#195 есть Ã
    132&#132;Дополнительный код „есть &#8222; 196Д&#1044;&Auml;&Auml; и &#196 есть Ä
    133&#133;Дополнительный код …есть &#8230; 197Е&#1045;&Aring;&Aring; и &#197 есть Å
    134&#134;Дополнительный код †есть &#8224; 198Ж&#1046;&AElig;&AElig; и &#198 есть Æ
    135&#135;Дополнительный код ‡есть &#8225; 199З&#1047;&Ccedil;&Ccedil; и &#199 есть Ç
    136&#8364;&#136; есть ˆ 200И&#1048;&Egrave;&Egrave; и &#200 есть È
    137&#137;Дополнительный код ‰есть &#8240; 201Й&#1049;&Eacute;&Eacute; и &#201 есть É
    138Љ&#1033;&#138; есть Š 202К&#1050;&Ecirc;&Ecirc; и &#202 есть Ê
    139&#139;Дополнительный код ‹есть &#8249; 203Л&#1051;&Euml;&Euml; и &#203 есть Ë
    140Њ&#1034;&#140; есть Œ 204М&#1052;&Igrave;&Igrave; и &#204 есть Ì
    141Ќ&#1036;&#141; есть  205Н&#1053;&Iacute;&Iacute; и &#205 есть Í
    142Ћ&#1035;&#142; есть Ž 206О&#1054;&Icirc;&Icirc; и &#206 есть Î
    143Џ&#1039;&#143; есть  207П&#1055;&Iuml;&Iuml; и &#207 есть Ï
    144ђ&#1106;&#144; есть  208Р&#1056;&ETH;&ETH; и &#208 есть Ð
    145&#145;Дополнительный код ‘есть &#8216; 209С&#1057;&Ntilde;&Ntilde; и &#209 есть Ñ
    146&#146;Дополнительный код ’есть &#8217; 210Т&#1058;&Ograve;&Ograve; и &#210 есть Ò
    147&#147;Дополнительный код “есть &#8220; 211У&#1059;&Oacute;&Oacute; и &#211 есть Ó
    148&#148;Дополнительный код ”есть &#8221; 212Ф&#1060;&Ocirc;&Ocirc; и &#212 есть Ô
    149&#149;Дополнительный код •есть &#8226; 213Х&#1061;&Otilde;&Otilde; и &#213 есть Õ
    150&#150;Дополнительный код –есть &#8211; 214Ц&#1062;&Ouml;&Ouml; и &#214 есть Ö
    151&#151;Дополнительный код —есть &#8212; 215Ч&#1063;&times;&times; и &#215 есть ×
    152[empty][empty]&#152; есть ˜ 216Ш&#1064;&Oslash;&Oslash; и &#216 есть Ø
    153&#153;Дополнительный код ™есть &#8482; 217Щ&#1065;&Ugrave;&Ugrave; и &#217 есть Ù
    154љ&#1113;&#154; есть š 218Ъ&#1066;&Uacute;&Uacute; и &#218 есть Ú
    155&#155;Дополнительный код ›есть &#8250; 219Ы&#1067;&Ucirc;&Ucirc; и &#219 есть Û
    156њ&#1114;&#156; есть œ 220Ь&#1068;&Uuml;&Uuml; и &#220 есть Ü
    157ќ&#1116;&#157; есть  221Э&#1069;&Yacute;&Yacute; и &#221 есть Ý
    158ћ&#1115;&#158; есть ž 222Ю&#1070;&THORN;&THORN; и &#222 есть Þ
    159џ&#1119;&#159; есть Ÿ 223Я&#1071;&szlig;&szlig; и &#223 есть ß
    160 &#160;&nbsp; 224а&#1072;&agrave;&agrave; и &#224 есть à
    161Ў&#1038;&iexcl;&iexcl; и &#161 есть ¡ 225б&#1073;&aacute;&aacute; и &#225 есть á
    162ў&#1118;&cent;&cent; и &#162 есть ¢ 226в&#1074;&acirc;&acirc; и &#226 есть â
    163Ј&#1032;&pound;&pound; и &#163 есть £ 227г&#1075;&atilde;&atilde; и &#227 есть ã
    164¤&#164;&curren; 228д&#1076;&auml;&auml; и &#228 есть ä
    165Ґ&#1168;&yen;&yen; и &#165 есть ¥ 229е&#1077;&aring;&aring; и &#229 есть å
    166¦&#166;&brvbar; 230ж&#1078;&aelig;&aelig; и &#230 есть æ
    167§&#167;&sect; 231з&#1079;&ccedil;&ccedil; и &#231 есть ç
    168Ё&#1025;&uml;&uml; и &#168 есть ¨ 232и&#1080;&egrave;&egrave; и &#232 есть è
    169©&#169;&copy; 233й&#1081;&eacute;&eacute; и &#233 есть é
    170Є&#1028;&ordf;&ordf; и &#170 есть ª 234к&#1082;&ecirc;&ecirc; и &#234 есть ê
    171«&#171;&laquo; 235л&#1083;&euml;&euml; и &#235 есть ë
    172¬&#172;&not; 236м&#1084;&igrave;&igrave; и &#236 есть ì
    173­&#173;&shy; 237н&#1085;&iacute;&iacute; и &#237 есть í
    174®&#174;&reg; 238о&#1086;&icirc;&icirc; и &#238 есть î
    175Ї&#1031;&macr;&macr; и &#175 есть ¯ 239п&#1087;&iuml;&iuml; и &#239 есть ï
    176°&#176;&deg; 240р&#1088;&eth;&eth; и &#240 есть ð
    177±&#177;&plusmn; 241с&#1089;&ntilde;&ntilde; и &#241 есть ñ
    178І&#1030;&sup2;&sup2; и &#178 есть ² 242т&#1090;&ograve;&ograve; и &#242 есть ò
    179і&#1110;&sup3;&sup3; и &#179 есть ³ 243у&#1091;&oacute;&oacute; и &#243 есть ó
    180ґ&#1169;&acute;&acute; и &#180 есть ´ 244ф&#1092;&ocirc;&ocirc; и &#244 есть ô
    181µ&#181;&micro; 245х&#1093;&otilde;&otilde; и &#245 есть õ
    182&#182;&para; 246ц&#1094;&ouml;&ouml; и &#246 есть ö
    183·&#183;&middot; 247ч&#1095;&divide;&divide; и &#247 есть ÷
    184ё&#1105;&cedil;&cedil; и &#184 есть ¸ 248ш&#1096;&oslash;&oslash; и &#248 есть ø
    185&#8470;&sup1;&sup1; и &#185 есть ¹ 249щ&#1097;&ugrave;&ugrave; и &#249 есть ù
    186є&#1108;&ordm;&ordm; и &#186 есть º 250ъ&#1098;&uacute;&uacute; и &#250 есть ú
    187»&#187;&raquo; 251ы&#1099;&ucirc;&ucirc; и &#251 есть û
    188ј&#1112;&frac14;&frac14; и &#188 есть ¼ 252ь&#1100;&uuml;&uuml; и &#252 есть ü
    189Ѕ&#1029;&frac12;&frac12; и &#189 есть ½ 253э&#1101;&yacute;&yacute; и &#253 есть ý
    190ѕ&#1109;&frac34;&frac34; и &#190 есть ¾ 254ю&#1102;&thorn;&thorn; и &#254 есть þ
    191ї&#1111;&iquest;&iquest; и &#191 есть ¿ 255я&#1103;&yuml;&yuml; и &#255 есть ÿ
    0NUL null character&#0; 16ctrl-P (DLE) data link escape&#16;
    1ctrl-A (SOH) start of header&#1; 17ctrl-Q (START, DC1) device control 1&#17;
    2ctrl-B (STX) start of text&#2; 18ctrl-R (DC2) device control 2&#18;
    3ctrl-C (INTR, ETX) end of text&#3; 19ctrl-S (STOP, DC3) device control 3&#19;
    4ctrl-D (EOF, EOT) end of transmission&#4; 20ctrl-T (DC4) device control 4&#20;
    5ctrl-E (ENQ) enquiry&#5; 21ctrl-U (NAK) negative acknowledge&#21;
    6ctrl-F (ACK) acknowledge&#6; 22ctrl-V (SYN) synchronize&#22;
    7ctrl-G (BEL) bell (ring)&#7; 23ctrl-W (ETB) end transmission block&#23;
    8ctrl-H (BKSP, BS) backspace&#8; 24ctrl-X (CAN) cancel&#24;
    9ctrl-I (TAB, HT) horizontal tab&#9; 25ctrl-Y (EM) end of medium&#25;
    10ctrl-J (LF) line feed&#10; 26ctrl-Z (SUB) substitute&#26;
    11ctrl-K (VT) vertical tab&#11; 27(ESC) escape&#27;
    12ctrl-L (FF) form feed&#12; 28(FS_ file separator&#28;
    13ctrl-M (CR) carriage return&#13; 29(GS) group separator&#29;
    14ctrl-N (SO) shift out&#14; 30(RS_ record separator&#30;
    15ctrl-O (SI) shift in&#15; 31(US) unit separator&#31;

    www.programva.com


    Смотрите также