Создание кодировки кои 8

Создание кодировки кои 8

Кодировка KOI8-R

Кодировка ISO 8859-5

ISO 8859-5

CP866

Альтернативная кодировка

«Альтернативная кодировка» — основанная на CP437 кодовая страница, где все специфические европейские символы во второй половине заменены на кириллицу, оставляя псевдографические символы нетронутыми. Следовательно, это не портит вид программ, использующих для работы текстовые окна, а также обеспечивает использование в них символов кириллицы.

Исторически существовало много вариантов альтернативной кодировки, но все различия касаются только области 0xF0 — 0xFF (240—255). Окончательным стандартом стала кодировка IBM CP866, поддержка которой была добавлена в MS-DOS версии 6.22 (до этого использовались всевозможные «самопальные» русификаторы. Альтернативная кодировка всё ещё жива и чрезвычайно популярна в среде DOS и OS/2. Кроме того, в этой кодировке записываются имена в файловой системе FAT. CP866 до сих пор используется в консоли русифицированных систем семейства Windows NT.

. .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. А 410 Б 411 В 412 Г 413 Д 414 Е 415 Ж 416 З 417 И 418 Й 419 К 41A Л 41B М 41C Н 41D О 41E П 41F
9. Р 420 С 421 Т 422 У 423 Ф 424 Х 425 Ц 426 Ч 427 Ш 428 Щ 429 Ъ 42A Ы 42B Ь 42C Э 42D Ю 42E Я 42F
A. а 430 б 431 в 432 г 433 д 434 е 435 ж 436 з 437 и 438 й 439 к 43A л 43B м 43C н 43D о 43E п 43F
B. ░ 2591 ▒ 2592 ▓ 2593 │ 2502 ┤ 2524 ╡ 2561 ╢ 2562 ╖ 2556 ╕ 2555 ╣ 2563 ║ 2551 ╗ 2557 ╝ 255D ╜ 255C ╛ 255B ┐ 2510
C. └ 2514 ┴ 2534 ┬ 252C ├ 251C ─ 2500 ┼ 253C ╞ 255E ╟ 255F ╚ 255A ╔ 2554 ╩ 2569 ╦ 2566 ╠ 2560 ═ 2550 ╬ 256C ╧ 2567
D. ╨ 2568 ╤ 2564 ╥ 2565 ╙ 2559 ╘ 2558 ╒ 2552 ╓ 2553 ╫ 256B ╪ 256A ┘ 2518 ┌ 250C █ 2588 ▄ 2584 ▌ 258C ▐ 2590 ▀ 2580
E. р 440 с 441 т 442 у 443 ф 444 х 445 ц 446 ч 447 ш 448 щ 449 ъ 44A ы 44B ь 44C э 44D ю 44E я 44F
F. Ё 401 ё 451 Є 404 є 454 Ї 407 ї 457 Ў 40E ў 45E ° B0 ∙ 2219 · B7 √ 221A № 2116 ¤ A4 ■ 25A0 A0

SO 8859-5 — 8-битная кодировка из серии ISO-8859 для записи кириллицы. В России почти не употребляется. В целом ISO 8859-5 — не очень удобная кодировка, поскольку в ней отсутствуют многие нужные символы, такие как тире (—), кавычки-ёлочки («»), градус (°) и др.

. .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. 80 81 82 83 84 85 86 87 88 89 8A 8B 8C 8D 8E 8F
9. 90 91 92 93 94 95 96 97 98 99 9A 9B 9C 9D 9E 9F
A. A0 Ё 401 Ђ 402 Ѓ 403 Є 404 Ѕ 405 І 406 Ї 407 Ј 408 Љ 409 Њ 40A Ћ 40B Ќ 40C ­ AD Ў 40E Џ 40F
B. А 410 Б 411 В 412 Г 413 Д 414 Е 415 Ж 416 З 417 И 418 Й 419 К 41A Л 41B М 41C Н 41D О 41E П 41F
C. Р 420 С 421 Т 422 У 423 Ф 424 Х 425 Ц 426 Ч 427 Ш 428 Щ 429 Ъ 42A Ы 42B Ь 42C Э 42D Ю 42E Я 42F
D. а 430 б 431 в 432 г 433 д 434 е 435 ж 436 з 437 и 438 й 439 к 43A л 43B м 43C н 43D о 43E п 43F
E. р 440 с 441 т 442 у 443 ф 444 х 445 ц 446 ч 447 ш 448 щ 449 ъ 44A ы 44B ь 44C э 44D ю 44E я 44F
F. № 2116 ё 451 ђ 452 ѓ 453 є 454 ѕ 455 і 456 ї 457 ј 458 љ 459 њ 45A ћ 45B ќ 45C § A7 ў 45E џ 45F
Читайте также:  Html текст на фоне картинки

КОИ-8 (код обмена информацией, 8 битов), KOI8 — восьмибитовый стандарт кодирования символов в информатике. Разработан для кодирования букв кириллических алфавитов. Существует также семибитовая версия кодировки — КОИ-7. КОИ-7 и КОИ-8 описаны в ГОСТ 19768-74 (сейчас недействителен).

Разработчики КОИ-8 поместили символы русского алфавита в верхней части расширенной таблицы ASCII таким образом, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, убирать восьмой бит каждого символа, то получается «читабельный» текст, хотя он и написан латинскими символами. Например, слова «Русский Текст» превратились бы в «rUSSKIJ tEKST». Как побочное следствие, символы кириллицы оказались расположены не в алфавитном порядке.

. .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. ─ 2500 │ 2502 ┌ 250C ┐ 2510 └ 2514 ┘ 2518 ├ 251C ┤ 2524 ┬ 252C ┴ 2534 ┼ 253C ▀ 2580 ▄ 2584 █ 2588 ▌ 258C ▐ 2590
9. ░ 2591 ▒ 2592 ▓ 2593 ⌠ 2320 ■ 25A0 ∙ 2219 √ 221A ≈ 2248 ≤ 2264 ≥ 2265 A0 ⌡ 2321 ° B0 ² B2 · B7 ÷ F7
A. ═ 2550 ║ 2551 ╒ 2552 ё 451 ╓ 2553 ╔ 2554 ╕ 2555 ╖ 2556 ╗ 2557 ╘ 2558 ╙ 2559 ╚ 255A ╛ 255B ╜ 255C ╝ 255D ╞ 255E
B. ╟ 255F ╠ 2560 ╡ 2561 Ё 401 ╢ 2562 ╣ 2563 ╤ 2564 ╥ 2565 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 ╪ 256A ╫ 256B ╬ 256C © A9
C. ю 44E а 430 б 431 ц 446 д 434 е 435 ф 444 г 433 х 445 и 438 й 439 к 43A л 43B м 43C н 43D о 43E
D. п 43F я 44F р 440 с 441 т 442 у 443 ж 436 в 432 ь 44C ы 44B з 437 ш 448 э 44D щ 449 ч 447 ъ 44A
E. Ю 42E А 410 Б 411 Ц 426 Д 414 Е 415 Ф 424 Г 413 Х 425 И 418 Й 419 К 41A Л 41B М 41C Н 41D О 41E
F. П 41F Я 42F Р 420 С 421 Т 422 У 423 Ж 416 В 412 Ь 42C Ы 42B З 417 Ш 428 Э 42D Щ 429 Ч 427 Ъ 42A

Кодировка KOI8-U (украинская)

| следующая лекция ==>
Недостатки национальных кодировок | Кодировка Windows-1251

Дата добавления: 2014-01-05 ; Просмотров: 1453 ; Нарушение авторских прав? ;

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

Показаны только не совпадающие строки таблиц, поскольку всё остальное совпадает.

Кодировка KOI8-U (русско-украинская)

. .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
A.
2550

2551

2552
ё
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A

255B
ґ
491

255D

255E
B.
255F

2560

2561
Ё
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490

256C
©
A9

Кодировка KOI8-RU (русско-белорусско-украинская)

. .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
A.
2550

2551

2552
ё
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A

255B
ґ
491
ў
45E

255E
B.
255F

2560

2561
Ё
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490
Ў
40E
©
A9

Кодировка KOI8-C (кавказская)

. .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. ғ
493
җ
497
қ
49B
ҝ
49D
ң
4A3
ү
4AF
ұ
4B1
ҳ
4B3
ҷ
4B7
ҹ
4B9
һ
4BB

2580
ҝ
49D
ӣ
4E3
ө
4E9
ӯ
4EF
9. Ғ
492
Җ
496
Қ
49A
Ҝ
49C
Ң
4A2
Ү
4AE
Ұ
4B0
Ҳ
4B2
Ҷ
4B6
Ҹ
4B8
Һ
4BA

2321
Ә
4D8
Ӣ
4E2
Ө
4E8
Ӯ
4EE
A. A0 ђ
452
ѓ
453
ё
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45A
ћ
45B
ќ
45C
ґ
491
ў
45E
џ
45F
B.
2116
Ђ
402
Ѓ
403
Ё
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40A
Ћ
40B
Ќ
40C
Ґ
490
Ў
40E
Џ
40F
Читайте также:  Сбивается время в windows 10 после ubuntu

Кодировка KOI8-T (таджикская)

. .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. қ
49B
ғ
493

201A
Ғ
492

201E

2026

2020

2021

2030
ҳ
4B3

2039
Ҳ
4B2
ҷ
4B7
Ҷ
4B6
9. Қ
49A

2018

2019

201C

201D

2022

2013

2014

2122

203A
A. ӯ
4EF
Ӯ
4EE
ё
451
¤
A4
ӣ
4E3
¦
A6
§
A7
«
AB
¬
AC
­
AD
®
AE
B. °
B0
±
B1
²
B2
Ё
401
Ӣ
4E2

B6
·
B7

2116
»
BB
©
A9

Кодировка KOI8-O, KOI8-C (славянская, старая орфография)

. .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. Ђ
0402
Ѓ
0403
¸
00B8
ѓ
0453

201E

2026

2020
§
00A7

20AC
¨
00A8
Љ
0409

2039
Њ
040A
Ќ
040C
Ћ
040B
Џ
040F
9. ђ
0452

2018

2019

201C

201D

2022

2013

2014
£
00A3
·
00B7
љ
0459

203A
њ
045A
ќ
045C
ћ
045B
џ
045F
A. 00A0 ѵ
0475
ѣ
0463
ё
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
®
00AE

2122
«
00AB
ѳ
0473
ґ
0491
ў
045E
´
00B4
B. °
00B0
Ѵ
0474
Ѣ
0462
Ё
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116
¢
00A2
»
00BB
Ѳ
0472
Ґ
0490
Ў
040E
©
00A9

Кодировка ISO-IR-111, KOI8-E

. .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
A. 00A0 ђ
0452
ѓ
0453
ё
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
­
00AD
ў
045E
џ
045F
B.
2116
Ђ
0402
Ѓ
0403
Ё
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
¤
00A4
Ў
040E
Џ
040F

Кодировка KOI8-Unified, KOI8-F

Является предложением компании Fingertip Software [1]

. .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8.
2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590
9.
2591

2018

2019

201C

201D

2022

2013

2014
©
00A9

2122
00A0 »
00BB
®
00AE
«
00AB
·
00B7
¤
00A4
A. 00A0 ђ
0452
ѓ
0453
ё
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
ґ
0491
ў
045E
џ
045F
B.
2116
Ђ
0402
Ѓ
0403
Ё
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
Ґ
0490
Ў
040E
Џ
040F

Некириллические варианты КОИ-8

В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы. Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более или менее понятным. Например, в чешском варианте КОИ-8 (ČSN 369103) буквы Čč должны превращаться в cC, Žž — в zZ и т. д. В настоящее время эти кодировки используются в 1C. [источник не указан 727 дней]

Примечания

  1. KOI8 Unified // Fingertip Software site

Ссылки

  • Сводка кириллических 8-битных кодировок
  • RFC 1489
  • RFC 2319
Кодировки символов
Основы → алфавит • текст ( файл • данные ) • набор символов • конверсия
Исторические кодировки → Докомп.:семафорная (Макарова) • Морзе • Бодо • МТК-2 Комп.:6 бит • УПП • RADIX-50 • EBCDIC ( ДКОИ-8 ) • КОИ-7 • ISO 646
совре-
менное
8-битное
представ-
ление
символы → ASCII ( управляющие • печатные ) не-ASCII ( псевдографика )
8бит. код.стр. Разные → Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic
ISO 8859 → 1(лат.)2345(кир.)67891011 12 131415(€)16
Windows → 12501251(кир.)125212531254 1255 1256 1257 1258 | WGL4
IBM&DOS → 437 • 850 • 852 • 855 • 866 «альт.» • ( МИК ) • ( НИИ ЭВМ )
Много-
байтные
Традиционные → DBCS ( GB2312 ) • HTML
Unicode → UTF-16 • UTF-8 • список символов ( кириллица )
Связанные
темы →
интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображение Утилиты: iconv • recode
Читайте также:  Что можно клеить термоклеевым пистолетом

Wikimedia Foundation . 2010 .

Смотреть что такое "КОИ-8" в других словарях:

Кои — (яп. 鯉, koi, или более точно 錦鯉, nishikigoi (нисикигои), то есть парчовый карп) декоративная разновидность карпа обыкновенного (Cyprinus carpio). Карпом кои считается рыба, прошедшая 6 селекционных отборов, после чего ей присваивается… … Википедия

КОИ-7 — семибитная кодировка для русского языка и обмена информацией по ГОСТ 13052 74,так же как и ISO 7bit основанная на ASCII. КОИ 7 описана вместе с КОИ 8 в ГОСТ 19768 74 (сейчас недействителен). КОИ 7 включает в себя 3 «набора» Н0, Н1, Н2. Н0 это… … Википедия

КОИ — код обмена информацией неверная расшифровка Словарь: С. Фадеев. Словарь сокращений современного русского языка. С. Пб.: Политехника, 1997. 527 с. КОИ код отображения информации Пример использования КОИ 8 восьмибитный код отображения информации… … Словарь сокращений и аббревиатур

КОИ — но Такинобори Рю боевое искусство Кои порода карпов Код обмена информацией семейство кирилических кодировок КОИ 8 … Википедия

Ёкои — (яп. 横井) японская фамилия. Известные носители: Ёкои, Гумпэй (1941 1997) был одним из важнейших лиц компании Nintendo, а также в истории видеоигр в целом. Ёкои, Сёити (1915 1997) японский капрал, участник Второй мировой войны, не признавший… … Википедия

кои — сущ., кол во синонимов: 3 • императорская рыба (3) • рыба (773) • цветной карп (4) … Словарь синонимов

КОИ — код обмена информацией … Словарь сокращений русского языка

Кои но Такинобори Рю — Это статья о боевом искусстве. О кодовых страницах см. КОИ 8 Кои но Такинобори Рю (Koi no takinobori ryu:, «Карп, плывущий вверх по водопаду» [символ доблести самурая]) жёсткая боевая система, включает в себя прикладное (НДК 17) и… … Википедия

Ёкои, Сёити — В Википедии есть статьи о других людях с такой фамилией, см. Ёкои. Сёити Ёкои 横井 庄一 … Википедия

Кои́тус — (coitus; лат. совокупление; син.: половое сношение, половой акт, совокупление) генитальный контакт двух индивидуумов с целью получения полового удовлетворения, а также для продолжения рода. Коитус вестибулярный (с. vestibularis) К.,… … Медицинская энциклопедия

В Москве скончался один из создателей российского интернета и автор знаменитой кодировки KOI8-R Андрей Чернов, о чём сообщил в Facebook близкий друг разработчика Евгений Буданов. В начале девяностых годов он разработал стандарт для кодирования русской кириллицы, который позволил интернету стать русскоязычным. Варианты этой же кодировки используются в том числе для украинского и белорусского алфавитов.

Умер Андрей Чернов — программист, благодаря которому появились рунет и кодировка KOI8-R. pic.twitter.com/k79ecjv3SQ

Как работает KOI8-R?

KOI8-R — восьмибитная кодовая страница, разработанная для кодирования букв кириллических алфавитов. Разработчики разместили символы русского алфавита таким образом, что позиции символов кириллицы соответствовали их фонетическим аналогам в английском алфавите в нижней части таблицы. И если в тексте, написанном в этой кодировке, убирать восьмой бит каждого символа, то получается текст, подобный транслиту латинскими буквами.

Такой код обмена информацией применялся в семидесятые годы на компьютерах серии ЕС ЭВМ, а с середины восьмидесятых его стали использовать в первых русифицированных версиях операционной системы UNIX.

Кодирование заключалось в том, что каждому символу присваивался уникальный код: от 00000000 до 11111111. Таким образом, человек различал символы по их начертанию, а компьютер — по их коду.

Используется ли сейчас кодировка Чернова?

Нет. Она была актуальна для старых восьмибитных компьютеров, сейчас в основном используется Юникод в различных форматах.

Ссылка на основную публикацию
Adblock detector