2. 8-ми битовые кодировки русских букв
Вот основные 8-ми битовые кодировки русских букв, получившие распространение:
Помимо основного названия можно использовать синонимы.
Набор их может отличаться в разных версиях JDK.
Вот список от JDK 1.3.1:
Причём синонимы, в отличии от основного имени нечувствительны к регистру символов - такова особенность реализации.
Стоит отметить, что эти кодировки на некоторых JVM могут отсутствовать.
Например, с сайта Sun можно скачать две разные версии JRE - US и International.
В US версии присутствует только минимум - ISO-8859-1, ASCII, Cp1252, UTF8, UTF16 и несколько вариаций двухбайтового Unicode.
Всё прочее есть только в International варианте.
Иногда из-за этого можно нарваться на грабли с запуском программы, даже если ей не нужны русские буквы.
Типичная ошибка, возникающая при этом:
Error occurred during initialization of VM
java/lang/ClassNotFoundException: sun/io/ByteToCharCp1251
Возникает она, как не трудно догадаться, из-за того, что JVM, исходя из русских региональных настроек пытается установить кодировку по умолчанию в Cp1251, но, т.к. класс поддержки таковой отсутствует в US версии, закономерно обламывается.