Поддерживаемые кодировки

«1С:Шина» поддерживает стандартные кодировки. Кодировка передается как параметр в методы, работающие с данными. Проще всего задать кодировку с помощью перечисления Кодировка, которое поддерживает следующие популярные кодировки:

  • Utf8,
  • Utf16,
  • Ascii,
  • Windows1251,
  • Cp866,
  • Koi8r,
  • Cp437,
  • Iso8859-1.

Элемент перечисления Кодировка можно получить по заданному псевдониму с помощью метода ПоПсевдониму:

ПоПсевдониму(Псевдоним: Строка): Кодировка

В типе Кодировка представлен расширенный список псевдонимов. Если указанный псевдоним не соответствует ни одной из поддерживаемых кодировок, выбрасывается ИсключениеНедопустимыйАргумент.

Кроме того, для элементов перечисления Кодировка доступно свойство Псевдоним, которое возвращает строку с главным псевдонимом кодировки.

Если перечисление Кодировка использовать невозможно, кодировку разрешается задать в виде строки:

пер СтрокаПримера = "Это пример строки"
пер БайтыСтрокиВAscii = СтрокаПримера.ВБайты(Кодировка.Ascii)
пер БайтыСтрокиВCesu8 = СтрокаПримера.ВБайты("cesu-8")
Имена, псевдонимы и краткие описания базовых поддерживаемых кодировок представлены в таблице ниже.
Примечание: Имена и псевдонимы кодировок нечувствительны к регистру.
Табл. 1. Базовые кодировки
Имя Псевдоним Описание
CESU-8 CESU8, csCESU-8 Разновидность UTF-8
GB18030 gb18030-2022, gb18030-2000 Упрощенный китайский
IBM00858 cp858, ccsid00858, cp00858, 858,

PC-Multilingual-850 + euro

Cp850 с европейскими символами
IBM437 cp437, ibm437, ibm-437, 437,

cspc8codepage437, windows-437

MS-DOS
IBM775 cp775, ibm775, ibm-775, 775 Балтийские языки в DOS
IBM850 cp850, ibm-850, ibm850, 850,

cspc850multilingual

Латинский алфавит 1 в MS-DOS
IBM852 cp852, ibm852, ibm-852, 852,

csPCp852

Латинский алфавит 2 в MS-DOS
IBM855 cp855, ibm-855, ibm855, 855,

cspcp855

Кириллица в DOS
IBM857 cp857, ibm857, ibm-857, 857,

csIBM857

Турецкий язык в DOS
IBM862 cp862, ibm862, ibm-862, 862,

csIBM862, cspc862latinhebrew

Иврит в DOC
IBM866 cp866, ibm866, ibm-866, 866,

csIBM866

Русский в MS-DOS
ISO-8859-1 iso-ir-100, ISO_8859-1, latin1, l1,

IBM819, cp819, csISOLatin1, 819, IBM-819,
ISO8859_1, ISO_8859-1:1987, ISO_8859_1,
8859_1, ISO8859-1

Латинский алфавит №1
ISO-8859-13 iso8859_13, 8859_13, iso_8859-13, ISO8859-13 Латинский алфавит №7
ISO-8859-15 ISO_8859-15, Latin-9, csISO885915, 8859_15,

ISO-8859-15, ISO8859_15, ISO8859-15,
IBM923, IBM-923, cp923, 923,
LATIN0, LATIN9, L9, csISOlatin0, csISOlatin9,
ISO8859_15_FDIS

Латинский алфавит №9
ISO-8859-16 iso-ir-226, ISO_8859-16:2001, ISO_8859-16,

latin10, l10, csISO885916

Латинский алфавит №10 или языки Юго-Восточной Европы
ISO-8859-2 iso8859_2, 8859_2, iso-ir-101, ISO_8859-2,

ISO_8859-2:1987, ISO8859-2,
latin2, l2, ibm912, ibm-912, cp912, 912,
csISOLatin2

Латинский алфавит №2
ISO-8859-4 iso8859_4, iso8859-4, 8859_4, iso-ir-110,

ISO_8859-4, ISO_8859-4:1988,
latin4, l4, ibm914, ibm-914, cp914, 914,
csISOLatin4

Латинский алфавит №4
ISO-8859-5 iso8859_5, 8859_5, iso-ir-144,

ISO_8859-5, ISO_8859-5:1988, ISO8859-5,
cyrillic, ibm915, ibm-915, cp915, 915,
csISOLatinCyrillic

Латинский алфавит/кириллица
ISO-8859-7 iso8859_7, 8859_7, iso-ir-126,

ISO_8859-7, ISO_8859-7:1987,
ELOT_928, ECMA-118,
greek, greek8, csISOLatinGreek, sun_eu_greek,
ibm813, ibm-813, 813, cp813, iso8859-7

Латинский/греческий алфавит
ISO-8859-9 iso8859_9, 8859_9, iso-ir-148,

ISO_8859-9, ISO_8859-9:1989, ISO8859-9,
latin5, l5, ibm920, ibm-920, 920, cp920,
csISOLatin5

Латинский алфавит №5
KOI8-R koi8_r, koi8, cskoi8r Русский
KOI8-U koi8_u Украинский
US-ASCII iso-ir-6, ANSI_X3.4-1986, ISO_646.irv:1991,

ASCII, ISO646-US, us, IBM367,
cp367, csASCII, default, 646, iso_646.irv:1983,
ANSI_X3.4-1968, ascii7

ASCII без национальных символов
UTF-16 UTF_16, utf16, unicode, UnicodeBig 16-битовое представление Юникода
UTF-16BE UTF_16BE, ISO-10646-UCS-2,

X-UTF-16BE, UnicodeBigUnmarked

UTF-16 с порядком байт big-endian
UTF-16LE UTF_16LE, X-UTF-16LE,

UnicodeLittleUnmarked

UTF-16 с порядком байт little-endian
UTF-32 UTF_32, UTF32 32-битовое представление Юникода
UTF-32BE UTF_32BE, X-UTF-32BE UTF-32 с порядком байт big-endian
UTF-32LE UTF_32LE, X-UTF-32LE UTF-32 с порядком байт little-endian
UTF-8 UTF8, unicode-1-1-utf-8 8-битовое представление Юникода
windows-1250 cp1250, cp5346 Языки Центральной и Восточной Европы в Windows
windows-1251 cp1251, cp5347, ansi-1251 Кириллица в Windows
windows-1252 cp1252, cp5348, ibm-1252, ibm1252 Латинский алфавит 1 в Windows
windows-1253 cp1253, cp5349 Греческий язык в Windows
windows-1254 cp1254, cp5350 Турецский язык в Windows
windows-1257 cp1257, cp5353 Балтийские языки в Windows
x-IBM737 cp737, ibm737, ibm-737, 737 Греческий язык
x-IBM874 cp874, ibm874, ibm-874, 874 Тайский язык
x-UTF-16LE-BOM UnicodeLittle 16-битовое представление Юникода с порядком байт little-endian и меткой порядка байтов
X-UTF-32BE-BOM UTF_32BE_BOM, UTF-32BE-BOM 32-битовое представление Юникода с порядком байт big-endian и меткой порядка байтов
X-UTF-32LE-BOM UTF_32LE_BOM, UTF-32LE-BOM 32-битовое представление Юникода с порядком байт little-endian и меткой порядка байтов