Перейти к основному содержимому

Поддерживаемые кодировки

«1С:Предприятие.Элемент Скрипт» поддерживает стандартные кодировки. Кодировка передается как аргумент в методы, работающие с данными. Проще всего задать кодировку с помощью перечисления Кодировка, которое поддерживает следующие популярные кодировки:

  • Ascii,
  • Cp437,
  • Cp866,
  • Iso8859-1,
  • Koi8r,
  • Utf8,
  • Utf16,
  • Windows1251.

Элемент перечисления Кодировка можно получить по заданному строковому псевдониму с помощью метода ПоПсевдониму(Псевдоним: Строка): Кодировка. Например:

пер Кодировка = Кодировка.ПоПсевдониму("unicode-1-1-utf-8") // Utf8

В перечислении Кодировка представлен расширенный список псевдонимов. Если указанный псевдоним не соответствует ни одной из поддерживаемых кодировок, выбрасывается исключение ИсключениеНедопустимыйАргумент.

Кроме того, для элементов перечисления Кодировка доступно свойство Псевдоним, которое возвращает строку с главным псевдонимом кодировки:

пер Кодировка = Кодировка.Iso8859_1.Псевдоним // Latin1

Если перечисление Кодировка использовать невозможно, кодировку разрешается задать в виде строки:

пер СтрокаПримера = "Это пример строки"
пер БайтыСтрокиВAscii = СтрокаПримера.ВБайты(Кодировка.Ascii)
пер БайтыСтрокиВCesu8 = СтрокаПримера.ВБайты("cesu-8")

Имена, псевдонимы и краткие описания базовых поддерживаемых кодировок представлены в таблице ниже.

примечание

Имена и псевдонимы кодировок нечувствительны к регистру.

ИмяПсевдонимОписание
CESU-8CESU8, csCESU-8Разновидность UTF-8
GB18030gb18030-2022, gb18030-2000Упрощенный китайский
IBM00858cp858, ccsid00858, cp00858, 858, PC-Multilingual-850 + euroCp850 с европейскими символами
IBM437cp437, ibm437, ibm-437, 437, cspc8codepage437, windows-437MS-DOS
IBM775cp775, ibm775, ibm-775, 775Балтийские языки в DOS
IBM850cp850, ibm-850, ibm850, 850, cspc850multilingualЛатинский алфавит 1 в MS-DOS
IBM852cp852, ibm852, ibm-852, 852, csPCp852Латинский алфавит 2 в MS-DOS
IBM855cp855, ibm-855, ibm855, 855, cspcp855Кириллица в DOS
IBM857cp857, ibm857, ibm-857, 857, csIBM857Турецкий язык в DOS
IBM862cp862, ibm862, ibm-862, 862, csIBM862, cspc862latinhebrewИврит в DOC
IBM866cp866, ibm866, ibm-866, 866, csIBM866Русский в MS-DOS
ISO-8859-1iso-ir-100, ISO_8859-1, latin1, l1,IBM819, cp819, csISOLatin1, 819, IBM-819, ISO8859_1, ISO_8859-1:1987, ISO_8859_1, 8859_1, ISO8859-1Латинский алфавит №1
ISO-8859-13iso8859_13, 8859_13, iso_8859-13, ISO8859-13Латинский алфавит №7
ISO-8859-15ISO_8859-15, Latin-9, csISO885915, 8859_15, ISO-8859-15, ISO8859_15, ISO8859-15, IBM923, IBM-923, cp923, 923, LATIN0, LATIN9, L9, csISOlatin0, csISOlatin9, ISO8859_15_FDISЛатинский алфавит №9
ISO-8859-16iso-ir-226, ISO_8859-16:2001, ISO_8859-16, latin10, l10, csISO885916Латинский алфавит №10 или языки Юго-Восточной Европы
ISO-8859-2iso8859_2, 8859_2, iso-ir-101, ISO_8859-2, ISO_8859-2:1987, ISO8859-2, latin2, l2, ibm912, ibm-912, cp912, 912, csISOLatin2Латинский алфавит №2
ISO-8859-4iso8859_4, iso8859-4, 8859_4, iso-ir-110, ISO_8859-4, ISO_8859-4:1988, latin4, l4, ibm914, ibm-914, cp914, 914, csISOLatin4Латинский алфавит №4
ISO-8859-5iso8859_5, 8859_5, iso-ir-144, ISO_8859-5, ISO_8859-5:1988, ISO8859-5, cyrillic, ibm915, ibm-915, cp915, 915, csISOLatinCyrillicЛатинский алфавит/кириллица
ISO-8859-7iso8859_7, 8859_7, iso-ir-126, ISO_8859-7, ISO_8859-7:1987, ELOT_928, ECMA-118, greek, greek8, csISOLatinGreek, sun_eu_greek, ibm813, ibm-813, 813, cp813, iso8859-7Латинский/греческий алфавит
ISO-8859-9iso8859_9, 8859_9, iso-ir-148, ISO_8859-9, ISO_8859-9:1989, ISO8859-9, latin5, l5, ibm920, ibm-920, 920, cp920, csISOLatin5Латинский алфавит №5
KOI8-Rkoi8_r, koi8, cskoi8rРусский
KOI8-Ukoi8_uУкраинский
US-ASCIIiso-ir-6, ANSI_X3.4-1986, ISO_646.irv:1991, ASCII, ISO646-US, us, IBM367, cp367, csASCII, default, 646, iso_646.irv:1983, ANSI_X3.4-1968, ascii7ASCII без национальных символов
UTF-16UTF_16, utf16, unicode, UnicodeBig16-битовое представление Юникода
UTF-16BEUTF_16BE, ISO-10646-UCS-2, X-UTF-16BE, UnicodeBigUnmarkedUTF-16 с порядком байт big-endian
UTF-16LEUTF_16LE, X-UTF-16LE, UnicodeLittleUnmarkedUTF-16 с порядком байт little-endian
UTF-32UTF_32, UTF3232-битовое представление Юникода
UTF-32BEUTF_32BE, X-UTF-32BEUTF-32 с порядком байт big-endian
UTF-32LEUTF_32LE, X-UTF-32LEUTF-32 с порядком байт little-endian
UTF-8UTF8, unicode-1-1-utf-88-битовое представление Юникода
windows-1250cp1250, cp5346Языки Центральной и Восточной Европы в Windows
windows-1251cp1251, cp5347, ansi-1251Кириллица в Windows
windows-1252cp1252, cp5348, ibm-1252, ibm1252Латинский алфавит 1 в Windows
windows-1253cp1253, cp5349Греческий язык в Windows
windows-1254cp1254, cp5350Турецский язык в Windows
windows-1257cp1257, cp5353Балтийские языки в Windows
x-IBM737cp737, ibm737, ibm-737, 737Греческий язык
x-IBM874cp874, ibm874, ibm-874, 874Тайский язык
x-UTF-16LE-BOMUnicodeLittle16-битовое представление Юникода с порядком байт little-endian и меткой порядка байтов
X-UTF-32BE-BOMUTF_32BE_BOM, UTF-32BE-BOM32-битовое представление Юникода с порядком байт big-endian и меткой порядка байтов
X-UTF-32LE-BOMUTF_32LE_BOM, UTF-32LE-BOM32-битовое представление Юникода с порядком байт little-endian и меткой порядка байтов