Документ не вступил в силу. Подробнее см. Справку

V. Описание формата разметки текстов правовых актов на структурные единицы в интегрированном полнотекстовом банке правовой информации

V. Описание формата разметки текстов правовых актов

на структурные единицы в интегрированном полнотекстовом

банке правовой информации

13. Разметкой текста акта должна определяться:

1) структурная единица;

2) номер структурной единицы (при наличии);

3) наименование структурной единицы (при наличии);

4) начало и конец структурной единицы в тексте;

5) верхнеуровневые структурные единицы (при наличии).

14. Разметка текста акта на структурные единицы (далее - разметка) в интегрированном полнотекстовом банке правовой информации формируется отдельным элементом, не встраиваемым внутрь текста акта.

15. Разметка текста акта на структурные единицы хранится в информационном фонде банка правовых актов. Связь разметки и текста акта осуществляется через уникальные идентификаторы элементов HTML-текста.

16. Уникальные идентификаторы присваиваются в тексте акта следующим элементам HTML:

1) абзац - <p>;

2) таблица - <table>;

3) строка таблицы - <tr>.

17. Разметка должна быть представлена в виде элемента формата JSON, содержащего массив объектов.

18. Каждый объект массива должен определять одну структурную единицу текста правового акта.

19. Объект разметки текста правового акта должен содержать пять пар "ключ-значение", определяющих свойства структурной единицы:

1) id - уникальный идентификатор структурной единицы (строковое значение);

2) np - уникальный идентификатор элемента HTML-текста, с которого начинается структурная единица в тексте акта (строковое значение);

3) npe - уникальный идентификатор элемента HTML-текста, которым заканчивается структурная единица в тексте акта (строковое значение);

4) caption - наименование структурной единицы (наименование из текста акта для крупных структурных единиц или обозначение и номер структурной единицы, не имеющей наименования в тексте акта) (строковое значение);

5) unit - обозначение структурной единицы (строковое значение);

6) lvl - уровень вложенности структурной единицы (числовое значение).

20. Объект разметки текста акта должен представляться следующим образом:

{"id":"h1_a2","np":"p10","npe":"p17","caption":"Статья 2. Понятия, применяемые в настоящем Федеральном законе", "unit":"статья","lvl:1}

21. Ключ "id" представляется аббревиатурой, расшифровка которой позволяет определить структурную единицу, ее номер (при наличии в тексте) и все структурные единицы, в которые входит текущая структурная единица.

Аббревиатура для каждой структурной единицы отделяется от других символом подчеркивания "_". Структурные единицы в идентификаторе должны следовать в порядке убывания - от верхнеуровневой до текущей.

Аббревиатура для каждой структурной единицы должна состоять из первого буквенного символа, определяющего структурную единицу, и последующих символов, определяющих номер структурной единицы.

22. Используются следующие буквенные символы для обозначения структурных единиц:

1) b - часть;

2) s - раздел;

3) d - подраздел;

4) h - глава;

5) g - параграф (§);

6) r - подпараграф;

7) a - статья;

8) u - приложение;

9) z - утверждаемое приложение (не имеющее по тексту обозначения "Приложение");

10) c - часть (статьи);

11) j - пункт;

12) k - подпункт.

23. При обозначении структурных единиц текста акта допускается использовать следующие виды нумерации:

1) римские цифровые номера (I, V и т.д.);

2) арабские цифровые номера (1, 2, 55 и т.д.);

3) при наличии в номере числового значения с верхним индексом (23, 4I5) начало верхнего индекса обозначается двоеточием ":", конец верхнего индекса обозначается символом "~";

4) при нумерации буквами русского алфавита номер начинается с дефиса "-", далее следует порядковый номер буквы в русском алфавите (начиная с 1);

5) ненумерованным структурным единицам (приложения, разделы и др.) присваивается условный номер, который обозначается первой буквой "F" и числом.

24. Ключ "id" должен представляться следующим образом:

sI_hl_al_c3_j2:l - пункт 21 части 3 статьи 1 главы 1 раздела I.

25. Ключи "np" и "npe" должны представляться строковыми значениями из первой латинской буквы и числа.

26. Ключи "np" и "npe" должны отображаться следующим образом:

p10, p45, t2, tr230.

27. Ключ "caption" должен соответствовать наименованию структурной единицы в тексте правового акта при его наличии.

28. Структурные единицы (статья, часть, пункт, подпункт) не должны иметь наименований. Для них в объекте разметки используется условное наименование для корректного отображения при показе оглавления текста. Значение условного наименования начинается со знака "$".

29. При наличии в наименовании надстрочных символов используется стандартный тег HTML <sup></sup>.

30. Ключ "caption" формируется следующим образом:

"РАЗДЕЛ I. ОБЩИЕ ПОЛОЖЕНИЯ

Статья 1. Предмет регулирования настоящего Кодекса

Статья 10

часть 4 (хранится как "$часть 4")

пункт 21 (хранится как "$пункт 2<sup>1</sup>")".

31. Ключ "unit" должен содержать обозначение структурной единицы: раздел, подраздел, глава, приложение, пункт и т.п.

32. Ключ "lvl" должен содержать уровень вложенности структурной единицы. Отсчет уровня начинается с 0.