Просто о сложном: как сделать законы понятными

Фото: iStock
Фото: iStock

С каждым годом язык нормативных актов становится все сложнее, и даже юристам зачастую нелегко разобраться в его хитросплетениях. При этом в большинстве случаев то же самое содержание можно выразить гораздо проще. Ученые Вышки создали инструмент, который помогает сделать это с помощью средств компьютерной лингвистики. Он может быть полезен как студентам и преподавателям в ходе обучения юридическому письму, так и практикующим юристам при разработке нормативно-правовых актов или иных юридических документов.

Доцент факультета права, старший научный сотрудник Института государственного и муниципального управления НИУ ВШЭ Александр Чаплинский выступил на семинаре «Большие данные в юридическом образовании», организованном Центром трансформации юридического образования НИУ ВШЭ. Тема его доклада «Анализ сложности текстов НПА: на стыке права и компьютерной лингвистики» основана на результатах проекта «Язык в социуме: синтаксис нормативно-правовых актов», реализуемого в рамках Большого проекта НИУ ВШЭ «Речевые практики российского общества: профессиональная и социокультурная перспективы».

Александр Чаплинский

«Вопрос о языке правовых актов в последнее время входит в довольно популярную сферу исследований. Это неслучайно, потому что правовые нормы выражаются через язык, и от того, насколько качественный этот язык, во многом зависит возможность хорошо, правильно и эффективно применять эти нормы», — отметил Александр Чаплинский.

Он рассказал об исследовании, посвященном данной теме. Для измерения синтаксической сложности текстов НПА ученые разработали собственную методику, так как существующие имеют ряд недостатков, в том числе таких, как использование ограниченного набора синтаксических параметров (метрик).

На первом этапе исследователи собрали корпус федеральных законов. Интересно, что уже на этом шаге стала отчетливо видна тенденция к увеличению объема нормативного текста.

Общее количество действующих федеральных законов (за вычетом законов о внесении изменений) выросло с 1991 по 2020 год почти в 3 раза: с 207 до 615. Среднее количество слов в каждом законе за тот же период времени выросло в 2,5 раза (с 4970 до 12 544), а среднее количество слов в статье закона — также в 3 раза (с 96 до 296).    

На втором этапе ученые с помощью средств компьютерной лингвистики провели синтаксический анализ собранного корпуса федеральных законов. Исследователи смогли определить средние значения по девяти параметрам, начиная от простых (например, среднее количество слов в предложении, в абзаце, доля глаголов в общем количестве слов) и заканчивая более сложными для подсчета (например, расстояние между зависимыми словами). Почти все параметры продемонстрировали рост, в том числе некоторые метрики показали значительное увеличение. Например, среднее количество причастных оборотов после определяемого слова выросло с 0,3 до 0,5 в одном предложении. Для сравнения: этот же параметр для романа Л.Н. Толстого «Анна Каренина» составляет 0,04.

На третьем этапе ученые провели эксперимент, в котором участвовали две группы: в первой были профессиональные юристы, а во второй — студенты ВШЭ и МГУ. Их просили прочитать 10 фрагментов текстов законов, один из которых был простой (в нем значения всех измеряемых метрик не превышали средние значения по корпусу законодательства). Каждый из остальных девяти фрагментов был подобран так, чтобы в нем по одному из синтаксических параметров было значительное превышение над средними показателями по тексту всех законов. Участников эксперимента просили оценить сложность всех фрагментов по пятибалльной шкале.

«Нам нужно было определить, как сами профессиональные читатели-юристы воспринимают те или иные метрики. То есть насколько для них текст с высокими или низкими показателями по соответствующим метрикам является сложным или простым», — отметил Александр Чаплинский. Кроме того, чтобы определить корректность выставленной оценки, испытуемым задавали контрольные вопросы на понимание смысла прочитанного текста.

В итоге ученые смогли определить, что некоторые оцениваемые синтаксические параметры (например, среднее количество деепричастных оборотов в одном предложении) не влияют на сложность текста. Для остальных метрик исследователи рассчитали коэффициент значимости и разработали индекс синтаксической сложности нормативных правовых актов (ИСЗ, то есть индекс сложности законодательства). Он позволяет определить интегральную оценку сложности текста на основе средних и максимальных значений метрик в статьях анализируемого НПА.

Фото: iStock

Среднее значение ИСЗ для федеральных законов составило 40 баллов. Наиболее сложные законы имели показатель 65 баллов, а самый простой — 16 баллов. В качестве иллюстрации в докладе приведены показатели ИСЗ некоторых важных для малого бизнеса и простых людей, не являющихся юристами, федеральных законов. Например, Градостроительный кодекс — 53 балла, Земельный кодекс — 45 баллов, Кодекс об административных правонарушениях — 43 балла, Трудовой кодекс — 37 баллов, Закон РФ «О защите прав потребителей» — 36 баллов, Семейный кодекс – 32 балла.

Для сравнения Александр Чаплинский привел показатели ИСЗ, рассчитанные для некоторых художественных и философских произведений. Например, синтаксическая сложность Земельного кодекса Российской Федерации почти в 4 раза выше, чем у повести А.П. Чехова «Каштанка» (12 баллов), в 3 раза выше, чем у уже упомянутого романа «Анна Каренина» (16 баллов), и лишь чуть-чуть ниже, чем у знаменитого труда И. Канта «Критика чистого разума». Такие высокие показатели представляют проблему, превращая чтение НПА в тяжелое испытание даже для юристов. 

Исследователи выяснили, что язык нормативных актов с каждым годом становится все сложнее. Так, если в 1991 году среднее значение ИСЗ для действующих законов составляло 30,8 балла, то к 2020 году оно выросло почти на 30% и достигло показателя 40,1 балла. Автор доклада отметил, что это связано в том числе с активным внесением в законы изменений и дополнений.

В среднем в каждый действующий закон с момента его принятия вносилось порядка 20 изменений, и в большинстве случаев последняя редакция является более сложной по сравнению с исходной. Согласно расчетам ученых, каждое изменение закона приводит к росту ИСЗ на 0,1 балла.

НАШ ОПЫТ РАБОТЫ С НОРМАТИВНЫМИ АКТАМИ ПОКАЗЫВАЕТ, ЧТО ЛЮБАЯ “ЗАПЛАТКА” В СРЕДНЕМ ЯВЛЯЕТСЯ БОЛЕЕ СЛОЖНОЙ, ЧЕМ ТЕКСТ, НАПИСАННЫЙ С НУЛЯ.
Александр Чаплинский

Помимо научной ценности, исследование имеет и вполне практическую значимость. В 2022 году ученые Вышки разработали Методические рекомендации по повышению удобочитаемости текстов. Документ содержит набор правил, а также пояснения, почему каждое правило важно, негативные образцы речевых практик и рекомендуемые варианты их исправления. Так, ученые предлагают использовать краткие и емкие термины, короткие и простые предложения, компактное расположение пар «подлежащее — сказуемое», меньше повторов и умеренное количество причастных оборотов. В методических рекомендациях также подчеркивается, что новый нормативный акт всегда лучше, чем «лоскутное одеяло», в которое превращается НПА после многократных изменений и дополнений.

Кроме того, Александр Чаплинский продемонстрировал работу специального программного средства, которое позволяет оценить сложность любого текста. Оно размещено в открытом доступе на сайте ВШЭ и может быть полезно студентам, преподавателям и практикующим юристам. «Это средство позволяет загрузить текст, оценить показатель сложности, переписать текст, отредактировать, исправить и посмотреть, упростился ли он. Если да, то насколько», — рассказал Александр Чаплинский.

Помимо анализа языка нормативно-правовых актов, команда проекта планирует уделить внимание лингвистическим особенностям судебных решений. Также среди перспективных исследований — язык договоров и даже устный язык юристов. В этой сфере еще много свободного места для открытий, подчеркнул ученый.

Дата публикации: 02.05.2023

Автор: Марина Полякова

Будь всегда в курсе !
Подпишись на наши новости: