Волонтеры расшифровали декларации Федерального собрания 2017 года

26.04.2018

В базе проекта «Декларатор» появились данные о доходах и имуществе депутатов Государственной Думы и членов Совета Федерации за 2017 год. Думские декларации впервые были импортированы в нашу базу в автоматическом режиме при помощи парсера.


Антикоррупционные декларации российских парламентариев за 2017 год обнародованы 13 апреля. Декларации сенаторов обработали пять волонтеров за два дня. Эта работа затруднялась тем, что Совет Федерации публикует данные в очень  специфическом формате, сложном для восприятия человеком. Но поскольку сенаторов не так много, ручная обработка остается единственным возможным решением.

 

Иная ситуация с Государственной Думой. Во-первых, здесь в три раза больше депутатов. Во-вторых, думский сайт предоставлял сведения о доходах депутатов за предыдущее годы в виде HTML, которую легко распарсить. Однако на новом сайте нижней палаты мы обнаружили и новые, и старые декларации в формате PDF, парсинг которых существенно затруднен. Благо старый сайт продолжает работать, и на нем были опубликованы HTML-таблицы. Волонтер «Декларатора», студент НИУ ВШЭ Азим Вишняков подготовил парсер, который сформировал набор данных в формате json, пригодный для импорта в базу «Декларатора».

 

После этого остается ассоциировать импортированные данные с профилем депутата — это делается по-прежнему вручную. Однако обработка деклараций в таком режиме происходит гораздо быстрее.

 

Унифицированные и гармонизированные данные антикоррупционных деклараций членов российского парламента, равно как и других публичных должностных лиц, доступны на сайте «Декларатора» или через API проекта.


Другие записи в блоге