FUNES — это инструмент, созданный перуанским новостным сайтом Ojo Público для расследования государственных закупок: веб-сайт, поисковый сервер и хранилище информации по более чем 245 000 тендеров. Просто введите название организации или учреждения – и в мгновение ока алгоритм проверит сотни документов и в процентах рассчитает коррупционный риск.
FUNES уже сыграл ключевую роль во многих расследованиях Ojo Público. Например, в 2019 году портал сообщил, что главный поставщик молока в Перу был единственным участником в 90% выигранных им тендеров, и что правительство заплатило одной и той же организации более 70 миллионов долларов США.
Над созданием платформы коллектив из десятка сотрудников работал больше года. При поддержке гранта от инициативы ALTEC, журналисты, программисты, статистики и юристы образовали междисциплинарную команду чтобы более системно расследовать государственные закупки в Перу. В 2020 году этот инструмент завоевал премию Сигма — самую престижную награду в области журналистики данных — в категории «Инновации».
Откуда взялось название? «Фунес — чудо памяти» (дословно «Фунес — памятливый») это персонаж одноименного рассказа Хорхе Луиса Борхеса, обладавший так называемой «слоновьей памятью»: он помнил всё до малейших подробностей. Алгоритм создан в таком же духе. Этот инструмент обрабатывает тысячи документов и выявляет признаки сговора и коррупции: случаи, в которых чиновник связан с компанией и использует свои полномочия и влияние, чтобы выиграть тендер на государственные закупки.
Алгоритм FUNES уникален и основан на методологии, разработанной Михаем Фазекасом, доцентом Центральноевропейского университета: он занимается обработкой больших массивов данных и предлагает выявлять коррупцию по ряду индикаторов. Параметров этих более 20, у каждого свой весовой коэффициент, по ним за несколько секунд можно рассчитать коррупционный риск компании.
Этот инструмент опирается на четыре базы данных, содержащие более 245 000 документов. В нем анализируются записи о государственных закупках, спонсорах избирательных кампаний, списках поставщиков и даже публикации в официальном вестнике. По итоговому расчёту расставляются «красные флаги» — оповещения, с помощью которых Ojo Publico рассказывает истории, изобличающие случаи коррупции, и помогает продвигать изменения.
Эрнесто Кабрал, один из старших журналистов в проекте, рассказал, что FUNES не только сокращает время, необходимое на проведение расследования, но и даёт возможность лучше оценить систему закупок путём совмещения разных баз данных. По словам Нелли Луны, сооснователя и главного редактора Ojo Publico, FUNES — это не просто инструмент для журналистов, он позволяет «полнее осуществлять гражданский контроль».
За кулисами проекта
На реализацию проекта ушло немало времени. Информация, на которую опирается инструмент — это результат нескольких лет поиска и очистки данных, и создания ранее не существовавших баз. «Мы обращались к разным органам за доступом к их информации, а нам отвечали, что всё есть на сайте. Но там у них была только поисковая система, а не собственно база данных, которая нам была нужна», — объяснил Кабрал.
Поэтому команде пришлось писать скрипты, чтобы скачать информацию, которая не выкладывалась в открытый доступ на государственных сайтах, но была крайне важна для проводимых редакцией расследований. Получить сведения о закупках оказалось тоже непросто: «С органом надзора за государственными закупками было и того хуже: когда они определили наш IP-адрес, то просто его заблокировали. Это было как раз самое сложное», — сказал Кабрал.
Следующим вызовом стало упорядочивание и очистка данных. Хотя ранее команда уже работала над историями, основанными на данных, но с настолько большим объёмом информации сразу из нескольких источников она ещё не сталкивались.
Алгоритм FUNES предусматривал и процесс одновременного тестирования данных, которые Ojo Público упорядочивали и загружали на платформу.
Ключевым компонентом построения алгоритма была валидация результатов работы. Она позволяла скорректировать коэффициент значимости разных индикаторов, чтобы точнее отражать латиноамериканский контекст. Например, как рассказал Кабрал, они увеличили вес переменной «спонсорство избирательной кампании» в оценке коррупционного риска. Также пришлось корректировать, как алгоритм оценивал региональные закупки: «FUNES изначально придавал большее значение местным органам власти просто из-за количества договоров у них, но позже мы увидели, что министерство может сделать всего три закупки, но на большую сумму, чем все те контракты на местах.»
Поскольку Партнерство «Открытые закупки» (OCP) (Open Contracting Partnership) также разработало систему «красных флажков» для выявления коррупционных рисков и неэффективности закупок, Ojo Público использовали эту модель, чтобы ещё раз проверить свой алгоритм. «Мы проанализировали те же данные по модели ОСР, и, когда получили те же результаты, это был знак, что мы на правильном пути,» — сказал Кабрал. Партнерство «Открытые закупки» в схеме выявления учитывает среди прочих элементов:
- Короткий период проведения тендера.
- Малое количество участников.
- Низкий процент закупок, проведённых конкурентным путём.
- Высокий процент закупок с дальнейшим изменением условий.
- Большие отличия первоначальной суммы тендера от финальной цены договора.
Анализ собственных стереотипов
FUNES также существенно повлиял на журналистов, которые занимались его внедрением: «Результаты, которые выдаёт алгоритм, отразили наши прежние стереотипы… мы увидели свою предубеждённость,» — рассказал Кабрал. «Кажется, что коррупционный риск выше всего у такого-то учреждения, а анализ показывает что-то совершенно иное. В такой момент [при разработке инструмента] пришлось проверять, действительно ли дело в наших предубеждениях или стоит скорректировать весовые коэффициенты индикаторов.»
Длительность проекта также усложнила работу: «Целый год мы всё своё время посвящали этой задаче, и нужно было поддерживать темп, энергию и мотивацию команды,» — отметил один из участников проекта.
Автоматизация и новые истории
«Предстоит рассказать ещё много историй,» — комментирует Кабрал использование FUNES. «В планах у нас также автоматизация процесса загрузки данных на платформу.» Кризис с COVID-19 повлиял на работу редакций по всему миру, и в то же время показал важность расследований государственных закупок средствами массовой информации.
Для Кабрала текущий кризис стал поворотным моментом: «Во время пандемии стало ясно. что закупки это не что-то абстрактное, они влияют на людей. Например, если есть коррупционная составляющая в тендере на закупку масок, то через несколько дней многие люди могут погибнуть. Пандемия подчеркнула непосредственную взаимосвязь тендеров и нарушения прав человека, особенно для самых уязвимых групп населения.»
FUNES теперь играет основополагающую роль в расследованиях, проводимых Ojo Público в рамках сети RED PALTA — альянса латиноамериканских СМИ, изучающих государственные закупки.
Каков же главный вывод можно сделать благодаря FUNES? «Мы, журналисты, привыкли расследовать отдельные договора,» — говорит Кабрал. «И тогда в результате могут снять коррумпированного чиновника, но сама коррумпированная система продолжит работать. Поэтому нужно сказать: «Давайте рассматривать не один случай, и не десяток — давайте сфокусируемся на 200 000 и найдем общую схему во всех.» Вот, что делает FUNES. Так можно целостно рассматривать систему, чтобы эффективнее бороться с коррупцией в государственных закупках.»
Ромина Колман – журналистка из Буэнос-Айреса, Аргентина. Она работает в дата-группе в ежедневной национальной газете La Nación, а ранее была стипендиатом Chevening. Она также преподает журналистику данных в Папском католическом университете Аргентины.