Роль поисковых ресурсов в проектах журналистов-расследователей из разных стран

datamining

  За последние несколько лет мы убедились в том, каким большим подспорьем в расследовательской журналистике могут быть современные ресурсы по поиску информации и документов. Технически подкованные журналистские организации, например OCCRP и Международный консорциум журналистов-расследователей (ICIJ — The International Consortium of Investigative Journalists), не раз объединяли усилия для работы над резонансными международными проектами, такими как расследования OCCRP афер по отмыванию денег или репортажи ICIJ об «офшорном закулисье». Более того, на сегодня OCCRP собственными усилиями смог создать такие ресурсы, как Карты связей (VIS), Информационный портал расследователя (Investigative Dashboard) и Overview.

Однако нам есть еще над чем работать. Что касается существующих компьютерных программ в помощь журналистам-расследователям, то здесь есть масса «дублирований», при этом все возможности отнюдь не исчерпаны. Множество мелких грантов на технические разработки привели к появлению большого количества новых инструментов, однако очень немногие из них завоевали популярность. Стоит сказать, что только для анализа соцсетей создано более 70 программ. Предлагаются инструменты и для иных видов исследований, а также для обработки документов, фильтрации данных и многого другого. Большинство этих ресурсов имеют открытый исходный код и находятся в разной степени завершенности, пользовательской пригодности и окончательного внедрения. Разработчики часто лишены самого необходимого: возможности тестировать потребительские свойства программ, использовать гибкие методологии разработки, а также не имеют бизнес-плана, чтобы обеспечить своему продукту «долгую жизнь». Многие такие инструменты в итоге прекрасно демонстрируют, как делать не надо.

Такая разобщенность при разработке ресурсов для журналистов-расследователей имеет свои последствия: сотрудники большинства редакций новостных служб лишены возможности управлять информацией на базовом уровне, например, создавать каталог электронных документов с функцией последующего поиска. Имеющиеся инструменты не выполняют своей задачи или не «заточены» под взаимодействие друг с другом. В итоге работа журналистов продвигается медленнее, с большими затратами или вообще заходит в тупик. До сегодняшнего дня производители коммерческих программ сторонятся сферы расследовательской журналистики ввиду ее специфики и малого числа потребителей. Такие ресурсы, как Nuix и Palantir, стоят дорого, слабо интегрированы и не могут быть расширены под задачи конкретного журналистского проекта.

Однако раз журналисты-расследователи научились сотрудничать на уровне международных профессиональных объединений, то и разработчики «профильных» программ тоже могут наладить контакт. Опыт «информационно насыщенных» журналистских проектов с привлечением многих участников позволяет OCCRP и другим заинтересованным организациям выделить некоторые наиболее важные аспекты.

Польза и практичность. Мы больше не можем позволить себе создавать программные продукты, которые остаются невостребованными. Ведь сегодня у большинства журналистов-расследователей под рукой нет технических ресурсов даже для таких несложных задач, как ввод новой информации в общую цифровую базу данных, просмотр документов, внесение заметок или поиск списков с названиями компаний. Чтобы журналисты могли быстрее делать свою работу, нам нужно четко представлять ее ключевые элементы и иметь для них технические решения, а для этого требуется постоянный живой контакт с пользователями и регулярное тестирование. Только после того как такая «инфраструктурная основа» будет обеспечена, можно добавлять к ней более сложные компоненты.

Оптимальное техническое оформление. Для начала мы должны действовать не как разработчики, а как системные интеграторы, и заниматься главным образом объединением существующих платформ в ресурсы, понятные и полезные даже «непродвинутым» пользователям. Так мы сможем понять на практике, какой новый код необходимо написать. Опыт учит нас, что важно поддерживать как основной сайт (его наличие снимает многие барьеры для использования), так и отдельно функционирующие ресурсные сайты (многие используют их из соображений безопасности).

Обмен данными для расследований. Журналисты должны знать, есть ли у их коллег или у других организаций нужная им информация о персоналиях и компаниях, а для этого необходим объединенный поисковый ресурс. Если запрос выявил наличие сведений, журналист может обсудить возможность получения оригинальных материалов. Такой двухэтапный процесс стал известен как принцип «поделитесь подноготной» (‘Who’s got dirt?’ model), по поводу которого в среде журналистов-расследователей существует широкий консенсус.

Рациональность. Но кто будет платить за все эти технические возможности, когда не будет спонсоров? Мы считаем справедливым, если с самого начала будет покрыта хотя бы малая часть расходов, другими словами, выступаем за подход, когда программное обеспечение рассматривается как платный сервис (software-as-a-service pricing). Это не позволит сразу покрывать текущие затраты, связанные с разработкой, однако даст возможность понять, за что люди готовы отдать деньги, что очень важно с точки зрения поиска новых потребителей. Мы считаем, что этот аспект игнорировался слишком долго.

Операционная совместимость и возможность расширения. Портал Influence Mappers — пример ресурса, который задает универсальные и взаимоприемлемые стандарты для работы со структурированными данными, например, из соцсетей. Он заслуживает нашей всяческой поддержки. Исследование показало колоссальную пользу ресурса для конкретных проектов с учетом возможности расширения прикладного программного интерфейса. Сама же программная начинка должна иметь открытый исходный код, чтобы обеспечить участие других и не допустить монопольного положения разработчика по отношению к пользователям.

Итак, мы за то, чтобы воплотилась идея общей интегрированной ресурсной базы для журналистов-расследователей — идея, о которой говорят уже достаточно давно. Шансы на то, что такая информационная архитектура появится, серьезно повысились благодаря двум факторам. Первое: эту идею сегодня обсуждает «критическая масса» разработчиков и пользователей. Второе: удачные решения существующих ресурсов помогают определить нужный объем и содержание такого проекта. Его потенциально важные элементы нами уже созданы, ясны пути достижения операционной совместимости.

Благодаря своей рассылке The Influence Mappers удалось объединить всех, кто активно интересуется вопросами журналистского анализа соцсетей. Теперь ресурс занят выработкой стандартов обмена данными. В свою очередь портал OpenCorporates продолжает развиваться в качестве базового хранилища сведений о регистрации компаний. Информационный портал расследователя (Investigative Dashboard) зарекомендовал себя как эффективный поисковый сервер для европейских журналистов и сейчас бросил все силы на решение проблемы хранения больших объемов данных. Document Cloud подтверждает свою популярность как хранилище документов и удобная платформа для размещения публикаций. Ресурс Overview демонстрирует возможности гибкого и глубокого анализа больших массивов документов, чему служит дополнительный модуль визуализации прикладного программного интерфейса (visualization plugin API). В целом же журналисты в самых разных частях света наработали хороший опыт международного взаимодействия — так, была всеми признана ценность подхода «поделитесь подноготной» для целей консолидированного поиска данных.

Еще многое предстоит сделать в плане пользовательских качеств уже существующих продуктов, в плане взаимодействия между командами разработчиков, обеспечения перспектив работы ресурсов и т. д. Однако указанные выше общие задачи стали отправной точкой в этом движении. Нами движут не несбыточные желания — мы хотим получить четко определенный функционал с набором уже прошедших тестирование ключевых элементов.

В качестве ближайшей цели мы ставим проведение скромной встречи — нашей самой первой конференции по теме управления информацией в расследовательской журналистике. На мероприятии ведущие разработчики и журналисты будут оттачивать формулировки задач и вырабатывать план действий. OCCRP и участники проекта Influence Mappers уже заявили, что готовы принять в этом активное участие. Так что следите за новостями!

Впрочем, отдача от наших усилий уже есть. Черновик этого информационного письма мы распространили среди тех, кто имеет прямое отношение к OCCRP, Глобальной сети расследовательской журналистики (The Global Investigative journalism Network), ICIJ, Overview, Document Cloud, Global Witness и Open Corporates. Общая реакция была такова, что мы правильно обозначили проблему и она требует решения. Мы все договорились, что будем активно контактировать, чтобы понять, что нам необходимо и как это сделать. Мы будем рады, если такая работа будет интересна и вам — дайте нам знать!

 

— Джонатан Стрей — Overview (jonathanstray@gmail.com)

— Дрю Салливан — OCCRP  (drew@occrp.org)