Журналістика даних — це спосіб доступно розповідати складні історії. Та для початківців це ще й чималий виклик. Центр журналістських розслідувань «Сила правди» у партнерстві з Фондом сприяння розвитку масових комунікацій і правовому просвітництву «Так-так-так» (Росія) та «Interlink Academy for International Dialog and Journalism» (Німеччина) створив брошуру «Як перетворити цифри на історію. Журналістика даних для “чайників”».
Упродовж двох місяців 2020-го команда «Сили правди» разом із учасниками з Новосибірська онлайн навчалася журналістиці даних в професіоналів цієї справи: Клауса Гесслінга (Claus Hesseling) та Даніеля Маркуса (Daniel Marcus) із «Interlink Academy», Євгенії Дроздової із texty.org.ua та медійного аналітика і викладача Києво-Могилянської академії Михайла Кольцова. Проект реалізовувався в рамках Програми Федерального міністерства закордонних справ Німеччини «Розширення співпраці з громадянським суспільством країн Східного партнерства і Росії».
Впродовж навчання учасники не лише проходили теорію, але й реалізовували навички на практиці. Таким чином «Сила правди» створила електоральну мапу Луцької громади та візуалізувала результати другого туру виборів мера Луцька в розрізі виборчих дільниць. Ще кілька проектів в процесі.
Крім того, за результатами навчання група українських та російських учасників створили брошуру «Як перетворити цифри на історію. Журналістика даних для “чайників”». Вона дає можливість дізнатися, як та з якими джерелами та інструментами працюють дата-журналісти, як слід структурувати та обробляти дані, а потім візуалізовувати отримані цифри. Брошура доступна російською мовою і стане корисною для тих, хто знайомиться чи планує опановувати журналістику даних. Нижче перший розділ, перекладений на українську.
Що таке журналістика даних? Як працюють дата-журналісти?
Журналістика даних (англ. Data journalism) — це вид журналістики, коли великі масиви даних оброблюються відповідними інструментами і тільки після цього стають частиною тієї чи тієї історії.
Саме таке визначення пропонує Хенк Ван Ісс — член найвідомішої транснаціональної команди розслідувачів «Bellingcat». Але чим є дата-журналістика в кінцевому вигляді, які інструменти потрібно освоїти для ефективної роботи з даними і як це зробити? Частина відповідей — на цих сторінках. Ще частина — виключно в досвіді, який вам належить отримати.
Журналістика даних спрямована на роботу з великими даними і їхню візуалізацію у підсумку. Це можуть бути графіки, діаграми, карти та інші форми візуалізації інформації, які не просто доповнюють історію, яку розповідає журналіст, а і є її основою.
Розвитку дата-журналістики сьогодні сприяють три основні чинники:
- доступність даних;
- можливість їх візуалізації, яку дають онлайн-медіа;
- «всюдисущість» комп’ютерів.
Все це додає в формулу класичної журналістики, що складається з двох елементів (журналіст = історія) ще два. У підсумку виходить схема «журналіст + інструменти / методи + ресурси = історія». Завдяки цьому можна доносити до аудиторії об’ємні масиви інформації, помітно спрощуючи їх.
Дата-журналіст, як і класичний, спочатку збирає інформацію, оброблює її і тоді створює візуалізацію та цілісну історію. Серед основних джерел для дата-журналістів можна виділити:
- публічні реєстри та портали;
- власні дослідження;
- державні структури;
- аналітичні центри;
- витік даних.
Важливий також формат зібраних даних, адже дата-журналістика неможлива без чисел і грамотного сортування інформації. Іноді ми отримуємо:
- дані, які спочатку потрібно перевести в числа;
- дані в таблицях (наприклад, XLS або CSV);
- числа, які потрібно перенести в таблиці;
- дані, зібрані за допомогою скрейпінгу («витягування» інформації з різних сайтів, за допомогою спеціального програмування);
- текстові аналізи.
Часто дані для одного матеріалу доводиться брати з різних джерел. Або ж джерело одне, але щось виявляється зайвим. У таких випадках журналіст зводить в таблицях необхідні для роботи дані і займається їхньою «чисткою». В цей процес входять фільтрація, очищення і підрахунки. Серед інструментів, якими це можна зробити, таблиці Excel або Google Sheets, Tabula (програма, яка отримує дані з таблиць в форматі PDF), мова програмування Pythone та інші.
Коли дані структуровані, всі калькуляції проведені і отримана статистика готова стати історією, її необхідно візуалізувати і перетворити в інфографіку. Для цього існує безліч онлайн-ресурсів та програм, кожен з яких має свої особливості. Але вибирати відповідний можна лише залежно від того, що вам потрібно показати і як саме ви хочете це зробити.