Открытые данные — штука важная, но есть в этой всей этой истории одна любопытная особенность: к самим данным, чистым и непредвзятым цифрам, мало кто обращается, большинство смотрит на визуальные представления и интерпретации, которые уже не всегда так чисты.
Хороший пример, недавно начавший циркулировать в англоязычной блогосфере. Эта гистограмма, опубликованная в Wall Street Journal ясно показывает, что львиную долю денег в США зарабатывают люди, имеющие доход от 100 до 200 тысяч долларов в год. Тезис статьи — крепкий средний класс получает все, остальные так, постольку-поскольку. Статья политическая — она направлена на торпедирование идеи Обамы несколько увеличить налогообложение богачей и существенно пополнить бюджет. WSJ рисует эту диаграмму и вопрошает: ну что, много ли получим от этих дополнительных налогов с богатых, если базовые доходы собирает средний класс.
Но это передергивание фактов, которое получили очень простым способом: доходы немногочисленной группы людей, которые зарабатывают больше 200 000$ в год размазали по искусственно созданным 7 группам, вместо того, чтобы объединить в одну категорию богачей. Ну в две, максимум. Если это сделать, то картинка получится другой:
Хм, на фоне общих доходов самых богатых людей Америки, классический средний класс выглядит скромно — особенно, если сравнить численность этих двух социальных групп. (обе диаграммы и вся история взята отсюда).
Это очень простой случай. Когда иллюстрируются большие объемы данных, простор для толкований намного шире, и журналистика данных становится весьма гибким инструментом. Поэтому open data никогда не станут залогом прозрачности и подотчетности, только предпосылкой.