Новая серия больших материалов: как разные страны делали свои главные порталы открытых данных.
Портал открытых данных США Data.gov был запущен в мае 2009 года. Цель портала – улучшить доступ к высокоценным данным в машиночитаемом формате федеральных органов власти. В момент запуска было опубликовано 46 наборов данных и 27 механизмов федеральных ведомств.
Параллельно с запуском data.gov стартовала площадка для обсуждения и совместной разработки концепции портала на специальной созданной плаформе datagov.ideascale.com — «портал проектирования портала». В качестве основы разработчики представили свою концепцию, которая была значительно улучшена и расширена с помощью вовлечения в обсуждение профессионального сообщества. Всего поступило 175 идей по доработке концепции, в обсуждении которых участие приняло 891 человек. C помощью этого портала собирались и первые истории успеха приложений на основе открытых данных. Итогом работы стала Концепция портала Data.gov, которая была утверждена федеральным советом ИТ-руководителей.
Работа над концепцией портала открытых данных США была завершена в конце 2010 – уже после перезапуска портала в июле 2009 года и марте 2010. Чтобы ускорить процесс публикации данных и сделать его более простым и понятным для федеральных ведомств, было разработано несколько механизмов:
- Dataset Management System – закрытая часть портала для публикации данных
- API-интерфейс для публикации данных
- Metadata Feed – специальная лента для публикации открытых данных по типу RSS или Atom.
В 2010 году для оценки эффективности раскрытия данных была разработана система метрик: федеральное ведомство (количество необработанных датасетов, механизмов отображения данных, гео-данных), статистика скачиваний, статистика посещений. В этом же году появилась возможность поиска высокоценных наборов данных (high value datasets), команда портала стала вести блог. Позже добавились новые разделы – галерея примеров эффективного использования открытых данных, сообщество со ссылками на другие значимые проекты в мире открытых данных и научно-образовательный раздел по семантическим технологиям.
В настоящий момент для удобства потребителей данных ведется три основных каталога:
- Каталог необработанных данных
- Каталог механизмов отображения данных федеральными ведомствами (виджеты, приложения и сервисы)
- Каталог гео-данных.
По мере развития проекта понадобились новые инструменты – подписка для пользователей на открытые данные, касающиеся определенной территории или штата, улучшение поиска данных и т.д.
Мы уже писали, что скоро планируется очередной перезапуск портала. Стало известно, что меняется система управления данными – вместо Socrata теперь будет CKAN.