Skip to content

Как создавались порталы открытых данных в зарубежных странах – о развитии портала США Data.gov

Новая серия больших материалов: как разные страны делали свои главные порталы открытых данных.

Портал открытых данных США Data.gov был запущен в мае 2009 года. Цель портала – улучшить доступ к высокоценным данным в машиночитаемом формате федеральных органов власти. В момент запуска было опубликовано 46 наборов данных и 27 механизмов федеральных ведомств.

Параллельно с запуском data.gov стартовала площадка для обсуждения и совместной разработки концепции портала на специальной созданной плаформе datagov.ideascale.com — «портал проектирования портала». В качестве основы разработчики представили свою концепцию, которая была значительно улучшена и расширена с помощью вовлечения в обсуждение профессионального сообщества. Всего поступило 175 идей по доработке концепции, в обсуждении которых участие приняло 891 человек. C помощью этого портала собирались и первые истории успеха приложений на основе открытых данных.  Итогом работы стала Концепция портала Data.gov, которая была утверждена федеральным советом ИТ-руководителей.

Работа над концепцией портала открытых данных США была завершена в конце 2010 – уже после перезапуска портала в июле 2009 года и марте 2010. Чтобы ускорить процесс публикации данных и сделать его более простым и понятным для федеральных ведомств, было разработано несколько механизмов:

  • Dataset Management System –  закрытая часть портала для публикации данных
  • API-интерфейс для публикации данных
  • Metadata Feed – специальная лента для публикации открытых данных по типу RSS или Atom.

В 2010 году для оценки эффективности раскрытия данных была разработана система метрик: федеральное ведомство (количество необработанных датасетов, механизмов отображения данных, гео-данных), статистика скачиваний, статистика посещений. В этом же году появилась возможность поиска высокоценных наборов данных (high value datasets), команда портала стала вести блог. Позже добавились новые разделы – галерея примеров эффективного использования открытых данных, сообщество со ссылками на другие значимые проекты в мире открытых данных и научно-образовательный раздел по семантическим технологиям.

В настоящий момент для удобства потребителей данных ведется три основных каталога:

  • Каталог необработанных данных
  • Каталог механизмов отображения данных федеральными ведомствами (виджеты, приложения и сервисы)
  • Каталог гео-данных.

По мере развития проекта понадобились новые инструменты – подписка для пользователей на открытые данные, касающиеся определенной территории или штата, улучшение поиска данных и т.д.

Мы уже писали, что скоро планируется очередной перезапуск портала. Стало известно, что меняется система управления данными – вместо Socrata теперь будет CKAN.

Похожие статьи

Shares