Как я участвовал в хакатоне про открытые данные +21


26 июня в Москве проходил хакатон портала открытых данных data.gov.ru. Я в нём участвовал, выиграл в номинации от Правительства Москвы и хотел бы поделиться наблюдениями и впечатлениями.

За несколько дней до мероприятия я решил, что нужно придумать какую-нибудь идею и пошёл изучать данные, выложенные на data.gov.ru. Немного приуныл от кучи табличек вида «перечень регистров, реестров и подведомственных организаций» и решил искать интересные датасеты не по названию, а по числу строк. Скачал все 3000 документов, отсортировал по размеру и посмотрел на топ. Некоторые датасеты выглядели интересно, например, все фильмы замеченные в русском прокате, затраты на дороги, что-то про конкурсы и тендеры, но никакого толкового применения для них я придумать не смог. Потом я решил сузить область поиска и посмотрел только на данные про Москву на data.mos.ru. Нашёл много интересного: реест камер во дворах и подъездах, маршруты парконов, данные про нарушения ПДД. В итоге, я пошёл на хакатон с двумя идеями: выделить аптеки без лицензий и найти заправки с плохим бензином.

В начале мероприятия мне грамотно объяснили, что мои идеи — отстой, потому что в реестр лицензий на фармацевтическую деятельность не входит куча прекрасных коммерческих аптек и отмечать их как плохие нельзя, а в списке АЗС, реализующих топливо, несоответствующее установленным экологическим требованиям 14 строк и крупные сети туда не входят. Потом я вспомнил про датасет с маршрутами парконов и предложил его нарисовать на карте, посмотреть, может быть, где-то есть белые пятна. Оказалось, что кто-то такое уже делал, и, вообще, визуализация есть на самом портале, но попробовать можно.

Первым делом я попробовал распарсить маршруты и нарисовать их на картинке. С форматом и качеством данных проблем не возникло.


Потом я нанёс всё это на карту, проверил, что сильно не тормозит и выглядит нормально.


Дальше началось самое интересное, я решил поизучать сами треки. Нашёл, самый короткий и самый длинный маршрут, самый равноудалённый и самый петляющий. Построил тепловую карту и нашёл место максимального скопления патрулей.


Вынес самые прикольные наблюдения в шапку и выложил всё это на gdeparkon.ru.


Естественно, за кадром я оставил то, как час пытался оптимизировать сайт для Фейсбука и потерпел поражение, как бесконечно настраивал цвет и обводку линий на карте и как в ночи пытался осознать history.js. Короче говоря, времени мне хватило впритык и спал я мало.

На презентации оказалось, что датасет, который я использовал уже устарел. В пределах Садового кольца парконы заменяются инспекторами МАДИ, треков их маршрутов пока нет. В целом, идея и реализация, всем понравилась. Возможно, новые данные я тоже когда-нибудь получу и добавлю на карту.

На регламент презентаций жёстко забивали. Примерно 20 команд мы слушали около трёх часов. Меня, конечно, удивило, что почти никто не показывал, как работает их решение вживую, только картинки на слайдах. Видимо, это особенность формата. Записал для себя некоторые интересные ссылки и факты: Strava выкладывает агрегированные велосипедные треки, для Телеграма можно писать ботов, правительство готово делиться видео с камер во дворах и подъездах.

В итоге мне дали диплом в рамочке и обещали связаться. Мне понравилось. Организаторы бодрые и современные. Комментарии грамотные, замечания по делу. Эмуляция проваленного дедлайна мне не понравилась. Участвовать в хакатоне одному тяжело и не супер весело. Не советую. Надо очень хорошо поработать над идеей, в хакатоне, видимо, это самое важное. Нужно придумать что-то не слишком простое, но и не слишком сложное, чтобы успеть хотя бы прототип.




К сожалению, не доступен сервер mySQL