January 22nd, 2014

ВсПЛЕСк-2007

Викиданные

Последнее время, во многом благодаря постам Gerard Meijssen, увлёкся проектом Викиданные (Wikidata) - проект ещё в начале своего пути, формальные описания, связность, семантическая сеть, открытые данные, непаханое поле, красота.
Первое, чем я занялся после осмотра - список "Top 1000 missing descriptions in Russian" по утилите WikiData - Terminator.
Написал бота, который добавляет описания для населённых пунтов, что-то вроде "село на Украине, Харьковская область, Дергачёвский район, Прудянский сельсовет". Бот резко сократил список одноимённых страниц без описаний. Затем ещё вручную прошёлся по метеоритам, Оскарам, некоторым выборам. И вот теперь этот список можно рекомендовать для ручной обработки.

Так, что если вам нечего делать тёмными зимними вечерами, устанавливайте гаджет Label Collector, и проходитесь по списку.