Списание Статистика

bg | en

ПРИКЛАДНЫЕ АСПЕКТЫ БОЛЬШИХ ДАННЫХ (BIG DATA) В ОФИЦИАЛЬНОЙ СТАТИСТИКЕ

Галя Статева

Abstract: В настоящей статье представлена возможность практического применения Больших данных (Big Data), реализованной в рамках эмпирического исследования „Извлечение данных из интернета для получения информации о предприятиях (web-scraping)“, проведенного Национальным статистическим институтом.
Во введении подробно описана основная цель эмпирического исследования, которая направлена на изучение возможностей применения методов „web-scraping“ и „text mining“ и оценки результатов, полученных от их использования в процессе сбора данных и улучшения качества информации о предприятиях в статистическом бизнес-регистре НСИ, через доступ к их веб-сайтам.
В первой главе представлена технологическая среда для реализации эмпирических исследований, включительно общая референтная логическая архитектура для применения метода „web-scraping“. Дается подробная характеристика метода „web-scraping и описаны случаи, в которых используются различные виды - специфический и генерический „web-scraping“.
Вторая глава посвящена практической реализации четырех пилотных „сценариев“. Разработка и анализ результатов отдельных „use-сase“ представлены в следующей последовательности: цель, ресурсное и технологическое обеспечение, достигнутые результаты, юридические ограничения.

Keywords:

Date published: 2018-11-01

Download full text