Штрихкоды

База данных содержит записи штрихкодов и соответствующие им наименования товаров, во всех записях есть категория и во многих — бренд.

Спектр представленных товаров очень широкий: фармацевтика, парфюмерия, косметика, продукты питания, игрушки, книги, канцелярия, инструменты и т.д.

Географический охват по странам, в которых товары продаются значителен: Россия, Украина, Беларусь, США, Великобритания, Европейский Союз, ЮАР, Бразилия, Малайзия и многие иные.

Языки представления: русский и английский.

Используя этот набор данных, можно решить такие стандартные задачи, как обогащение, консолидация, унификация данных. Его можно использовать и при решении более интересных задач, например, при обучении нейронных сетей для классификации товаров и нормализации их наименований.

Характеристика Значение
Тип Реальный
Состав файлов all-barcodes.lgd, README.md
Число записей 2 925 524
Вид полей Смешанного вида
Наличие пропусков Да
Типы файлов-источников .lgd - Loginom Data файл, .md - расширение формата Markdown
Сведения о владельцах Данные представлены компанией "Петроглиф". Открытая версия размещена на GitHub. Описание на портале habr.
Дополнительная информация Все штрихкоды гарантированно прошли проверку на соответствие одному из 4-х стандартов: EAN-13, EAN-8, UPC-A, UPC-E и включают контрольную цифру.
Дата первой публикации 2018
Дата последнего изменения 2018
Периодичность актуализации Изменения не вносились

Скачать (99,2МБ)

results matching ""

    No results matching ""