Facebook использует фотографии с хэштегами из Instagram для тренировки своей системы распознавания изображений
08.05.2018
На конференции разработчиков Facebook компания сообщила, что использует миллиарды фотографий из Instagram для тренировки своей системы распознавания изображений.
Обучение моделей для распознавания изображений и объектов обычно является очень трудоемкой задачей, так как каждое изображение должно быть рассмотрено и помечено сотрудником-человеком, что серьезно ограничивает базу для тренировки. Facebook нашел способ избавиться от необходимости использовать наблюдение со стороны человека: исследователи используют изображения, которые уже были помечены хэштегами в Instagram.
Для глубокого обучения используется 3.5 миллиарда изображений в Instagram с 17000 хэштегами, и результаты выглядят достаточно обнадеживающими. Система, пока прошедшая обучение с использованием одного миллиарда изображений и 1500 хэштегов, достигла 85,4-процентной точности на ImageNet, опередив предыдущую ведущую систему на 2,3 процента.
Алгоритм еще далек от совершенства, однако исследование Facebook демонстрирует, что тренировка системы с использованием меньшего “надзора” со стороны человека, может стать шагом в правильном направлении, позволяя использовать намного более крупные базы данных и благодаря этому улучшить эффективность распознавания объектов и их классификации.