Разметка изображений — это процесс маркировки изображений для обучения модели машинного обучения. Задача разметки обычно включает ручную работу, иногда с помощью компьютера.
Специалист по машинному обучению проставляет определённые метки, известные как «классы», и предоставляет информацию, относящуюся к изображению, в модель компьютерного зрения. После того, как модель будет обучена и развернута, она будет предсказывать и распознавать те заранее определенные функции в новых изображениях, которые еще не были размечены.
Как работает разметка изображений?
Чтобы разметить изображения, вы можете использовать любой открытый или бесплатный инструмент. Инструменты предлагают различные наборы функций для эффективной разметки одного или нескольких кадров. При работе с большим объемом данных для разметки изображений потребуется обученный персонал.
Метки проставляются с использованием любого из методов разметки. Количество меток на каждом изображении может варьироваться в зависимости от варианта использования.
Сколько времени занимает разметка изображений?
Время, необходимое для разметки изображений, во многом зависит от сложности изображений, количества объектов, типа разметки и требуемой точности и уровня детализации.
Обычно даже компании, занимающиеся разметкой изображений, затрудняются сказать, сколько времени это займёт. Для начала нужно будет разметить образцы, чтобы сделать оценку на основе результатов. Но даже в этом случае нет гарантии, что качество и согласованность разметки позволят делать точные оценки. Несмотря на то, что автоматизированная разметка изображений и полуавтоматические инструменты помогают ускорить процесс, по-прежнему необходим человеческий фактор для обеспечения постоянного уровня качества.
Типы разметки изображений
1. Классификация изображений
Это присвоение изображению одной метки для идентификации всего изображения. Классификация изображений направлена на то, чтобы просто идентифицировать наличие определенного объекта и назвать его предопределенный класс.
Примером модели классификации изображений является «обнаружение» различных животных на входных изображениях. В этом примере будет предоставлен набор изображений разных животных, и будет предложено классифицировать каждое изображение с помощью метки на основе конкретных видов животных. Виды животных в этом случае будут классом, а изображение — входными данными.
2. Обнаружение объектов и распознавание объектов
Необходимо определить наличие, местоположение и количество объектов на изображении. Для этого типа разметки требуется, чтобы вокруг каждого обнаруженного объекта на каждом изображении были проведены границы, что позволит определить точное положение и количество объектов, присутствующих на изображении.
Расположение класса является параметром в дополнение к классу, тогда как при классификации изображений расположение класса в изображении не имеет значения, поскольку все изображение идентифицируется как один класс.
Одним из наиболее распространенных примеров обнаружения объектов является обнаружение людей.
3. Сегментация изображения
Это тип разметки изображения, который включает разделение изображения на несколько сегментов. Сегментация изображения используется для обнаружения объектов и границ (линий, кривых и т. д.) на изображениях. Это выполняется на уровне пикселей , присваивая каждый пиксель изображения определенному объекту или классу. Он используется для проектов, требующих более высокой точности классификации входных данных.
Сегментация изображения делится на следующие три класса:
- Семантическая сегментация – обозначает границы между подобными объектами. Этот метод используется, когда требуется высокая точность в отношении наличия, местоположения, размера или формы объектов на изображении.
- Сегментация экземпляра – определяет наличие, местоположение, количество, размер или форму объектов на изображении. Помогает маркировать присутствие каждого отдельного объекта в изображении.
- Паноптическая сегментация сочетает в себе как семантическую, так и экземплярную сегментацию. Соответственно, паноптическая сегментация предоставляет данные, помеченные для фона (семантическая сегментация) и объекта (сегментация экземпляра) в изображении.
4. Граничное распознавание
Этот тип разметки идентифицирует линии или границы объектов на изображении. Границы могут включать в себя края конкретного объекта или области топографии, представленные на изображении. Распознавание границ играет важную роль в безопасной эксплуатации беспилотных автомобилей.
Методы разметки
Ниже приведены популярные методы разметки изображений, которые используются в зависимости от варианта использования.
- Ограничивающие рамки
Наиболее часто используемая форма разметки. Это прямоугольные рамки, используемые для определения положения объекта на изображении. Они могут быть двухмерными (2D) или трехмерными (3D). - Полигоны
Используются для обозначения каждой из вершин предполагаемого объекта и разметки его краев. - Ориентир
Используется для определения основных точек объекта на изображении. Такие точки называются ориентирами или ключевыми точками. Ориентиры важны для распознавания лиц . - Линии и сплайны
Линии и сплайны размечают изображение прямыми или изогнутыми линиями. Это важно для распознавания границ, чтобы разметить тротуары, дорожные знаки и другие указатели границ.