Глубокое обучение — это ветвь машинного обучения. Это область, основанная на обучении и самосовершенствовании путем изучения компьютерных алгоритмов. В то время как машинное обучение использует более простые концепции, глубокое обучение работает с искусственными нейронными сетями, которые предназначены для имитации того, как люди думают и учатся. До недавнего времени нейронные сети были ограничены по вычислительной мощности и, следовательно, по сложности. Однако достижения в области аналитики больших данных позволили создать более крупные и сложные нейронные сети, позволяющие компьютерам наблюдать, учиться и реагировать на сложные ситуации быстрее, чем люди. Глубокое обучение помогло классификации изображений, языковому переводу, распознаванию речи. С его помощью можно решить любую задачу распознавания образов и без вмешательства человека.
Как работает глубокое обучение?
Нейронные сети представляют собой слои узлов, так же, как человеческий мозг состоит из нейронов. Узлы внутри отдельных слоев связаны с соседними слоями. Сеть считается более глубокой в зависимости от количества слоев, которые она имеет. Один нейрон в человеческом мозгу получает тысячи сигналов от других нейронов. В искусственной нейронной сети сигналы проходят между узлами и присваивают соответствующие веса. Узел с более тяжелым весом окажет большее влияние на следующий слой узлов. Последний слой компилирует взвешенные входные данные для получения выходных данных. Для систем глубокого обучения требуется мощное оборудование, поскольку они обрабатывают большой объем данных и включают в себя несколько сложных математических расчетов. Однако даже с таким передовым оборудованием тренировочные вычисления для глубокого обучения могут занять недели.
Системы глубокого обучения требуют больших объемов данных для получения точных результатов; соответственно, информация подается в виде огромных наборов данных. При обработке данных искусственные нейронные сети могут классифицировать данные с ответами, полученными из серии бинарных истинных или ложных вопросов, включающих очень сложные математические вычисления. Например, программа распознавания лиц работает, обучаясь обнаруживать и распознавать края и линии лиц, затем более важные части лиц и, наконец, общие представления лиц. Со временем программа обучается, и вероятность правильных ответов увеличивается. В этом случае программа распознавания лиц со временем будет точно идентифицировать лица.
Отличие от обычного машинного обучения
Глубокое обучение принципиально отличается от обычного машинного обучения. Возьмём для примера задачу, при которой необходимо распознать кошек на изображениях. В этом примере эксперту в предметной области потребуется потратить значительное время на разработку обычной системы машинного обучения, чтобы обнаружить признаки, представляющие кошку. При глубоком обучении все, что нужно, — это предоставить системе очень большое количество изображений кошек, и система сможет автономно изучить особенности, которые представляют кошку. Модель глубокого обучения, известная как сверточная нейронная сеть, обычно учится на пикселях, содержащихся в изображениях, которые он получает. Она может классифицировать группы пикселей, которые представляют особенности кошки, с группами особенностей, такими как когти, уши и глаза, указывающие на присутствие кошки на изображении.
Для многих задач, таких как компьютерное зрение, распознавание речи (также известное как обработка естественного языка), машинный перевод и робототехника, производительность систем глубокого обучения намного превышает производительность обычных систем машинного обучения. Это не означает, что создание систем глубокого обучения относительно просто по сравнению с обычными системами машинного обучения. Хотя распознавание признаков в глубоком обучении является автономным, необходимо настроить тысячи гиперпараметров, чтобы модель глубокого обучения стала эффективной.
Почему глубокое обучение важно?
Мы живем во времена беспрецедентных возможностей, и технологии глубокого обучения могут помочь нам достичь новых прорывов. Глубокое обучение сыграло важную роль в открытии экзопланет и новых лекарств, а также в обнаружении болезней и субатомных частиц.