Что такое нейросети?

Что такое нейросети?

Приложение по обработке фотографий Prisma, созданное российскими разработчиками, стало одним из самых громких релизов минувшего лета. Только за первую неделю после публикации в App Store Prisma скачало более миллиона человек. К концу лета число скачиваний в App Store и Google Play перевалило за 52 миллиона, а пользовательская база приложения превысила 45 млн человек. И все это без масштабной PR-компании и вложений в продвижение. От множества других фотофильтров Prisma отличает не только невиданный успех при выходе на рынок, но и технологии, лежащие в основе приложения. Фотографии в Prisma не видоизменяются — воссоздаются заново стараниями искусственного интеллекта — нейросети.

Почему приложение произвело эффект разорвавшейся бомбы и как нейросети изменят нашу жизнь?

google-dream-starry-night-1024x811

«Prisma превращает любое фото в шедевры искусства», — сказано в описании приложения. И это не фигура речи. С помощью искусственного интеллекта фотографии, загруженные в приложение, стилизуются под картины Ван Гога, Пикассо, Левитана. От существующих фильтров Prisma отличается кардинально: эффекты накладываются не поверх фотографии — изображение анализируется самообучающейся нейронной сетью, расположенной на сервере, после чего — пиксель за пикселем — перерисовывается заново.

Дружелюбный дизайн, набор из 35 фильтров (на старте их было 20) и удобные социальные функции: результатом можно в два счета поделиться в социальных сетях. Все это Prisma — мобильное приложение, взлетевшее на первые позиции AppStore в 77 странах мира.

Prisma — продукт российских разработчиков, созданный под руководством Алексея Моисеенко. До покорения App Store Алексей работал менеджером в Mail.ru Group. Над нашумевшим приложением команда трудилась в свободное время. Компанию Алексей покинул спустя пару недель после триумфа в AppStore, когда стало понятно, что с Prisma все серьезно.

«Мы опубликовали приложение в магазине просто, чтобы протестировать его, — вспоминает Моисеенко. — Мы даже толком не анонсировали выход. Наш рост был органическим, у нас был нулевой маркетинг». 

Тест удался. Уже через неделю после релиза на iOS App Store приложение получило более 7,5 млн загрузок и более 1 млн активных пользователей. У успеха приложения несколько факторов: дружелюбный интерфейс, скорость обработки фотографий и возможность быстро поделиться фото вместе с хештегом #prisma во всех социальных сетях.

«Только в день запуска мы создали более 30 000 фотографий в Инстаграм, — рассказывает Моисеенко. — Это было похоже на бум. После этого дня хэштег стал безраздельно нашим».

Разработка приложения заняла у команды 1,5 месяца. Но идея, как честно признаются создатели, не была новой. Программисты воспользовались предобученной нейронной сетью и адаптировали ее работу для смартфонов. Время обработки изображения снизилось с нескольких часов (как в прототипе) до нескольких секунд.

«Мы просто взяли алгоритм с открытым кодом и попытались ускорить его, понимая, что никто не будет ждать 20 минут, чтобы получить результат», —  объясняет Моисеенко.

Уже в августе 2016 года разработчики представили новую версию программы 2.4, способную работать без подключения к Интернету. Это не только ускоряет процесс обработки снимков, но и позволяет разгрузить сервера компании. Свободные мощности нужны Prisma для реализации новой функции, которую команда уже анонсировала, — обработки коротких видеороликов.

Prisma — яркий, но не единственный проект, выполненный с использованием нейросетей. Эта же технология лежит в основе популярного видеосервиса MSQRD, который выкупила социальная сеть Facebook.

Свои проекты с использованием нейросетей представили в минувшем году и технологические гиганты. Так, Google продемонстрировал сеть-игрока в го AlphaGo, обыгравшую чемпиона-человека; в марте 2016 года корпорация продала на аукционе 29 картин, созданных нейросетями; Microsoft представила проекты CapitanBot — сервис, распознающий изображения на снимках и придумывающий подписи к ним; WhatDog — проект, позволяющий определить породу собак по фотографии; HowOld — сервис, определяющий возраст человека, и другие.

Работают с технологией нейросетей и российские компании-гиганты. Mail.ru Group применяет нейросети для обработки и классификации текстов в «Поиске». Экспериментируют с системой и в Яндексе. Так, один из дочерних проектов компании — Авто.ру — запустил нейросетевой сервис для распознавания автомобилей. Опция позволяет найти марку и модель машины по фотографиям, а затем отыскать все объявления по ней.

Так что же такое нейросети? И почему они оказались столь востребованы технологическими компаниями?

Нейронные сети — один из методов машинного обучения. В их основе лежит идея скопировать пусть упрощенным, но достаточно правдоподобным образом устройство человеческого мозга так, чтобы компьютер узнавал вещи, распознавал образы и принимал решения, словно это делает человек. При этом нейронную сеть не нужно программировать в обычном смысле этого слова: сеть нужно обучить, а дальше она будет действовать сама. Обучаемость — одно из главных преимуществ у нейронных сетей перед алгоритмами, но до настоящего мозга им все-таки далеко. Большая нейронная сеть может иметь сотни или тысячи процессорных единиц, в то время как мозг — это миллиарды нейронов, находящихся в процессе взаимодействия.

Впервые о нейросетях, как методе машинного обучения, заговорили еще в 1943 году. Уоррен Маккалок и Уолтер Питтс предложили первую версию ячейки искусственной нейронной сети. В 1958 году Фрэнк Розенблатт продемонстрировал первую, самую простую нейронную сеть, способную разделять объекты в двухмерном пространстве.

С тех пор интерес к нейронным сетям то вспыхивал, то затухал вновь. Но сегодня исследователи убеждены: нейронные сети лучше других алгоритмов подходят для задач, связанных с языком, речью, видео.

У ренессанса нейронных сетей несколько причин. Во-первых, резко выросшее количество оцифрованной информации: чтобы безошибочно справляться с задачами, нейросети необходимо изучить множество примеров. Во-вторых, рост мощности вычислительных машин. К примеру, новый процессор Intel® Xeon Phi™ обеспечивает пиковую производительность более 3000 миллиардов операций в секунду (3 терафлопс) при выполнении вычислений с двойной точностью и повышение в 3,5 раза производительности по сравнению с процессорами предыдущего поколения1 .

Это открывает путь к более глубокому пониманию аналитической информации, реализации совершенно новых возможностей машинного обучения.

Сегодня нейросети лежат в основе большинства современных систем распознавания и синтеза речи, обработки и распознавания изображений. Алгоритмы применяются в системах навигации, защищают информационные системы от злоумышленников, выявляют незаконный контент в сети.

Но все это, как полагают эксперты, только начало. Алгоритмы машинного обучения — следующий шаг в автоматизации любых процессов, разработке программного обеспечения. Одна из главных особенностей нейросетей — способность самостоятельно принимать простые решения. А это значит, что в ближайшем будущем технология вполне сможет заменить человека там, где не требуются решения сложных интеллектуальных задач. Так, например, нейросетевые боты могут частично заменить операторов в колл-центрах, операторов технической поддержки или персональных ассистентов.

Так незаметно, через элементы в поисковых системах и приложения с красивыми картинками, искусственный интеллект входит в нашу жизнь. Смириться с мыслью, что машины способны не просто следовать инструкциям, написанным человеком, а могут думать самостоятельно, нам еще предстоит. А пока это кажется далеким будущим, на мастерские стилизации, созданные нейросетями в приложении Prisma, любуются более 10 млн человек.

За время работы над проектом команда Prisma выросла с четырех до девяти человек. Отказываться от славы одного из самых популярных приложений по обработке фотографий в Prisma не намерены, а значит, пользователей необходимо удивлять снова и снова. Как? Представители компании предпочитают оставить это в секрете.

«Одно могу сказать точно, — уверяет Алексей, — для пользователей приложение навсегда останется бесплатным. Никаких PRO-версий мы вводить не планируем. Мы сосредоточены на продукте, а не на том, как заработать деньги. И эта модель нам нравится».

 intel.ru.

Автор статьи: Ксения Салюкова