Личный опыт
22 января 2020Потратил $600 тысяч и 5 лет, чтобы создать свой переводчик. История Lingvanex
«Это невозможно», «Куда тебе конкурировать с Google?», «Как ты можешь сделать не хуже?» - эту критику инженер-программист Алексей Рудак слышит уже 5 лет, пока с нуля создает программу-переводчик Lingvanex. Он убедился в перспективности этой ниши, когда в одиночку сделал и протестировал более 600 разных приложений, и самыми популярными стали переводчики. В результате он получил около 35 млн скачиваний и заработал $ 1 млн - а затем вложил все в Lingvanex.
Только сейчас он готовится выйти на рынок с этим проектом.
- Уже 5 лет я работаю на пределе своих возможностей. Хочешь спать, болит голова - не важно. Нужно идти вперед, хотя порой опускаются руки и хочется все бросить. Но лучше жалеть о сделанном, чем о несделанном.
У меня не было связей и бизнес-опыта.Съемная квартира, сломанный диван, пачка пельменей и ноутбук - вот с чего все начиналось. За эти годы произошло много событий. Я сам собирал мощный компьютер для тренировки нейросети, писал ученым с тараканами в голове, сотрудничал с испанскими аспирантами… Чтобы все эти истории рассказать, дня не хватит. Но что мне говорят потенциальные инвесторы, сотрудники, партнеры? «Расскажи за 2 минуты…»
Как я искал нишу для бизнеса
Я всегда мечтал заработать много денег. Устраивался iOS-разработчиком в Минске, накапливал 4−5 тысяч долларов и увольнялся, чтобы создавать собственные проекты. Несколько раз я уезжал домой, в Новополоцк, чтобы сэкономить деньги на жизнь. Там я создавал образовательные и туристические сайты, программу для бухгалтерии, игры для мобильных телефонов. Но из-за отсутствия опыта ведения бизнеса это не приносило дохода, и вскоре проекты закрывались. Приходилось снова ехать в Минск - работать и снова копить. Так прошло шесть лет.
Когда у меня в третий раз закончились деньги, я, наконец, стал думать иначе. Наступил кризис, я не мог найти работу. В Новополоцке, небольшом провинциальном городе, советы из бизнес-книг крутых американских авторов не работают. За новой информацией приходилось ездить на бизнес-встречи и конференции в Минск. Но вскоре я понял, что это всего лишь теория, а на практике все иначе. У меня попросту не было денег, чтобы нанять команду крутых специалистов и сделать качественный проект. Настало время для переосмысления: я в маленьком городе, один, нет денег, опыта, связей. Я уже не могу начать проект просто «для души». Что делать?
Мой основной навык - разработка мобильных приложений для iPhone. Несколько лет работы в ИТ-компаниях позволили накопить опыт, и я решил сделать много простых и принципиально разных приложений (игры, музыка, рисование, ЗОЖ, изучение языков) и протестировать, на какие будет наибольший спрос. Разумеется, я не делал их вручную, это было бы слишком долго. Я написал платформу, которая позволяла относительно быстро создавать приложения на различную тематику. В них было несколько картинок, 2 кнопки и всего одна функция. Но этого было достаточно, чтобы проверить идею. Например, приложение для бега отслеживало скорость человека, пройденное расстояние, а также подсчитывало калории. На создание 600 приложений я потратил полтора года. Аккаунт в AppStore для размещения этих приложений стоил мне $ 99 в год.
Сначала приложения были бесплатными. Затем я стал подключать рекламу, добавил платные функции, стоимость которых начиналась от $ 1,99. Суммарно я получил 35 миллионов скачиваний без затрат на рекламу.
2 перспективные ниши, которые я нашел
Я заметил направления, которые явно отличались по скачиваниям, - это были переводчики и музыкальные программы (которые симулируют игру на пианино, барабанах или, например, гитарные аккорды). Буквально за месяц переводчики скачали более 1 млн раз. И это при том, что они находились примерно на 100-й позиции в рейтинге.
Музыкальные приложения были менее перспективны. Пользователей для них нужно привлекать по ключевым словам, а их в этой нише не много: тот, кто ищет приложения для гитары, так и пишет - «гитара», «бас-гитара», «аккорды» и т.д. Сложно подобрать много синонимов. Таким образом, пользователи сконцентрированы на высокочастотных запросах, и рано или поздно их привлечение будет стоить дорого.
Другое дело - переводчики.
На всех приложениях, которые были сделаны для тестов по поиску ниши, я заработал около миллиона долларов. Из них более половины - на переводчиках.
Языковых пар в мире тысячи, и люди вводят запрос не общим словом «переводчик», а несколько слов как решение своей проблемы: «перевести с арабского на французский», «переводчик с китайского». Раз запросов много, привлекать пользователей можно дешевле. Я понял, какую нишу стоит занять.
Почему я решил создать свою технологию перевода
Вначале мои приложения-переводчики (порядка 40) создавались очень просто - использовался перевод, который предоставлял Google API. Я платил корпорации по $ 20 за 1 млн переведенных через Google Translate символов. Затем я запустил улучшенные версии приложений - добавил рекламу, встроенные покупки, перевод голоса. Повысив качество, сделал приложения платными, примерно по € 7.
Я переехал в Минск и купил квартиру. Мой образ жизни почти не изменился - я ел все те же пельмени, покупал одежду в секонд-хенде. Все деньги уходили на дальнейшее развитие бизнеса. Период роста продолжался около года. На то время у меня было 50−70 приложений для перевода (2 языковые пары на каждое из приложений плюс один универсальный переводчик сразу на все языки) и 5 млн скачиваний.
Но с ростом пользователей увеличивался расход на платный Google API (технологии перевода). Прибыльность бизнеса серьезно снизилась. Настал момент, когда 70% выручки уходило на расходы. С такими объемами перевода я мог войти в долги. Чтобы окупить расходы, нужно было добавлять много рекламы в приложения. Но это всегда отпугивает пользователей. Чтобы решить эту проблему, требовалось не зависеть от Google и двигаться на новые рынки, то есть создавать приложения для Android, Mac OS и Windows Desktop.
Я пробовал просить совета и инвестиций у стартапов и ИТ-сообщества, но поддержки не встретил. В основном эксперты и инвесторы не понимали, в чем интерес работать на рынке, где уже есть лидер - Google-переводчик. Также обращался к нескольким крупным компаниям, предлагая $ 30 тысяч за их лицензии технологий перевода на 40 языков. Это позволило бы мне переводить неограниченное количество раз за фиксированную цену и обслуживать любое количество пользователей. Но мне в ответ называли сумму в 2−3 раза выше. Это было слишком дорого.
Было решено попробовать сделать свою технологию для перевода. Я обратился к знакомому, который владеет аутсорс-компанией в Минске. В конце 2016 года он выделил для меня команду из 7 сильных разработчиков. Работа началась.
Я рассчитывал, что решу задачу за полгода, но постепенно убеждался, что все гораздо сложнее. За все время я потратил около $ 600 тысяч на разработку и только сейчас запускаю продукт на рынок.
«Как вы можете добиться качества уровня Google Translate?»
Это главный вопрос, который мне задают все эти 5 лет. Мало кто верит, что создавать переводчик - хорошая идея и что это вообще достижимо. Ведь как можно маленькой командой повторить то, что много лет делает Google?
Безусловно, создание переводчика - задача сложная. Чтобы было понятнее, кратко поясню, как создаются переводчики.
Раньше в этой нише использовался статистический машинный перевод с добавлением правил, но новое поколение переводчиков в основном создается на нейронной сети, в том числе и наш. Без понимания грамматики языка нейронная сеть сама находит закономерность между двумя одинаковыми текстами на разных языках. И когда нужно перевести новый текст, она сама выдвигает гипотезы, как неизвестное слово будет переводиться в другом языке, даже если в примерах до этого его не было.
Чтобы нейронная сеть нашла соответствия, мы загружаем в нее как можно больше текстов с переводами на разные языки. Данные берутся из открытых источников. Например, Opus - самый большой источник переведенных текстов. Он содержит протоколы заседаний Европарламента. Они проходят каждый год и выпускаются с относительно качественным переводом. Также Opus содержит переведенные статьи из Википедии, субтитры к фильмам и другое, но там перевод не везде дословный.
Основа перевода - нейросеть, уже сама по себе сложная тема, а к ней еще необходимо добавить узкоспециализированные знания в обработке естественного языка (компьютерная лингвистика). К тому же у каждого языка свои особенности. Чтобы обслуживать миллионы пользователей в день, необходимы сотни мощных серверов, объединенных сложной инфраструктурой.
Относительно конкуренции с корпорациями у меня есть несколько аргументов:
1. Рынок обработки естественного языка быстро растет. Тема очень сложная. Она имеет большой порог входа из-за дороговизны специалистов и малого количества наработок в открытом доступе. Создать свой проект в этой сфере до недавнего времени было дорого.
Все изменил интерес крупных корпораций в развитии технологии машинного перевода. Они поняли, что проблему качественного перевода можно решить, только объединив усилия и помогая начинающим проектам. Для этого они стали выкладывать свои разработки в открытый доступ, чтобы на базе них каждый желающий мог сделать свой проект в области машинного перевода. Если кто-то добьется хорошего результата, то крупная корпорация с радостью купит их компанию с наработками. Это дешевле, чем делать своими силами.
В разработке переводчика нам помогают даже директора крупных компаний, предоставляющие услуги по машинному переводу. Сами! Это удивительно настолько, что никто не верит. Но причина проста: корпорации ведут между собой войну за технологии и рынок, и они решили позволить желающим создавать для них «патроны», то есть улучшать технологию и продукт, чтобы затем выкупить наиболее успешные проекты и выиграть в своей войне.
2. Мне говорят, что я не найду специалистов в команду, ведь все они уже давно работают в больших корпорациях, т.к. там большие зарплаты и это престижно. Но на самом деле далеко не каждый хочет на них работать. Академическое сообщество предпочитает работать в своих университетах, занимаясь тем, что нравится, со своими студентами, а не решая бизнес-задачи корпораций и работая на износ. Деньги ученых не сильно мотивируют, а интересных задач на всех не хватит.
Развитие проектов в открытом доступе привело к росту научных работ и притоку молодых аспирантов в сферу обработки естественного языка. Это позволило легче искать специалистов и снизило цены на их услуги.
3. Два года назад для тренировки нейросетей, которые нужны для переводчика, был необходим дорогой суперкомпьютер. За пару лет цены на суперкомпьютеры снизились в десятки раз. В марте 2018 компания Nvidia выпускает компьютер DGX-2 размером с тумбочку и производительностью в 2 петаФлопса (FP16), который сейчас можно взять в лизинг от $ 5000 в месяц.
Имея такой компьютер, можно тренировать свои модели с гигантским объемом данных быстро, как и держать большую нагрузку по API. Это кардинально меняет расклад сил всего рынка и позволяет небольшим компаниям конкурировать с гигантами в области работы с большими данными. Мой пример это подтверждает.
«Зачем нам ваш переводчик, если есть Google Translate?»
Еще один частый вопрос. На что я отвечаю: «Несмотря на сильных конкурентов, у нас есть свои преимущества. На большом рынке должен быть ассортимент».
Какие у нас преимущества? Такого количества функций совокупно нет ни у одного переводчика, даже у нескольких вместе взятых. Например:
- Наши приложения работают на большинстве существующих платформ - их 17. Это компьютеры (Mac OS и Windows), мобильные телефоны (iPhone, Android), расширения для браузеров (Chrome, Firefox), чатботы (Facebook, Telegram, Vkontakte, Viber), голосовые помощники (Google, Alexa), носимые устройства (смарт-часы, наушники).
- Перевод не только текста, голоса, картинок, но и сайтов, больших файлов, телефонных звонков, sms и пр.
- Перевод голоса без доступа к интернету
- Перевод через умные наушники (Airpods, Galaxy Buds и более дешевые модели с микрофоном)
- Можно создавать чаты с переводом
- Функции для изучения языков - например, добавление слов в закладки, закрепление знаний с помощью чат-бота или умной колонки
- API и серверные решения для перевода внутри компаний по определенным тематикам (медицина, металлургия, юриспруденция и т.д.). На базе наших технологий каждый может сделать свой переводчик. Кроме того, у нас есть чат-бот для Slack, который решает проблему общения и перевода документации для международных команд, работающих над одним проектом.
Есть и другой аргумент - для этого надо вспомнить, собственно, начало истории: я уже смог заработать на переводчиках, спрос на них был. И даже если сейчас мы займем небольшую долю рынка, он настолько огромен, что нам ее хватит.
«Нас ждет последний рывок»
До недавнего времени я работал один, нанимая сотрудников на аутсорсе, сам управлял проектом и разработкой. Но сложность продукта и количество задач начали быстро расти,и стало очевидно, что нужно делегировать функции и быстро нанимать людей в собственную команду в своем офисе.
Собрать ее было сложно - повторюсь, никто в идею не верил и не понимал, зачем делать переводчик, когда есть Google. Убедить стало легче, когда я смог показать работающие приложения и свое API для перевода.
Сейчас в команде 10 человек. Все они выкладываются по полной, поскольку мотивированы опционами. Для нашей платформы по переводу мы сделали 40 сервисов - распознавание речи, синтез речи, словарное значение, транслитерация, определение частей речи и языка и т.д. Из них можно делать много продуктов в области естественной обработки языка всем желающим. Все это доступно на нашем API.
Но для текущего объема задач людей катастрофически не хватает. Мы ищем инженера по Data Science, программиста iOS c опытом приложений под Mac, backend-программиста (Node.js), продакт-менеджера (мобильные приложения). Также я заинтересован в опытных партнерах, которые помогут выйти на новые рынки, помогут с нишевой экспертизой и снимут с меня часть задач. Управлять компанией со множеством продуктов и сложной технологией в одиночку становится трудно.
Вскоре мы начнем продвижение продукта на рынок. Бюджет на рекламу небольшой - пару тысяч долларов, маркетингом занимается 4 человека. Но для нас этого может быть достаточно: мы используем систему кросс-маркетинга, при которой в одних приложениях рекламируются другие. Это и будет главный источник трафика. Когда я делал тесты разных приложений, была набрана база пользователей более 10 миллионов. Я надеюсь на конверсию порядка 30%.
Основная целевая аудитория - люди, изучающие иностранные языки, туристы и бизнес (где востребован перевод документов). В первую очередь мы нацелены на 6 основных европейских языков - испанский, итальянский, русский, португальский, французский, немецкий. Затем перейдем на азиатские (корейский, японский, китайский). Там рынок еще не такой конкурентный, как в США. При этом самый сложный рынок, на мой взгляд, - именно американский.
Моя цель - 0,5% мирового рынка всех переводов. Процент небольшой, но учитывая, что по прогнозам к 2023 году рынок всех переводов будет $ 70 млрд в год и доля машинного перевода будет расти, он принесет хорошую прибыль для небольшой команды.
Ждать больше невозможно: я потратил 5 лет и все свои средства. Для запуска все готово, но людей не хватает. И от того, смогу ли я быстро вырастить команду, чтобы доработать переводчик, зависит весь проект. Нас ждет последний рывок. Я шел к этому 12 лет и должен убедиться, что в моей жизни был шанс, и я его не упустил.