?Дооснования TWIN вызанимались технологиями IP-связи. Почему решили переключиться наразработку голосовых ботов?
?Мыработали нарынке IP-связи впервой половине 2010-х: налаживали работу виртуальных облачных АТС натерритории России иСНГ, сотрудничали стакими IT-компаниями, как Яндекс. В2014 году кнам обратилась российская компания, которая создавала сервисы для крупных банков? они хотели разработать робота для оповещения клиентов. Мысоздали сервис, который обращался ккаждому пользователю поимени исовершал звонки сучетом разницы вовремени вразных регионах. Впоследующие пару лет бот стал проводить более 5млн звонков вдень. Тогда мыеще неиспользовали синтез речи? фразы для робота записывал диктор.
Вкакой-то момент клиенты захотели добавить функцию распознавания речи, чтобы бот мог отвечать навопросы. Уже в2016 году мыпредставили технологию наконференции НАПКА? тогда нарынке небыло аналогов, имыоказались вчисле лидеров. Так пришла идея основать TWIN.
Первое время мы, как имногие наши конкуренты, работали вкачестве голосового провайдера, нокконцу 2018 года сменили модель развития наплатформу, позволяющую автоматизировать все коммуникации, включая голос, чат илюбые виды нотификаций. Например, запустили визуальный редактор, вкотором клиент мог запрограммировать изапустить любого голосового или текстового робота. Витоге всего загод оборот TWIN вырос в5,5раз. Вэтом году ожидаем рост до250млн.
?Сколько вложений потребовалось для запуска стартапа нараннем этапе?
?Стартовый капитал TWIN составил всего 5млн рублей, нокконцу 2016 мыпотратили всю сумму. Из-за этого пришлось работать вускоренном темпе? первый прототип голосового бота мысобрали всего запару месяцев, ачерез полгода уже запустили продукт.
?Сейчас многие занимаются голосовыми технологиями? назападе рынок уже достаточно насыщен. Скем выконкурируете инакаких рынках?
?УTWIN есть несколько представительств, втом числе вСША, Украине, ОАЭ истранах Европы, поэтому стараемся мониторить все предложения конкурентов нарынке.
Один изсамых крупных игроков всфере платформенных решений для коммуникаций? это американская компания Twilio. Уних вкоманде 2500 человек, авыручка доходит до$1,134млрд вгод. Конечно, масштаб унаших компаний разный. Ноесть идругое принципиальное отличие? Twilio предоставляет технологии разработчикам, аони помогают компаниям автоматизировать процесс покоммуникациям.
Мыже работаем напрямую сбизнесом ипредоставляем уже готовый продукт, который может настроить любой человек без знания программирования. При этом клиент получает полноценного виртуального помощника, который способен принимать решения ивести общение через разные каналы коммуникаций. Нанашей платформе мыпредлагаем более 2000 различных сценариев навыбор? тоесть выступаем одновременно иразработчиком, иудобным агрегатором собственных решений.
Нароссийском рынке сейчас многие экспериментируют сголосовыми ИИ-технологиями исоздают действительно сильные интеллектуальные модели. Нозачастую такие разработки сложно адаптировать под конкретные нужды клиента? особенно это касается звонков. Нонам вTWIN удалось разработать уникальную модель сотрудничества: мынепросто предоставляем технологии, мыпомогаем сихреализацией, подключая кпроцессу сеть партнеров. Для каждой ниши нарынке унас есть определенная группа экспертов, которая специализируется наавтоматизации отдельных направлений? это может быть, например, экспертиза вбанковской отрасли. Наданный момент снами работает 13 партнеров, и70% изних уже создали собственные торговые марки, многие работают поwhitelabel-модели.
Важно, что TWIN непродает сырые технологии, апредлагает готовый продукт, который приносит конкретные результаты. Клиент непросто покупает бота? онполучает рост определенных KPI накаждом участке бизнес-процесса. Вотличие оттойже Twilio, мыпредлагаем базу готовых решений, которые клиенту непридется долго совершенствовать иоптимизировать. Мыупрощаем коммуникации навсех уровнях ипредлагаем инструменты, которые помогают быстро переключаться содного канала надругой? например, переходить отголосового общения вчат инаоборот.
?Как сейчас устроен бизнес?
?Мыпостоянно разрабатываем новые решения исейчас получили уже более 10 патентов. Наданный момент предлагаем клиентам 14 сервисов ипорядка 40 микросервисов, среди которых сервисы определения эмоций, синтеза ираспознавания речи. Укаждого мини-подразделения своя команда, свои инженеры исвоя логика принятия решений. Периодически мыпривлекаем разработчиков нааутсорсе? например, консультируемся сталантливыми специалистами помашинному обучению, которые работали сGoogle иIBM.
Что касается бизнес-модели, тотут мыиспользуем два разных подхода. Первая модель предполагает бесплатный доступ кнашей платформе, нопри этом каждое действие наней биллингуется. Если клиент использует голосового бота, тодействует посекундный тариф. Это удобно, потому что обычно нарынке устанавливают поминутную тарификацию или берут фиксированную сумму за15 секунд? из-за этого приходится переплачивать. Если бот говорил ровно 10 секунд, токлиент платит ровно за10 секунд? нибольше, нименьше.
Счат-ботами работаем попохожей системе: настраиваем сервис бесплатно, нозалюбое действие помощника берем оплату поустановленному тарифу.
Вторая бизнес-модель TWIN? это enterprise-версия продукта. Вэтом случае мывстраиваем платформу вконтур компании иоказываем сервисную поддержку.
Вцелом, стараемся экспериментировать сбизнес-моделями. Например, вСША унас есть кейсы предоставления услуг поподписке? впакет услуг входит 100 / 200 минут назвонки сиспользованием голосового бота. Наамериканском рынке вообще распространены пакетные услуги? компаниям проще регулярно вносить фиксированную сумму заподписку, чем оплачивать сервис посекундно.
Кроме того, с2003 года вАмерике действует национальная база данных телефонных номеров владельцев, отказывающихся отрекламных звонков,? DoNot Call Registry. Стараемся всегда учитывать такие нюансы местного законодательства.
?Выподчеркиваете, что принципиально нестанете тратить деньги наненужные разработки ради эксперимента. Как выопределяете, вкакие технологии инвестировать, аоткаких стоит отказаться?
?Мывсегда ищем наиболее оптимальное иэффективное решение. Изачастую обучение нейросети снуля? это нелучший вариант, поэтому мыграмотно соединяем возможности уже доступных сервисов. Для распознавания речи мыдополняем собственную систему распознавания речи TWIN разработками Google, Amazon, Tinkoff иЯндекса. Именно эти усилия приводят ккачественному распознаванию напротяжении всего диалога. Это дорого, нозато эффективно? все сервисы используются одновременно ипозволяют быстро подобрать релевантный вариант. Врезультате такой работы мыполучаем95%распознавания речи, что лишь немногим уступает показателям человека. Когда мыначинали в2016 году, точность систем распознавания речи держалась науровне 70-80%.
?Выкак-то дорабатываете существующие модели алгоритмов?
?Чтобы системы работали качественно, они должны постоянно совершенствоваться. Поэтому мынепрерывно собираем инсайты наоснове уже записанных диалогов ипрокачиваем алгоритмы. Для этого мыберем готовый диалог, корректируем все несовершенства ипоотдельным сегментам выгружаем всистему для дальнейшего обучения. Тренировать ИИнам помогают студенты радиофака УрФУ (ИРИТ-РтФ)? они занимаются профессиональной разметкой данных вкачестве практики.
?Вытакже предлагаете клиентам сервис распознавания эмоций поголосу. Насколько это эффективная технология?
?Большинство наших клиентов можно поделить нашесть категорий: это финтех-сервисы, транспортно-логистические компании, сервисы грузоперевозок, страховые компании, e-commerce площадки илидогенераторы. Обычно ихконтакт-центры работают вдовольно монотонном ритме.
Нобывают случаи, когда клиент обращается несостандартным вопросом пообслуживанию, аснегативом? например, задерживается посылка или груз. Робот здесь ничем непоможет, атолько вызовет еще большее раздражение. Эмоционального клиента мынебудем соединять сботом, асразуже переведем наоператора. Так, негативный отклик будет отрабатывать работник колл-центра, аклиенту спозитивным настроем компания может сделать выгодное спецпредложение, поскольку онболее сговорчив иготов кдиалогу.
Изначально запрос наэтот сервис возник утранспортной компании. Мыпланировали настроить распознавание 12 эмоций, нопока технологии позволяют сминимальной погрешностью определить лишь три настроения: позитивное, негативное инейтральное. Алгоритм маркирует базовые эмоции безошибочно в93-95% случаев? разница в5-7% зависит откачества связи. Определять оттенки настроения уже сложнее? например, трудно понять, обеспокоен клиент или раздражен.
Стекстовыми чат-ботами все примерно также: алгоритм непросто распознает эмоции поключевым словам, онопределяет общее настроение текста? ивслучае негатива переключает клиента наоператора. Бывает, что клиент использует грубую лексику, нонасамом деле задает обычный вопрос. Наша технология распознавания текста видит разницу.
Также уTWIN есть опция распознавания гендера поголосу спервой секунды разговора? точность составляет98%. Это важный момент, поскольку голосовые боты часто звонят наномер конкретному клиенту, носнять трубку может кто угодно. Робот сфункцией распознавания поймет, что трубку взял мужчина, хотя клиент? женщина. Вэтом случае бот попросит позвать ктелефону нужного человека.
?Акакие вцелом перспективы утехнологии распознавания речи нарынке? Покакой траектории она будет развиваться?
?Технологии становятся все более доступными? качественный сервис распознавания речи, который вусловном 2016-м стоил 1млн рублей, сегодня можно купить за50тыс. Из-за демократизации популярность продолжит расти, ираспознавание голоса станет базовой надстройкой, которой будут пользоваться тысячи компаний повсему миру. Одним словом, рынок ожидает стабильный рост, нопри этом сама технология станет более растиражированной, азначит, конкуренция обострится.
?Можноли говорить обавтоматизации целых профессий из-за развития распознавания? Например, заменятли боты операторов колл-центров?
?Недумаю, что все контакт-центры станут автоматизированными вдиапазоне 5 или даже 10лет. Ноголосовые технологии, безусловно, спровоцируют рост рынка? индустрия будет увеличиваться ненаумеренные 30% вгод, ав2, 3 или даже 5 раз.
Втоже время унас был один очень интересный кейс. Засчет внедрения технологий TWIN компания, которая задва года нетолько несократила штат из500 человек, ноинаняла дополнительно еще 600 специалистов. Вцелом, новые технологии? это нестолько про сокращение издержек, сколько про ихоптимизацию, атакже увеличение прибыли. Поэтому массовые сокращения? покрайней мере вкрупных компаниях? это точно миф.
Важно понимать, что применение голосовых технологий неограничивается колл-центрами. Наш продукт рассчитан натысячи компаний, скоторыми коммуницируют миллионы клиентов ежедневно? через менеджеров, посредников итак далее. Рынок контакт-центров вРоссии оценивается в13-14млрд рублей, тогда как общий рынок коммуникаций составляет, понашим оценкам, 150млрд.
?Вслучае сголосовыми технологиями встает вопрос этики. Голосовая система Duplex отGoogle всвое время вызвала немало вопросов, например долженли ИИпредставляться вдиалоге склиентом ипредупреждать, что насвязи бот, анечеловек. Как вырешаете эту проблему ипроблемали это, наваш взгляд?
?Сюридической точки зрения, технология пока формально никак нерегулируется? закон обискусственном интеллекте вРоссии все еще обсуждают имногие понятия досих пор незакреплены. Нароссийском рынке компании сами вправе решать, будетли бот представляться электронным помощником или реальным человеком. Понашему опыту, оба варианта пользуются одинаковой популярностью. Однако внекоторых сферах важно, чтобы робот называл себя автоинформатором, анесотрудником компании.
Лично япредпочелбы общаться сконкретным собеседником? если это человек, тоондолжен представиться, аесли бот, тоунего должно быть уникальное имя или цифровой идентификатор. Обычно люди понимают, что говорят сроботом, если речь синтезирована. Ноесли мыиспользуем записанные диктором фразы, тов70-100% случаях бота принимают зачеловека.
?Закакими голосовыми технологиями выследите икакие прорывы ожидаете вближайшее время?
?Приоритетное направление сегодня? это как раз синтез речи, потому что технология еще далека отсовершенства. Самое слабое звено? это эмоциональный окрас речи, который пока струдом дается ботам. Вторая технология, закоторой мыследим,? это инструменты для автоматизированного принятия решений. Команда TWIN уже работает над языком программирования роботов, который вомногом опирается наалгоритмы стратегических видеоигр. Каждое ваше решение определяет дальнейший ход событий. Поэтому первостепенная задача сейчас? написать иоживить код.
Поля, отмеченные * обязательны для заполнения