Использование особенностей технологии Google Speech API в работе голосового бота.

Как это работает? Особенности Google Speech API на практике

Основой голосового бота Keycall Sales bot стала технология от Google Speech API (или по-другому Cloud Speech-to-Text). Сегодня мы хотим рассказать, что это, и какие возможности она дает.
Cloud Speech-to-Text - технология, которая использует алгоритмы машинного обучения от Google, позволяет распознать человеческую речь и преобразовать ее в текст. С ней стали возможными голосовые поиски, голосовые команды, транскрибация аудио, видео и живых разговоров. Со скоростью распознавания ответа менее 2-3 секунд, технологию стало возможно использовать в голосовом маркетинге. Она “думает” со скоростью живого человека, слушает ответы клиентов и распознает их в тексты. Но, это только часть преимуществ, которые мы используем для голосового бота Keycall Sales bot.

Всемирный словарь

Огромная база данных позволяет технологии поддерживать больше 125 языков со всего мира и их вариантов.
Чтобы сделать возможным работу нашего голосового бота на территории Украины, мы прописали собственный модуль для распознавания диалектов украинского и суржика.

Распознавание в реальном времени

Возможность получить результат распознавания прямо с микрофона в реальном времени или с аудио.
Именно первый вариант - распознавание в реальном времени - мы используем для реализации голосового бота Keycall Sales bot. Технология быстро распознает ответы абонентов, а наша собственная самописная система выдает соответствующие предзаписанные диктором реплики. Так и получается «живой диалог».

Адаптация речи

Адаптация суржика, дилектов и особых слов после распознавания.
Google дал возможность кастомизировать адаптацию речи. Можно настроить распознавание особых терминов, редких слов, фраз. Конвертировать числа в года, даты, адреса, валюты и другое.
Благодаря этому мы реализовали возможность распознавать суржик, диалекты, особые слова для маркетинговых кампаний и ниш бизнеса. Благодаря этому наш голосовой бот не теряется в том, что ответить. Как мы разбирались с суржиком во время продажи зерновых и с/г техники - читайте в статье: Как голосовой бот покупал трактор и продавал зерно.

Прочность к шуму

Speech-to-Text отлично справляется с распознаванием в шумной среде, без предварительной шумоочистки.
Для распознавания аудиозвонков в голосовом маркетинге - эта особенность незаменимая. Голосовой бот распознает голос абонента на фоне шума техники во время полевых работ, в машине, в общественном транспорте, на рынке, в кафе, на детской площадке и тп.

Выводы

Открыв доступ к технологии Speech API, Google дал новый виток развитию голосового маркетинга. В процессе адаптации технологии, маркетинг голосовыми ботами получил возможность собрать обратную связь от клиентов, провести опросы на большую аудиторию, предложить скидку, продать билеты, провести кампанию по возврату старых клиентов и еще много и много возможностей.
Конечно, чтобы получить Keycall Sales bot в таком виде, в каком его знают сейчас, нам понадобилось еще хорошенько поработать - прописать программы по выдаче и сегментированию ответов, строить теории и тестировать их, измерять вовлеченность, научится писать конверсионные скрипты. Таким образом, технология распознавания Google Speech API вместе с опытом и комплексом знаний нашей команды стала незаменимой для автоматизации звонков наших клиентов.

Рекомендуем почитать

Рамка раздела контакты

Наши контакты

Зарегистрируйтесь и получите бесплатную
консультацию по улучшению вашего бизнеса
это поле необходимо заполнить
это поле необходимо заполнить
это поле заполнено некорректно
это поле необходимо заполнить
это поле заполнено некорректно