Тюнингованный «Писец»: как новосибирские стартаперы помогают колл-центрам
Автоматизация процессов стремительно захватывает бизнес. Сегодня роботы выполняют задачи, проработка которых отнимала у специалистов время на творчество и креатив. Но все ли им под силу?
«Сибирские нейросети» — резидент Академпарка и участник Сколково, имеющий ИТ-аккредитацию. Помимо развития основных продуктов, компания также выполняет наукоемкие исследования в сфере искусственного интеллекта. На вопрос, сможет ли нейросеть полностью заменить журналиста, генеральный директор, основатель «Сибирских нейросетей» Виктория Кондрашук отчасти согласилась. Например, сегодня роботы-помощники в силах записать разговор и превратить его в текст. Такую процедуру мы провели в этом интервью с помощью сервиса «Писец», который вошел в пятерку финалистов в номинации «Стартапер года» по версии экспертного сообщества премии «Делового квартала» «Человек года».
«Деловой квартал» узнал, какие продукты на базе искусственного интеллекта уже сегодня помогают бизнесу.
Что такое «Писец»?
— Мы предоставляем сервис речевой аналитики, который обрабатывает разговоры в контакт-центрах и в точках обслуживания. Уникальность решения в том, что у нас хорошее качество распознавания речи. Мы используем свои авторские подходы, которые включают в себя постобработку — речевую аналитику более чем по ста параметрам. С уверенностью скажу, что среди всех представленных аналогов на рынке России мы одни из лучших, так как для стабильной работы системы требуется меньшее количество вычислительных ресурсов. Предоставляем свое ядро для распознавания речи и для анализа текстов, не используем стороннее API (интерфейс прикладного программирования, который вызывает сервис для преобразования аудиозаписей в письменный текст). Также наша система легко адаптируется под новую предметную область или терминологию без обучения на датасете, только за счет тюнинга языковой модели.
В локациях или внутри компании заказчика устанавливаются специальные микрофоны, после окончания записи речи операторов и клиентов система выдает структурированные и подробные отчеты по оценке их диалогов, что затем благоприятно влияет на развитие бизнеса. Нашу разработку можно использовать для протоколирования совещаний — сервис выполняет распознавание речи и приводит ее в надлежащий вид. Другим применением нашего решения считается домен распознавания голосовых команд в рамках устройств “умного" дома. Для использования модели распознавания речи на устройствах команда наших сотрудников провела процедуру сжатия модели, что повысило ее производительность и уменьшило ресурсоемкость без потери качества распознавания.
Вы сами развивали проект или заручились поддержкой извне?
— Мы не получали никакую государственную поддержку, проект развивается полностью на собственные средства. Разработка моделей распознавания речи и анализа текста также проводилась только нашими усилиями. Осуществляем деятельность в двух режимах. Первый — заказная разработка, когда мы создаем решения на базе искусственного интеллекта под нужды клиентов. Второй — продажа продуктов, лицензий и доработка авторских решений. Однако отмечу: предпосылкой к созданию компании послужило мое участие в акселераторе от Академпарка «А:Старт». После прохождения программы мы с коллегами открыли стартап и начали заниматься коммерциализацией продуктов.
Какие направления работы вы развили, как они отличаются друг от друга?
— Работаем в двух направлениях: исследовательская деятельность, создание и доработка продуктовых решений. Сейчас в штате 17 работников, включая трех сторонних консультантов. Это ведущие сотрудники НГУ, ученые с множеством научных публикаций, победители международных конкурсов по машинному обучению и анализу данных. Исследователи и ученые нашей команды разрабатывают новые нейросетевые архитектуры и модели. Они их обучают и сжимают, чтобы те работали быстро, даже на небольшом аппаратном обеспечении. Далее по созданным моделям команда инженеров дорабатывает решения и устанавливает их в контур компаний заказчиков.
Также существуют два формата поставки: SaaS и On‑Premise. В случае SaaS заказчик приобретает подписку на наш продукт и пользуется им через подготовленную веб-платформу. On-Premise решения предполагают их внедрение как малому бизнесу, так и целым корпорациям.
Сколько тестовых испытаний прошел проект?
— Тестовые испытания не прекращаются, так как происходит непрерывный процесс разработок новых, более мощных версий продуктов. Недавно наша система «Писец» принимала участие в акции «Тотального диктанта»: наряду с человеком, в режиме реального времени, она под диктовку записала текст одного из известных писателей современности. Команда разместила промышленные микрофоны, которые производили захват звука в аудитории. Сложность была в том, что диктор читает текст несколько раз — сначала целиком, а потом по предложениям. Для «Писца» же требуется единичное прочтение. После проверки результатов филологами из НГУ наш «Писец» получил оценку между тройкой и четверкой — в пунктуационном плане робот практически справился, а вот в распознавании некоторых слов ошибки были. Возможно, это связано с акустикой аудитории и наличием посторонних звуков.
Какие основные проблемы качества работы внутренних колл-центров вы выделяете? Как это влияет на бизнес?
— Обычно процесс переговоров — это черный ящик для бизнеса. Руководители компаний узнают о проблемах уже от собственных клиентов. Наш сервис помогает проанализировать все диалоги, найти негативные реплики всех недовольных клиентов, оценить работу операторов. Бизнес может об этом узнавать в режиме реального времени, затем быстро на это реагировать.
В разных колл-центрах, например, в банках или в сфере продаж, существуют разные бизнес-требования к качествам звонков. Конечно, есть общие — когда оператор представляется, называет компанию, — и те, которые связаны с законом о персональных данных. Во втором случае, при фиксации нарушений со стороны сотрудника, руководитель бизнеса сможет избежать проблем. Также оценивается вовлеченность работника и его пунктуальность во время разговора. Например, сотрудник сказал, что вернется к разговору через минуту, но это произошло позже. Такого быть не должно, потому что это вызывает недовольство у клиентов. Сервис также анализирует речь по словарям — выявляет слова-паразиты, фиксирует паузы и перебивание оператором речи клиента.
По вашему мнению, эти решения одни из лучших на рынке. Борьба с крупными игроками за большее внимание заказчиков вас не пугает?
— Не могу сказать, что мы боремся за клиентов. В глобальном плане я больше за содействие всех игроков, так как это способствует развитию технологий в стране. Намного лучше, когда компании, разрабатывающие технологии, не скрывают их от мира, а, наоборот, делятся опытом с коллегами.
Наличие конкурентов на поле благотворно на нас влияет, так как есть, с кем себя сравнивать. Это путь к улучшению. Важную роль играет уровень узнаваемости — у Яндекса он выше, потому что эта компания дольше на рынке. Однако у нас есть технические преимущества, с помощью которых сможем привлечь и заинтересовать клиентов.
Какие у вас планы по дальнейшему развитию и расширению функционала?
— У нас есть дорожная карта проекта, которая содержит планы на создание API для самостоятельного дообучения акустического и языкового компонентов сервиса заказчиком. Это позволит ему осуществить адаптацию и оценку системы в случае необходимости работы с новым доменом без привлечения специалистов по машинному обучению. Также планируем в следующему году увеличение операционной деятельности и выручки в три раза.
Елизавета Михайлова