Наш ассоциированный член www.Bikinika.com.ua

Олексій Авдєєв: «Не знаю, як це роблять в ФСБ чи ЦРУ, але так, ми навчилися автоматично виявляти дзвінки певного типу»

  1. Прокачай свої digital-скіли!

Нещодавно компанія Calltouch оголосила про випуск нового інструменту - технології обробки вхідних дзвінків, що дозволяє автоматично аналізувати і визначати їх типи.
Cossa з'ясувала, що це таке, кому потрібно і які у технології перспективи. Наш співрозмовник - Олексій Авдєєв, комерційний директор Calltouch.

- Андрій Коновалов, Cossa: Олексій, якщо в двох словах - що ж ви зробили?

- Олексій Авдєєв, Calltouch: Ми зробили Calltouch Predict - це технологія визначення типу і цінності вхідного дзвінка.

- А.К .: Тобто це якийсь алгоритм, який може виділяти смислові одиниці в запису дзвінка і потім ці записи якось класифікувати?

- А.А .: Абсолютно вірно. Система вміє автоматично знаходити дзвінки певного типу, типи ці задаються клієнтом. Наприклад, автодилер хоче знати, з яких рекламних каналів прийшли дзвінки з продажу автомобілів, з яких - з продажу б / у автомобілів, по сервісних послуг, консультаційні дзвінки або дзвінки негативні, і так далі. І система на основі заданих клієнтом параметрів буде автоматично ці дзвінки шукати і відзначати.

Прокачай свої digital-скіли!

COSSA рекомендує круті практичні онлайн-курси для прокачування ваших digital-ськиллов:

COSSA гарантує якість програм і навчання за всіма цими освітніми програмами.

Реклама

- А.К .: Значить можна сказати, що всі ці секретні технології прослушки з автоматичним виявленням терористів, про які ми так багато читали в жовтій пресі, стали нарешті доступні і простим підприємцям? - А

- А.А .: Це, звичайно, гучну заяву - А . Я, на жаль, не володію інформацією, які технології використовує ФСБ або ЦРУ, але, тим не менш, так, ми навчилися автоматично виявляти дзвінки певного типу. Але ми використовуємо цю технологію в маркетингових цілях, для оптимізації рекламних активностей і для контролю якості обслуговування клієнта.

- А.К .: Найбільш очевидний питання: яким чином система це робить? І, мабуть, більш цікаве: як відбувається настройка? Клієнт повинен, скажімо, ключові слова вказати, чи тут якась більш хитра логіка?

- А.А .: Система працює на базі трьох основних модулів. Перший модуль - це розпізнавання мови, в поточний момент ми використовуємо Yandex.SpeechKit. За допомогою цієї системи ми переводимо мова в текст і далі він аналізується другим модулем - лінгвістичним.

Цей модуль виробляє нормалізацію тексту і готує його в спеціальному вигляді для передачі в модуль машинного навчання. Це важливий етап, так як без правильної підготовки розпізнаного тексту похибка аналізу може бути дуже високою.

Третій модуль - нейронна мережа, яка на основі оцінок клієнта виявляє ознаки, характерні для дзвінків певного типу. За отриманим набору ознак наступні дзвінки тіпірующіх автоматично.

Загалом, для того, щоб почати, клієнту потрібно просто вручну відзначити дзвінки всіх типів, які йому потрібні.

- А.К .: Тобто він не ставить якихось конкретних атрибутів або списку слів, а умовно каже: ось цей дзвінок - це дзвінок-спам, а ось цей дзвінок - корисний, про б / у автомобіль?

- А.А .: Так, саме так. Тільки потрібно, щоб ознаки були очевидні і зрозумілі. Так, щоб якщо попросити людину з вулиці проклассифицировать дзвінки за цими ознаками, він би з цим спокійно впорався. А якщо типи виділяються з якихось суб'єктивних параметрами, які усвідомлює тільки сам клієнт, то дзвінки такого типу будуть, швидше за все, відзначатися автоматично з великою похибкою.

Для формування навчальної вибірки досить відзначити вручну 150 дзвінків певного типу. Тобто клієнту потрібно прослухати дзвінки за останній час і всіх типів, які він хоче - свіжих дзвінків, має бути не менше, ніж по 150 штук.

- А.К .: Потім відбувається якась коригування? Система, наприклад, відносить дзвінок до певного типу, а ви говорите: немає, це інше?

- А.А .: Абсолютно вірно. Далі йде перевірка, тобто з 150 дзвінків певного типу, які зазначив клієнт, 100 дзвінків йдуть в якості навчальної вибірки, вони як раз вчать машину, а 50 дзвінків - контрольна вибірка. Тобто система спочатку вчиться, а потім на 50 дзвінках виробляє розмітку, яка порівнюється з тим, на чому наголосив клієнт.

Нормальна для нас точність на початку такого тесту - 95-100%, тобто один-два дзвінки можуть визначитися некоректно. У випадку досягнення цей результат, то система дозволяє почати роботу вже в стандартному режимі.

Якщо ж некоректно відзначилося більше двох дзвінків, тоді система пропонує розширити навчальну вибірку. Потрібно відзначити ще хоча б 50 дзвінків відповідного типу, щоб ця система могла працювати більш точно. Тобто, точність нижче 95% в принципі неможлива, система просто не дозволить перейти до роботи, поки не досягне цього рівня.

- А.К .: А якщо порівняти машинні результати з ручною сортуванням людиною?

- А.А .: Зараз по нашим тестам точність визначення варіюється від 96% до 100%. Результат, на наш подив, виявився чи не краще, ніж при людському ручному аналізі - тому що виключається людський фактор.

- А.К .: А що саме аналізується системою? Може бути, враховується емоційний фон, малюнок промови, її звучання?

- А.А .: Спочатку ми розробляли систему бренд-моніторингу, яка автоматично шукала по всіх відкритих джерел згадка бренду і обчислювала, що це за згадка: негативне чи позитивне, зміна тренда - стало більше позитивних або негативних згадок.

Тому зараз ми потенційно можемо аналізувати велику кількість параметрів, не тільки типи дзвінків і звернень входять, але і якісь глибші речі, як раз такі як тренди, їх зміни, загальна оцінка настрою клієнтів компанії, і так далі.

У тій версії, яку ми зараз запустили, функціонал досить простий, але найбільш цінний. Це визначення типу дзвінка по заданих користувачем побажанням. У подальших релізах, я думаю, ми будемо цей функціонал розширювати і додавати до нього вже якісь більш детальні аналітичні інструменти.

- А.К .: Ви витратили величезну кількість людино-годин для того, щоб замінити одне-єдине просте дію - позначку оператором типу дзвінка. Це ж дуже просто - оператор може після розмови поставити «галочку» в потрібному місці і все, одна секунда. Чи варто було так морочитися?

- А.А .: Так, найпростіший спосіб розмітки дзвінків - через оператора. Оператор під час розмови може натиснути на певну клавішу, і, скажімо, клавіша «1» буде означати, що дзвінок спамний, клавіша «2» - що цільовий, і потрібно внести його в CRM, і так далі.

Також це можна зробити на стороні клієнта, через голосове меню: «Якщо ви хочете купити машину - натисніть« 1 », записатися на сервіс - натисніть« 2 ». Ці способи прості і незатратним, але проблема в дуже великій залежності від людського фактора.

Коли ми даємо можливість вибирати клієнту, то похибка трохи менше, ніж коли ми вішаємо вибір на оператора. Якщо оператор сам вибирає тип дзвінка - це, в підсумку, призводить до повної каші.

За нашими тестами оператори, як правило, або ставлять типи дзвінків навмання, або взагалі не ставлять, тому що це зайвий час, а тут клієнт палко, і все горить, і роботи багато, і йому взагалі не до цього.

Це в підсумку призводить до досить високої похибки, або до високих витрат - коли за оператором ставимо супервайзера, який буде його поправляти, за супервайзером - іншого супервайзера, потім керівника, а зверху ще й директора.

Тобто занадто багато людського фактора, занадто багато адміністративних витрат на те, щоб цей спосіб працював хоча б більш-менш нормально.

- А.К .: Давайте ще раз повернемося до питання про настройку. До якої міри можуть бути деталізованим побажання користувача? Ті, якими позначається цільової дзвінок? Ось людина запитує нас про продукцію. Це, загалом, цільової дзвінок. А можемо ми при аналізі питання деталізувати: за асортиментом, наприклад, конкретні типи товарів або послуг розділити?

- А.А .: У теорії так, але тут треба розуміти все-таки деякі складності роботи технології, то, що вона побудована на базі сервісу розпізнавання мови і якість розпізнавання мови, на жаль, не 100% поки що.

Але якщо оператор розмовляє з клієнтом про якусь конкретну категорії товарів, наприклад - про газові котлах - то ми, швидше за все, зможемо точно визначити тип цього дзвінка і з якого саме напрямку йшла розмова. Без дуже детального поглиблення, на рівні категорії це аналізується цілком успішно.

- А.К .: Тобто, якщо людина дзвонив і обговорював конкретну модель смартфона, ми можемо сказати точно, що він спілкувався з приводу смартфона; а ось що стосується конкретної моделі - буде залежати від того, наскільки він її чітко і розбірливо вимовив.

- А.А .: Так, але, насправді все ще сильно залежить від конкретних скриптів продажів. Якщо колл-центр жорстко натренований використовувати якісь певні фрази, тоді точність і глибину визначення можна підвищити в рази. Якщо оператор буде говорити: «Ви цікавитеся смартфонами Apple і кілька разів потім в бесіді повторювати саме назва бренду Apple, то з високою ймовірністю ми зможемо цю інформацію до звіту додавати.

- А.К .: Виходить така СЕО-оптимізація розмовного тексту: «Ви хочете купити квартиру в Москві недорого?» - А

- А.А .: Так, дуже схоже. Але тут ми знову починаємо залежати від людського фактора, тому що в якихось дзвінках оператор колл-центру буде забувати вимовляти задані фрази. І якщо зав'язувати систему на конкретні фрази, які ми навчили операторів говорити, ми як раз ризикуємо, що щось піде не так, оператор забуде або щось ще. Тому потрібно починати тут з якихось широких базових речей, наприклад - аналізувати використання конкретних слів і їх зв'язок з результатами розмови в конкретній галузі.

Ми такий підхід протестували на медицині. Для медустанов дуже важливо зрозуміти, який дзвінок первинний, а який - повторний від вже існуючого клієнта. Проблема ця стоїть гостро, тому що часто люди дзвонять з різних телефонних номерів і просто по номеру це визначити неможливо. І ось ця проблема вирішилася за допомогою Calltouch Predict.

У цьому ж кейсі ми відразу ж аналізували теги «запис на прийом» і «дзвінок з негативним забарвленням». Це все обчислювалося дуже точно, в звіті можна було побачити всі дзвінки, коли людина дзвонив первинно, і при цьому ті дзвінки, в яких він в результаті записався на прийом, відзначалися ще додатковим тегом. Аналогічно відзначалися і дзвінки, коли клієнт був чимось незадоволений.

Такі ж експерименти були на автомобільній тематиці, виділялися дзвінки за типами напрямків і за типами послуг автодилера. На інтернет-магазинах ми будували поки що тільки верхній рівень, виділяли дзвінки продажні, консультаційні і таке інше.

Поки що ми не зібрали статистику - наскільки глибоко в інтернет-магазині можна автоматично визначати дзвінки по асортиментної матриці, зараз в процесі як раз всіх цих тестів. Скоро можна буде поділитися більш детально - наскільки глибоко ми навчилися виявляти якісь ознаки.

- А.К .: Якщо говорити про бізнес-процесах, то ваша головна мета - підвищити точність і знизити вартість сортування в порівнянні з ручною обробкою?

- А.А .: Точність тут насправді ... Якщо порівнювати «ручне» прослуховування дзвінків, так званий call-scoring, з автоматичним, то при прослуховуванні через хороший, досвідчений call-scoring центр, результати по точності будуть, без сумніву, високі.

Але проблема в тому, що це буде коштувати дорого, нам доведеться витрачати подвійний бюджет на обробку одного дзвінка: один оператор говорить по телефону, другий оператор потім цей дзвінок прослуховує, витрачає стільки ж часу. І ще, що першим відділом, що другим, потрібно управляти і контролювати їх роботу.

А у нас весь бюджет на використання технології зводиться до кількох рублям за розпізнавання хвилини мови, тобто це в рази дешевше, ніж «ручне» розпізнавання.

- А.К .: А на яких обсягах вхідних дзвінків доцільно використовувати таку технологію?

- А.А .: Треба розуміти, що будь-які витрати, в тому числі, що на маркетинг, що на контроль якості повинні бути рентабельними. Немає сенсу витрачати, скажімо, 20 тисяч рублів в разі, якщо ви заробите за рахунок впровадження тільки 3 тисячі. Тому наше рішення підійде скоріше середнім і великим компаніям, яким є резон аналізувати дзвінки, розуміти як раз - які дзвінки ефективні і які ні. На основі цих даних оптимізувати маркетинг, оптимізувати бізнес процес, роботу відділу продажів і так далі.

За кількістю дзвінків має сенс дивитися на використання цієї технології, якщо в місяць приходить хоча б від 500 до 1000 дзвінків.

- А.К .: Цікавий момент - з одного боку, що технологія показує в середньому в порівнянні з людиною більш високі показники по розпізнаванню, з іншого - відділи продажів задають жорсткі скрипти операторам колл-центру, роблячи їх роботу все більш механістично. Може бути, людина тут вже взагалі не потрібен? Наскільки близько ми підійшли до того, щоб спілкування з колл-центром стало повністю автоматичним, коли на питання клієнта відповідає мовної синтезатор?

- А.А .: Щодо штучного інтелекту скажу чесно - ми таку роботу поки не вели. Але тема дуже цікава і перспективна, і, судячи з трендам, цілком можливо через кілька років у нас уже можна буде більшу частину операторів колл-центру замінити якимись роботами.

Ми вже бачили багато кейсів, коли автоматизуються деякі бізнес-процеси компаній за рахунок якраз мовних технологій, за рахунок розумних голосових меню. Наприклад, автоматичний дзвінок з підтвердженням замовлення: «Здрастуйте, ви замовили у нас диван і крісло, доставка на 23 липня, будь ласка, підтвердіть ваш замовлення. - Так підтверджую. - Дякую за підтвердження, до побачення ».

Це все вже робиться, в деяких магазинах зараз вже впроваджені технології, що знижують навантаження на колл-центр, і автоматично обробні виклики, коли всі оператори колл-центру зайняті. Якщо колл-центр не може прийняти виклик, дзвінок переводиться на розумне голосове меню, і людина може, в принципі, з роботом поспілкуватися і зробити замовлення.

Звичайно, це поки що не одне і те ж, що поспілкуватися з людиною, не можна задати якісь нестандартні питання, але покупець уже може голосом сказати, що він хоче і отримати всю інформацію, аж до того, що навіть автоматично поставити замовлення на доставку .

- А.К .: Якщо хочете зробити замовлення - натисніть 1, якщо просто поговорити - дочекайтеся відповіді оператора. - А

- А.А .: Так, щось таке.

- А.К .: Кілька років тому була спроба впроваджувати на сайтах «інфов» - учнів електронних консультантів. Вони якраз повинні були на себе взяти відповіді на типові питання. Але не пішла, не вийшло заміни людині, зараз вже ніде їх не бачу.

- А.А .: Так, я теж дуже не люблю спілкуватися з голосовим меню - це, в принципі, те ж саме, що листуватися з чат-ботом. І це загальний тренд - і світової, і російський, експерти прогнозували зниження частки дзвінків з-за зростання різних автоматичних інструментів, але вона особливо не знижується, а в деяких галузях, навпаки, зростає.

Особливо на кількість дзвінків впливає поширення мобільних технологій - людям комфортніше натиснути на кнопку «зателефонувати» і поговорити з людиною, ніж відправляти заявку через телефон. Це швидше, простіше і ти отримуєш більше інформації.

Тому, автоматизація розмови, я думаю, буде наступним великим трендом, але не можу прогнозувати, коли це трапиться. Спілкуватися з роботами не хочеться нікому. Тому це стане можливо тоді, коли роботи будуть говорити на нормальному людському мові і в тебе не буде відчуття, що ти проходиш зараз тест Тьюринга або спілкуєшся з бездушною машиною.

Джерело фото на тізері: fastcompany.com

Думка редакції може не збігатися з думкою автора. Якщо у вас є, що доповнити - будемо раді вашим коментарям. Якщо ви хочете написати статтю з вашою точкою зору - прочитайте правила публікації на Cossa.

Андрій Коновалов, Cossa: Олексій, якщо в двох словах - що ж ви зробили?
Тобто це якийсь алгоритм, який може виділяти смислові одиниці в запису дзвінка і потім ці записи якось класифікувати?
Значить можна сказати, що всі ці секретні технології прослушки з автоматичним виявленням терористів, про які ми так багато читали в жовтій пресі, стали нарешті доступні і простим підприємцям?
Найбільш очевидний питання: яким чином система це робить?
І, мабуть, більш цікаве: як відбувається настройка?
Клієнт повинен, скажімо, ключові слова вказати, чи тут якась більш хитра логіка?
Тобто він не ставить якихось конкретних атрибутів або списку слів, а умовно каже: ось цей дзвінок - це дзвінок-спам, а ось цей дзвінок - корисний, про б / у автомобіль?
Потім відбувається якась коригування?
Система, наприклад, відносить дзвінок до певного типу, а ви говорите: немає, це інше?
А якщо порівняти машинні результати з ручною сортуванням людиною?

Новости