Компанія NTT, Inc. використала нещодавній науково-дослідний форум NTT у Токіо, щоб детально розповісти про нову технологію ШІ під назвою Large Action Model (LAM).
Що таке LAM?
Це модель штучного інтелекту, яка передбачає наміри клієнтів на основі даних часових рядів, організованих у форматі «4W1H» (хто, коли, де, що та як), зібраних із різних точок взаємодії з клієнтами, включаючи онлайн-канали та фізичні магазини.
На відміну від великої мовної моделі (LLM), яка, як ми знаємо, загалом працює над розумінням, інтерпретацією та генеруванням тексту людською мовою, основна функція LAM полягає в «перетворенні людського введення» в конкретні кроки в певному середовищі чи системі.
На практиці LAM часто служать основою для агентів ШІ.
З точки зору аргументації та планування, LAM часто об’єднують складне планування та логічні можливості для визначення оптимальної послідовності дій, необхідних для досягнення кінцевої мети користувача.
Ця технологія забезпечує «дуже персоналізований маркетинг 1-на-1», пристосований до потреб кожного клієнта.
Числові та категоріальні дані
LAM — це генеративна технологія штучного інтелекту, що спеціалізується на даних часових рядів, яка включає як числові, так і категоріальні дані, маючи структуру, подібну до великих мовних моделей (LLM).
Можливо, чисельні дані — це інформація, що стосується основної цінності, а категориальні дані використовуються для класифікації інформації в різні групи, не зовсім так, як мета-дані та синтаксичний аналіз бази даних, але в тому ж полі, тобто. Категориальні дані містять інформацію, яка детально описує якості, характеристики чи групи… їх значення зазвичай є мітками чи іменами, тому їх фактично не можна використовувати для значущої арифметики.
Інтеграційна ситуація DOCOMO
NTT відповідав за дослідження, розробку та налаштування моделі, тоді як DOCOMO займався інтеграцією даних клієнтів, створенням LAM і перевіркою ефективності просування. У результаті кількість замовлень мобільних і розумних послуг, пов’язаних із життям, за допомогою телемаркетингу зросла майже в 2 рази порівняно зі звичайними методами.
Завдяки оптимізації дизайну та параметрів власний LAM DOCOMO був створений менш ніж за один день обчислень, що еквівалентно приблизно 145 годинам GPU, на сервері GPU, оснащеному вісьмома блоками NVIDIA A100 (40 ГБ).
Згідно з NTT, “Оскільки компанії прагнуть підвищити рівень задоволеності клієнтів і створити нові можливості для отримання доходу, просування маркетингових стратегій стало ключовим викликом. Донедавна більшість компаній покладалися на “сегментний маркетинг”, який групує клієнтів за такими атрибутами, як вік або стать, і надає індивідуальні пропозиції кожній групі. Однак останніми роками “маркетинг 1-до-1”, який пропонує персоналізовані пропозиції для кожного окремого клієнта, привертає увагу, створюючи потребу в більшій кількості чітке розуміння клієнта».
Компанія стверджує, що для ефективного впровадження індивідуального маркетингу важливо використовувати послідовні дані про поведінку, отримані з різних щоденних точок контакту з клієнтами, і розуміти потреби клієнтів на основі всього процесу, що веде до придбання продуктів або підписки на послуги, відомого як шлях клієнта.
Однак через те, що частота та формат даних відрізняються в різних точках дотику, інтегрувати та аналізувати дані часових рядів було технічно складно. Наприклад, дані про використання програми створюють високочастотні операційні журнали, тоді як дані про магазини в основному складаються з менш частотних даних, таких як придбані товари та способи оплати. Інтегрувати ці різноманітні набори даних в уніфікований спосіб складно, і при спробі додатково врахувати комбінації та послідовності взаємодій клієнтів складність і обчислювальна вартість аналізу значно зростають.
Тим часом NTT каже, що проводить дослідження та розробку технології штучного інтелекту під назвою LAM, яка вивчає та передбачає моделі поведінкових послідовностей у даних часових рядів, які включають як числові, так і категоричні дані.
Модель на основі трансформатора
Ця технологія має архітектуру, подібну до великих мовних моделей (LLM), і дозволяє прогнозувати майбутню поведінку за допомогою моделі на основі трансформатора, тобто типу архітектури нейронної мережі, яка використовується в глибокому навчанні з особливим відношенням до обробки природної мови (NLP), яка використовує механізм, який називається самоувагою.
У цьому співробітництві всередині NTT Group дві компанії інтегрували свої відповідні технології. Використовуючи платформу CX Analytics від DOCOMO для консолідації даних клієнтів у формі часових рядів і застосовуючи LAM NTT з оптимізованим методом налаштування, вони створили власну LAM DOCOMO, досягнувши зниження витрат на обчислення.
