Rubrik Annapurna — це служба RAG ETL для GenAI – блоки та файли

Rubrik Annapurna — це служба RAG ETL для GenAI – блоки та файли

Rubrik Annapurna — це служба RAG ETL для GenAI – Rubrik Annapurna — це служба RAG ETL для GenAI – блоки та файли

Rubrik оголосив про свою пропозицію Annapurna, єдиного API-сервісу для клієнтів, які розробляють програми GenAI, які будуть інтегровані з Amazon Bedrock і нададуть своїм великим мовним моделям доступ до даних, отриманих Rubrik, із засобами контролю доступу.

Захисник даних і постачальник кібервідмовостійкості Rubrik збирає та захищає копії даних клієнтів за допомогою своєї технології резервного копіювання, яка працює локально та в загальнодоступних хмарах для захисту корпоративних програм і даних SaaS. Він має доступ до величезних обсягів даних своїх клієнтів, що зберігаються в його RSC (Rubrik Security Cloud). Це джерело для пошуково-доповненої генерації (RAG), додавання приватних даних клієнтів до LLM, які пройшли навчання на загальних даних. RAG доповнює загальні навчальні дані запатентованою інформацією.

1733760100 337 Rubrik Annapurna — це служба RAG ETL для GenAI – Rubrik Annapurna — це служба RAG ETL для GenAI – блоки та файли
Біпул Сінха

Біпул Сінха, генеральний директор Rubrik, голова правління та співзасновник, зазначив: «Організації стикаються зі значною складністю під час розробки програм штучного інтелекту через проблеми з доступом до даних і дозволами на конфіденційні дані. Це може призвести до того, що програми не матимуть відповідних знань або не дотримуватимуться контролю доступу».

Він стверджує: «Rubrik Annapurna допомагає розблокувати корпоративні дані та метадані Rubrik Security Cloud. У поєднанні з Amazon Bedrock, який пропонує величезну колекцію перевірених базових моделей і можливостей корпоративного рівня, ми можемо надати клієнтам потужні та безпечні попередні вбудовування, які стимулюють генеративні ініціативи ШІ».

Зверніть увагу на пункт «попередні вставки». Це стосується того факту, що LLM використовують семантичний пошук, який шукає подібності між збереженими векторами, створюючи свої відповіді. Вектори — це математичні перетворення багатьох аспектів або розмірів елемента пошуку. Вони використовуються для створення відповіді на запит користувача. Елементами пошуку можуть бути частини речення, фраза чи слово, аудіозапис, зображення чи відео. Такі дані зберігаються в необробленому форматі: файл документа, електронна таблиця, пошта, JPEG, MPEG тощо, а у випадку Rubrik — файл резервної копії з метаданими.

Рубрика Аннапурна графіка
Рубрика Аннапурна графіка

Перш ніж це може бути використано LLM, його потрібно витягнути з джерела, перетворити на вектори, а потім завантажити у векторну базу даних; класична процедура ETL (Extract, Transform, and Load) типу, що використовується сховищами даних. Annapurna — це ETL Rubrik для того, щоб зробити свої дані доступними для LLM для RAG, і він втілює занепокоєння Rubrik щодо безпеки, щоб гарантувати, що LLM, доступний у Bedrock Amazon у цьому випадку, отримує доступ лише до ретельно підібраних даних, які відповідають його статусу.

Розділ компонентів схеми Аннапурни
Розділ компонентів схеми Аннапурни

Програма GenAI клієнта здійснюватиме виклики API до Rubrik Security Cloud для надання даних і окремі виклики API до Bedrock для активації там LLM і, таким чином, зможе відповідати на запити користувачів. Annapurna може динамічно оновлювати доступ у міру оновлення даних, зміни дозволів і введення конфіденційних даних. Запобіжні заходи включають приховування та фільтрацію конфіденційних даних, контроль доступу на основі ролей джерела (SRBAC) і огорожі Amazon Bedrock.

Annapurna з Bedrock має надати клієнтським додаткам GenAI доступ до корпоративних даних і метаданих у SaaS, застарілих і домашніх програмах, таких як CRM, системи виставлення рахунків і управління знаннями, і налаштувати їх. Їх можна підключити «без користувацьких API, громіздких процесів передачі завантаження екстракту (ETL) або користувацьких конвеєрів даних». Існує «єдине гнучке та настроюване сховище даних, призначене для використання в усіх додатках ШІ організації».

Кріс Салліван, віце-президент з каналів і альянсів Америки в AWS, сказав: «Інтеграція Rubrik Amazon Bedrock із службою Annapurna API допомагає клієнтам краще використовувати всі свої дані – незалежно від того, де вони знаходяться – для керування налаштованими безпечними генеративними додатками ШІ».

1733760100 120 Rubrik Annapurna — це служба RAG ETL для GenAI – Rubrik Annapurna — це служба RAG ETL для GenAI – блоки та файли

Приклади таких захищених програм GenAI, надані Rubrik, — це більш інтелектуальний експерт із підтримки клієнтів для кожного представника, розумніший помічник з продажу для кожної команди з продажу та більш креативний помічник з маркетингу. Продавець-помічник міг підключити «кілька роз’єднаних додатків, таких як Salesforce CRM, електронні листи, чат Teams і навіть записи Zoom, що знаходяться в сегментах Amazon Simple Storage Service (Amazon S3). Команди продажів можуть швидко отримати 360° підсумок і якісний огляд угод клієнтів з організаційним контекстом з електронних листів клієнтів, телефонних розмов і відповідних внутрішніх комунікацій між командою».

Принципи зрозумілі, але для впровадження цих можливостей потрібен час. Це тому, що векторне вбудовування даних, які зберігаються в Rubrik, ще не доступне.

Компанія каже: «Annapurna розроблена для забезпечення безпечного вбудовування корпоративних даних і метаданих через єдиний API. Ці вбудовування розпізнають загальні схеми додатків і можуть бути налаштовані, щоб допомогти прискорити розробку пошуку даних для генерації з доповненим пошуком (RAG)».

У блозі Rubrik від 3 грудня йдеться: «Рубрик Annapurna для Amazon Bedrock буде розроблений, щоб надати підприємствам безпечну, масштабовану та сумісну основу для генеративного ШІ». Буде розроблено, тобто ще не доступне. Існує також технічний блог Rubrik Annapurna, який вказує на технічну документацію Annapurna.

Тут сказано, що Annapurna забезпечує «попереднє вбудовування даних у RSC, попередньо навчених за типом додатка (наприклад, CRM, білінг тощо)». Немає подробиць про те, що саме мається на увазі під попереднім вбудовуванням. У технічному документі говориться, що Annapurna «буде розроблена для проактивного захисту каналу даних для Amazon Bedrock шляхом використання даних, якими вже керує Rubrik». Annapurna матиме автоматичні захищені пристрої для отримання даних, які можуть використовуватися Bedrock LLM. Вони використовують існуючі набори даних у Rubrik Secure Vault. До Bedrock надається програмний доступ для інтеграції корпоративних джерел даних, що зберігаються в Rubrik, в архітектуру AI, яку потім можна використовувати для RAG.

У документі йдеться, що Rubrik може використовувати «дані резервного копіювання, наявні в Rubrik Security Cloud, вбудовувати ці дані у векторну базу даних і використовувати їх як доповнення для запиту користувача».

Взаємодія Аннапурни та Бедрока
Взаємодія Аннапурни та Бедроку

Rubrik ще не пояснив, як векторні вбудовані дані, що зберігаються RSC, будуть створені з його попередніх вбудованих даних, а також звідки походить векторна база даних. Він може, наприклад, використовувати Pinecone або Weaviate, які мають служби векторного вбудовування. Ці моменти стануть зрозумілими, коли можливості Annapurna будуть надані наступного року. Annapurna буде розширено для підтримки функцій, еквівалентних Bedrock, у Azure та Google Cloud.

Rubrik, як і конкурент Cohesity з його Gaia, тепер має надійну концепцію GenAI і стратегію для своїх клієнтів. Ми очікуємо, що їхні головні конкуренти, Veeam, Dell і Commvault, розроблять подібні можливості конвеєра даних RAG.

Comments

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *