Використання DB Cosmos в тканині Microsoft

Використання DB Cosmos в тканині Microsoft

Ви можете використовувати ті самі інструменти запиту для пошуку векторних індексів, а також решту ваших даних, що надає можливість пошуку на основі подібності у ваших даних або точних відповідності. Цей підхід схожий на те, як працюють масштабні пошукові системи, і допоможе знайти та класифікувати результати великих напівструктурованих наборів даних, наприклад, пошук відповідних оглядів на веб-сайті електронної комерції. Тканина вимагає векторної політики для кожного контейнера DB Cosmos, який визначає розмір, розмірність та основну функцію відстані, що використовується для пошуку подібних векторів. Пошукові технології, такі як Diskann, потребує високої розмірності, принаймні 1000 розмірів (і максимум 4 096).

Запит Космосу БД у тканині

Коли ви запитуєте дані, що зберігаються в Cosmos DB через Onelake Tabry's Onelake, ви працюєте з дзеркальною копією даних вашого Cosmos DB. Під час зберігання даних він скопіюється у форматі Delta Parquet, який використовується в тканині, що дозволяє використовувати будь -який із підтримуваних інструментів запитів, включаючи робочу силу BI для спеціального аналізу. Запити тут можна зробити у всіх ваших оперативних даних, а не лише Cosmos DB, трактувати його як єдине ціле і все ще користуючись набором функцій Cosmos DB для додатків, які повинні використовувати ці дані.

Це також дозволяє вам скористатися іншими функціями тканини за допомогою даних вашого Cosmos DB, наприклад, використовуючи їх для швидкого додавання вбудовування та векторного індексу до ваших даних, тому його можна використовувати як частину даних заземлення для програми AI на основі генерації, що надається, (RAG).