Основи розширених моделей машинного навчання за допомогою графічних процесорів

Основи розширених моделей машинного навчання за допомогою графічних процесорів
машинне навчання-4129175_1280

Хоча в ЗМІ рідко оприлюднюється, не все про розгортання-і, звичайно, не про навчання чи тонку настройку-моделі машинного навчання легко доступні через API. Для певних реалізацій успіх застосувань для підприємств мови залежить від обладнання, підтримуючи інфраструктуру та інші практичності, які потребують більше, ніж просто постачальника хмарних послуг.

Графічні підрозділи (GPU), мабуть, знаходяться на передньому плані цих міркувань, особливо для організацій, які мають власні центри обробки даних. Незважаючи на те, що GPU -графічні процесори обчислювальних ресурсів є незамінним для певних випадків використання ШІ (особливо для побудови моделей та інших реквізитів з наукових даних), вони не завжди доступні.

“Їх, здається, важко знайти, або вони приходять з великою кількістю струнних струн”, – зізнався Елі Лар, інженер старшого рішення Leaseweb. «Довгі зобов'язання, знаєте, великі суми передових витрат. Або компанії просто не можуть їх отримати, незалежно від того, скільки вони запитують або скільки грошей вони пропонують. Їх постачальники не мають їх доступних ».

Нещодавнє оголошення Leaseweb про наявність серії графічних процесорів NVIDIA було розроблено для пом'якшення цих проблем та зміцнення інфраструктури, необхідної для використання передового машинного навчання. Компанія пропонує NVIDIA L4, NVIDIA L40S та NVIDIA H100 NVL, які стають доступними через його лінійку виділених серверів.

“Вони в основному охоплюють все, від невеликих до великих випадків використання”, – згадав Девон Резерфорд, рішення з продажу та менеджер з операцій у Leaseweb. «Ми можемо робити кілька графічних процесорів на сервері. Ми працюємо з низкою різних клієнтів, які використовують наші графічні процесори для всього, від мовних моделей до відео -аналітики ».

Масштабована обробка підприємств

Вартість GPU для корпоративних програм мовних моделей та інших випадків використання вдосконаленого машинного навчання є неоціненною. Більше того, вони виходять за межі основної парадигми підсумування та питання, що відповідають питанням, популяризували за допомогою ганчірки та інших методів швидкого збільшення. Натомість вони живлять додатки, які наближаються до реалізації повного масштабу AI підприємства для критичних випадків використання місії. Лар сформулював випадок використання охорони здоров’я, який, ймовірно, не може бути можливим, якщо масштабована обробка, що постачається GPUS.

Постачальник медичних послуг відбиває дані з ряду джерел, включаючи медичні записи, аналізує дані та використовує результати для персоналізації лікування пацієнтів. При такому підході організація “гарантує, що люди не приймають ліки, які вони не повинні приймати, або враховувати свою історію – сім'ю, генетика”, – прокоментував Лар. «Це просто неймовірна кількість даних. І тоді вони можуть порадити місцевих медичних працівників щодо того, що вони повинні робити, і не повинні робити з певним пацієнтом ».

Процес відбору GPU

Згадана організація охорони здоров’я LAHR використовує графічні процесори NVIDIA Leaseweb для цієї заявки. Однак є численні графічні процесори, які ставлять на підприємство, щоб вибрати потрібний, щоб відповідати його конкретним потребам. Конкретна програма майже завжди доводить у цьому відношенні визначальні. “Більш важлива, більша розмова, яку ми маємо вести з будь -яким з наших клієнтів, – це де ти з речами?” Виявив Лар. “Це модель висновку? Ми у виробництві? Ми тренуємось? “

Вимоги до наукових даних для побудови моделей з нуля або навіть тонко налаштовані моделі в деяких випадках, як правило, більш суворі, ніж для оператизаційних моделей. Однак, оскільки цикл наукових даних неминуче передбачає обидва кінці цього спектру, організації повинні стратегічно стратегізувати, які типи графічних процесорів вони отримують доступ. “Якщо ви тренуєтесь, вам, мабуть, потрібно трохи більше сили”, – зазначив Лар. “Тут дійсно надходять H100. До того часу, коли ви потрапите до виробничого навантаження, можливо, вам не знадобиться стільки потужності, і L4 або L40 можуть зробити”.

Стратегія GPU

Згаданий Lahr H100S є найбільш здатним з GPUS Leaseweb в даний час, а L4 – найменше. Тим не менш, він може живити будь -яку кількість навантажень, включаючи ті, що є основними для науки про дані та натяків на еволюцію цих процесорів та їх загальну заслугу на підприємство. “L4, ми зараз називаємо це початковим рівнем, але це робить набагато більше, ніж середній рівень в останньому поколінні”,-прокоментував Лар. “Речі змінюються зовсім небагато, коли ми переходимо від групи до групи”.

Таким чином, під час використання графічних процесорів, можливо, організації можуть вибрати менш здібні (і менш дорогі), і розглянути можливість їх поєднання в навантаженнях – особливо, оскільки більше одного можна отримати через спеціальні сервери. “Це хороша стратегія для деяких, щоб залишитися з декількома маленькими картками замість однієї великої”, – сказав Лар. «Ми можемо побудувати відповідно. Ми так гнучкі ».

Масштабована обробка AI

Графічні процесори є ключовими для надання обчислювальних ресурсів, які потребують масштабу своїх когнітивних обчислювальних потреб. Вони можуть прискорити ці розгортання для всіх аспектів ШІ, від побудови та тонких налаштувань моделей до розміщення їх у виробництві. Отже, вони, ймовірно, залишаться пріоритетними для ряду випадків використання, особливо тих, що включають аспекти високоефективних обчислень.