Прискорити свої дані та робочі процеси AI, підключившись до Amazon Sagemaker Unified Studio з коду Visual Studio

Прискорити свої дані та робочі процеси AI, підключившись до Amazon Sagemaker Unified Studio з коду Visual Studio

Інженери розробників та машинного навчання (ML) тепер можуть підключитися безпосередньо до Amazon Sagemaker Unified Studio з їхнього редактора локального коду Visual Studio (VS Code). За допомогою цієї можливості ви можете підтримувати існуючі робочі процеси з розробки та персоналізовані конфігурації інтегрованого середовища розвитку (IDE), отримуючи доступ до сервісів Amazon Web Services (AWS) та штучного інтелекту та машинного навчання (AI/ML) в уніфікованих даних та середовищі розвитку AI. Ця інтеграція забезпечує безперебійний доступ від вашого місцевого середовища розвитку до масштабованої інфраструктури для запуску обробки даних, SQL Analytics та ML робочих процесів. Підключивши місцевий IDE до Unified Studio Sagemaker, ви можете оптимізувати свої робочі процеси в розробці даних та AI, не порушуючи встановлених практик розвитку.

У цій публікації ми демонструємо, як підключити свій локальний код VS до Unified Studio SageMaker, щоб ви могли створити повні дані про кінцеві до кінця та робочі процеси AI під час роботи у бажаному середовищі розробки.

Огляд рішення

Архітектура рішення складається з трьох основних компонентів:

  • Місцевий комп'ютер – Ваша машина розробки, що працює проти коду з інструментарію AWS для Visual Studio Code та встановленої Microsoft Remote SSH. Ви можете підключитися за допомогою інструментарію для розширення коду Visual Studio у коді VS, переглядаючи доступні Sagemaker Unified Studio Spaces та вибравши їх цільове середовище.
  • Unified Studio Sagemaker – Частина наступного покоління Amazon Sagemaker, Sagemaker Unified Studio – це єдині дані та розробка AI, де ви можете знайти та отримати доступ до своїх даних та діяти на ньому, використовуючи знайомі інструменти AWS для SQL Analytics, обробку даних, розробку моделі та генеративну розробку додатків AI.
  • Systems Systems Manager – Безпечна, масштабована служба віддаленого доступу та управління, що дозволяє безперебійному підключенню між місцевим кодом VS та Unified Sagemaker Unified Studio простором для упорядкування даних та робочих процесів розвитку AI.

Наступна діаграма показує взаємодію між місцевими студентами IDE та Sagemaker Unified Studio.
Архітектурна схема, що показує з'єднання між кодом VS, Unified Studio Sagemaker та AWS SSM

Передумови

Щоб спробувати дистанційне з'єднання IDE, ви повинні мати такі передумови:

  • Доступ до домену Sagemaker Unified Studio з підключенням до Інтернету. Для доменів, встановлених у режимі Virtual Private Cloud (VPC), ваш домен повинен мати маршрут до Інтернету через проксі-сервер або шлюз NAT. Якщо ваш домен повністю ізольований з Інтернету, зверніться до документації для налаштування віддаленого з'єднання. Якщо у вас немає Unified Studio домен Sagemaker, ви можете створити його за допомогою швидкої налаштування або опції налаштування вручну.
  • Потрібен користувач із обліковими повідомленнями SSO через IAM -центр ідентичності. Щоб налаштувати доступ до користувачів SSO, перегляньте документацію.
  • Доступ до або може створити проект Unified Studio Sagemaker.
  • Редактор jupyterlab або коду обчислює простір з мінімальною вимогою типу екземпляра 8 ГБ пам'яті. У цій публікації ми використовуємо ml.t3.large екземпляр. Підтримується зображення розповсюдження Sagemaker Версія 2.8 або новішої версії.
  • У вас є останній стабільний код проти Microsoft Remote SSH (версія 0.74.0 або пізніші), а також на локальній машині, встановленій інструментарією AWS (версія 3.74.0).

Реалізація рішення

Щоб увімкнути віддалене підключення та підключитися до простору з коду VS, виконайте наступні кроки. Щоб віддалено підключитися до Sagemaker Unified Studio Space, простір повинен бути включений віддалений доступ.

  1. Перейдіть до свого простору редактора jupyterlab або коду. Якщо він працює, зупиніть простір і виберіть Налаштувати простір Щоб увімкнути віддалений доступ, як показано на наступному скріншоті.
    Показує, як налаштувати простір у Unified Studio Sagemaker
  2. Увімкнути Віддалений доступ Щоб увімкнути функцію та вибрати Зберегти та перезапуститияк показано на наступному скріншоті.
    Увімкніть перемикач віддаленого доступу в Unified Studio Space Sagemaker
  3. Перейдіть на інструментарій AWS у своєму локальному встановленні коду.
    Навігація на інструментарій AWS у коді vs
  4. На Unified Studio Sagemaker Вкладка, виберіть Увійдіть, щоб розпочати роботу і надайте свою URL -адресу домену SageMaker Unified, тобто, https://.sagemaker..on.aws.
    Уніфікована студія Sagemaker Unified Studio у коді VS
  5. Вам буде запропоновано перенаправити до вашого веб -браузера, щоб дозволити доступ до розширень AWS IDE. Вибирати ВІДЧИНЕНО Щоб відкрити нову вкладку веб -браузера.
    Повідомлення про вхід до Sagemaker Unified Studio Domain
  6. Вибирати Дозволити доступ Для підключення до проекту через код VS.
    Дозволити доступ до проекту Unified Studio Sagemaker від коду VS
  7. Ви отримаєте a Запит затвердженого Повідомлення, що вказує на те, що тепер у вас є дозволи на доступ до домену віддалено.
    Схвалення, що проти коду є доступ до домену Unified Studio Sagemaker

Тепер ви можете повернутися до свого місцевого коду проти коду, щоб отримати доступ до проекту, щоб продовжити створення робочих місць ETL та трубопроводів даних, навчання та розгортання моделей ML або побудови генеративних програм AI. Щоб підключитися до проекту для обробки даних та розробки ML, виконайте ці кроки:

  1. Вибирати Виберіть проект Для перегляду своїх даних та обчислення ресурсів. Усі проекти в домені перераховані, але вам дозволено доступ до проектів, де ви є членом проекту.

    Виберіть проект у своєму локальному та коді

    Ви можете переглянути лише один домен та один проект за один раз. Щоб переключити проекти або вийти з домену, виберіть значок Ellipsis.

    Перегляд даних та обчислення ресурсів та комутаційних проектів у локальному коді проти коду

    Ви також можете переглядати обчислювальні та ресурси даних, які ви створили раніше.

  2. Підключіть простір редактора jupyterlab або коду, вибравши піктограму підключення, як показано на наступному зображенні. Примітка. Якщо ця опція не відображається як доступна, то у вас може бути відключений віддалений доступ у просторі. Якщо простір знаходиться у стані “зупинено”, наведіть курсор на простір і виберіть кнопку підключення. Це повинно дозволити віддалений доступ, запустити простір та підключитися до нього. Якщо простір знаходиться в стані “запуск”, простір потрібно перезапустити за допомогою віддаленого доступу. Це можна зробити, зупинивши простір і підключившись до нього, як показано нижче з інструментарію.
    Піктограма підключення в локальному та коді

    Інше вікно VS Code відкриється, яке підключено до вашого Unified Studio Space Sagemaker за допомогою віддаленого SSH.

  3. Перейдіть до Дослідник Щоб переглянути ноутбуки, файли та сценарії вашого простору. З інструментарію AWS ви також можете переглянути джерела даних.
    Провідник у локальному коді проти коду після віддаленого SSH -з'єднання, що показує підключення до Sagemaker Unified Studio Space

Використовуйте свою власну налаштування коду з Sagemaker Unified Studio Resources

Коли ви підключаєте код VS до Unified Studio Sagemaker, ви зберігаєте всі особисті ярлики та налаштування. Наприклад, якщо ви використовуєте фрагменти коду для швидкого вставки загальної аналітики та моделей коду ML, вони продовжують працювати з інфраструктурою, керованою студією Sagemaker.

У наступній графіку ми демонструємо використання ярликів робочого процесу аналітики. Запит фрагментів коду “шоу-матері”, щоб показати доступні бази даних, “Show-Glue-Table” перелічує таблиці в каталозі даних AWS клей, а “Запит-комерція” отримує дані за допомогою Spark SQL для аналізу.

Графіка, що показує, як використовувати фрагменти коду в локальному та коді для запиту ресурсів даних у Unified Studio Sagemaker

Ви також можете використовувати ярлики для автоматизації побудови та навчання моделі ML на AI Sagemaker. У наведеній нижче графіці фрагменти коду показують обробку даних, налаштування та запуску навчальної роботи AI Sagemaker. Цей підхід демонструє, як практикуючі даних можуть підтримувати свою звичну налаштування розвитку, використовуючи керовані дані та ресурси AI у Unified Studio Sagemaker.

Графіка, що показує, як виконувати обробку даних та навчати роботу Sagemaker AI віддалено у VS -коді за допомогою фрагментів коду

Відключення віддаленого доступу в Unified Studio Sagemaker

Як адміністратор, якщо ви хочете відключити цю функцію для своїх користувачів, ви можете застосувати її, додавши наступну політику до ролі IAM вашого проекту:

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Sid": "DenyStartSessionForSpaces",
            "Effect": "Deny",
            "Action": [
                "sagemaker:StartSession"
            ],
            "Resource": "arn:aws:sagemaker:*:*:space/*/*"
        }
    ]
}

Прибирати

Sagemaker Unified Studio за замовчуванням вимикає простої ресурси, такі як Jupyterlab та редактор коду через 1 годину. Якщо ви створили уніфікований студійний домен Sagemaker для цілей цієї публікації, не забудьте видалити домен.

Висновок

Підключення безпосередньо до Amazon Sagemaker Unified Studio з локального IDE зменшує тертя переміщення між місцевим розвитком та масштабованими даними та інфраструктурою AI. Підтримуючи свої персоналізовані конфігурації IDE, це зменшує необхідність адаптації між різними середовищами розвитку. Незалежно від того, чи обробляєте ви великі набори даних, моделі навчальних фундаментів (FMS) або створюєте генеративні програми AI, тепер ви можете працювати з місцевої установки, отримуючи доступ до можливостей Unified Studio Sagemaker. Почніть сьогодні, підключивши місцевий IDE до Unified Studio Sagemaker, щоб впорядкувати робочі процеси обробки даних та прискорити свою розробку моделі ML.


Про авторів

Лорен Малленнекс

Лорен Малленнекс

Лорен – старший архітектор спеціалізованих рішень Genai/ML в AWS. Вона має понад десятиліття досвіду роботи в ML, DevOps та інфраструктурі. Вона є опублікованою автором книги про комп'ютерне бачення. Поза межами роботи ви можете знайти її подорожі та походи зі своїми двома собаками.

Бхаргава Варадхараджан

Бхаргава Варадхараджан

Bhargava – старший інженер програмного забезпечення в Amazon Web Services, де він розробляє продукти AI & ML, такі як SageMaker Studio, Studio Lab та Unified Studio. Протягом п'яти років він зосереджений на перетворенні складних робочих процесів AI & ML на безшовні переживання. Коли не архітектурні системи в масштабах, Бхаргава переслідує свою мету – вивчити всі 63 національні парки США та шукає пригод через сходження, футбол та сноуборд. Його простої розбиваються між тим, що міткає з проектами, і подаючи його цікавість через книги

Анага Барве

Анага Барве

Anagha – менеджер з розробки програмного забезпечення в команді Unified Studio Amazon Sagemaker.

Анхіт Гупта

Анхіт Гупта

Anchit є менеджером продуктів Asenior для Unified Studio Amazon Sagemaker. Вона зосереджується на доставці продуктів, які полегшують створення рішення машинного навчання. У вільний час їй подобається готувати, грати на дошці/картці та читати.