Категорія: Великі Дані та Аналітика

  • Новий спосіб інтерпретації даних — програма GIS Accelerator

    Новий спосіб інтерпретації даних — програма GIS Accelerator

    Програма GIS Accelerator – це п’ятиденний інтенсивний курс, який знайомить учасників з базовими навичками ГІС. Чергова когорта програми стартувала 6 січня.

    Emily Khym

    22:39, 12 січня 2025 р

    Штатний репортер



    спосіб інтерпретації даних — програма GIS Accelerator Новий спосіб інтерпретації даних — програма GIS Accelerator

    Ксімена Солорцано, штатний фотограф

    Програма Yale GIS Accelerator, яка має на меті навчити філії університету, як використовувати географічні інформаційні системи, або ГІС, у проектах, розпочалася 6 січня 2025 року. Це п’ятиденна інтенсивна навчальна програма з ГІС під керівництвом Джилл Келлі, викладача в Школі громадського здоров'я.

    Програма складається з лекцій, демонстрацій, лабораторних вправ і наставництва консультантів з ГІС, щоб допомогти учасникам правильно візуалізувати та проаналізувати свої просторові дані. Це не вимагає жодних передумов. Програма, яка проводиться кожні два роки в січні та червні, пропонує учасникам гібридний формат.

    «Учасники залишають програму з базовими навичками ГІС, принаймні однією завершеною картою даних свого проекту, розумінням видів просторового аналізу, яким вони можуть займатися далі, і — ми сподіваємося — ентузіазмом щодо подальшої геопросторової роботи», — сказав Келлі News. .

    Наприкінці програми учасники представляють підсумкові презентації. Запрошені рецензенти з Єльського університету, уряду, інших університетів і приватного сектору запрошуються надати відгук під час цих презентацій.

    За словами Міріам Оліварес, керівника служби геопросторової підтримки, понад 94 відсотки респондентів оцінили своє задоволення програмою як відмінне.

    «Вражає бачити, як стажери, які практично не знайомі з геопросторовими технологіями, швидко навчаються та завершують вступний проект ГІС, часто пов’язаний із їхніми поточними дослідженнями, який демонструє їх захоплення та прогрес лише за один тиждень», – сказав Оліварес. «Я пов’язую цей успіх з усвідомленням учасниками потужності застосування геопросторових технологій у своїх дослідженнях, а отже, з їх бажанням вчитися, а також з досвідом і педагогічним підходом провідного викладача, доктора Джилл Келлі, видатного спеціаліста з ГІС. вихователь».

    У середньому програма приймає близько 40 учасників. Керівництво цією програмою принесло Келлі радість від різноманітності проектів і знайомства з новими людьми.

    «Мені подобається спостерігати, як проекти розвиваються з клубка таємничих даних у послідовну карту», ​​— сказав Келлі. «Іноді учасники справді вловлюють геопросторову помилку та продовжують відвідувати купу курсів ГІС або навчатися самостійно, а потім роблять ГІС і просторовий аналіз основою своєї роботи… Дуже приємно дати цим дослідникам змогу вперше поглянути на тема».

    Для Келлі важливо спостерігати за тим, як учасники публікують просторові документи у своїх відповідних дисциплінах і впливають на реальний світ.

    Селін Горен '24, яка брала участь у програмі взимку 2023 року, навчилася використовувати ГІС як інструмент для аналізу геопросторових даних і картографування.

    «Зрештою я використав деякі з них [GIS] інструменти для створення карт для моєї старшої дисертації з екологічних досліджень наступного семестру», — сказав Горен. «Для того, щоб отримати максимальну віддачу від цього досвіду, було б гарною ідеєю заглибитися в нього із запитанням про геопросторовий аналіз і заздалегідь знайти хороші дані для аналізу. Оскільки акселератор – це зобов’язання на цілий день протягом 5 днів, а концепції розвиваються дуже швидко, я б порадив людям взяти його, коли у них буде вільний тиждень, і вони зможуть повністю зайнятися вивченням ГІС протягом цього тижня».

    Ця програма GIS Accelerator триватиме з 6 по 10 січня 2025 року.

    EMILY KHYM


    Емілі Хім відповідає за транспорт та інфраструктуру City Desk. Вона також розміщує папір для друку як співробітник виробництва та дизайну. Родом із Гонолулу, Гаваї, вона навчається на другому курсі коледжу Бенджаміна Франкліна за спеціальністю «Політологія» та має сертифікат з вивчення енергетики.

  • Репортаж — Індійська панорама

    Репортаж — Індійська панорама

    — Індійська панорама Репортаж — Індійська панорама

    У наступні п’ять років найшвидше зростаючими вакансіями стануть спеціалісти зі штучного інтелекту (ШІ), великих даних і управління безпекою, йдеться у звіті Всесвітнього економічного форуму (WEF) Future of Jobs Report 2025.
    У звіті, опублікованому за кілька днів до щорічної зустрічі WEF у Давосі з 20 по 25 січня, говориться, що до 2030 року скорочення робочих місць становитиме 22 відсотки робочих місць.
    Дослідження також показало, що до 2030 року також буде створено 170 мільйонів нових робочих місць.
    «Технологічні зміни, фрагментація геоекономіки, економічна невизначеність, демографічні зміни та зелений перехід, як окремо, так і в сукупності, є одними з основних рушійних сил, які, як очікується, формуватимуть і трансформуватимуть глобальний ринок праці до 2030 року», — йдеться у звіті.
    Інформація, представлена ​​у Звіті про майбутнє робочих місць за 2025 рік, є результатом даних, зібраних від понад 1000 провідних світових компаній, які разом представляють понад 14 мільйонів працівників у 22 галузях промисловості та 55 економіках з усього світу.
    Зазначається, що 60 відсотків роботодавців очікують, що зростання цифрового доступу матиме найбільш трансформаційну тенденцію для бізнесу.
    Штучний інтелект та машинне навчання, розробники програмного забезпечення та додатків, а також інженери FinTech фігурують серед найшвидше зростаючих вакансій у відсотковому вираженні, йдеться у звіті.
    Водночас очікується, що найбільше зростання в абсолютному вираженні обсягу відбудеться на перших посадах. До них належать сільськогосподарські робітники, водії доставки, будівельники, продавці, працівники харчової промисловості, економічні роботи, такі як медсестри, соціальна робота тощо.
    10 найшвидше зростаючих вакансій до 2030 року
    Відповідно до звіту WEF Future of Jobs 2025, ось 10 найшвидше зростаючих вакансій до 2030 року:
    – Фахівці з великих даних
    – Інженери FinTech
    – Фахівці зі штучного інтелекту (AI) і машинного навчання
    – Розробники програмного забезпечення та програм
    – Фахівці управління безпекою
    – Фахівці зі сховищ даних
    – Фахівці з автономних та електромобілів
    – Дизайнери UI та UX
    – Водії легких вантажівок або служб доставки
    – спеціалісти з Інтернету речей
    Слід зазначити, що штучний інтелект трансформує індустрії по всьому світу, і половина співробітників планує використовувати його, щоб відкрити нові можливості. З них 41 відсоток планують скоротити свою робочу силу за рахунок автоматизації, а 77 відсотків планують підвищити кваліфікацію своїх працівників.

  • Проект правил щодо інсектицидів (п’ята поправка), 2024 р

    Проект правил щодо інсектицидів (п’ята поправка), 2024 р

    Міністерство сільського господарства та добробуту фермерів запропонувало поправки до Правил щодо інсектицидів 1971 року, спрямовані на полегшення фермерів, які використовують біопестициди. Це повідомлення було опубліковано 3 січня 2025 року.

    Проект правила опубліковано для громадського обговорення. Вони пропонують знизити плату за тестування зразків біопестицидів, які подають фермери. Ці запропоновані поправки підпадають під дію Правил щодо інсектицидів (П’ята поправка) 2024 року.

    Ключові моменти проекту повідомлення:

    Плата за тестування/аналіз зразків біопестицидів, поданих фермерами для перевірки якості, буде визначено у переглянутому Другому додатку. Очікується, що ця плата буде нижчою, ніж існуюча плата за тестування звичайних інсектицидів.

    Проект правил передбачає плату в розмірі рупій. 200 на зразок біопестицидів, де відомий активний інгредієнт.

    Центральний уряд може також розглянути питання про звільнення окремих урядів штатів від цих зборів на розумний період через справжні труднощі.

    Відгуки громадськості та графік впровадження

    Громадськість має подати заперечення чи пропозиції щодо запропонованих змін до 2 лютого 2025 року.

    Зворотній зв’язок можна надіслати спільному секретарю (захист рослин), Міністерство сільського господарства та добробуту фермерів, Департамент сільського господарства та добробуту фермерів, Кріші Бхаван, Нью-Делі-110 001, або електронною поштою за адресою muktanand.ias08@nic.in

    Очікується, що зміни набудуть чинності після остаточної публікації в газеті.

    Міністерство сільського господарства та добробуту фермерів шукає відгуків громадськості щодо запропонованих змін. Після розгляду всіх коментарів, отриманих у встановлений термін, уряд доопрацює правила та введе їх у дію.

  • П’ять висновків з останньої оцінки GSA за розділом 508

    П’ять висновків з останньої оцінки GSA за розділом 508

    Остання загальнодержавна оцінка Розділу 508 Управління загальних послуг показує, що агентства все ще намагаються відповідати стандартам цифрової доступності.

    Насправді оцінка GSA за фінансовий 2024 рік — другий річний звіт після минулорічної історичної оцінки — показує, що відповідність уряду стандартам Розділу 508 знизилася за останній рік. Лише 23% найбільш відвідуваних загальнодоступних веб-сайтів повністю відповідають стандартам розділу 508, тоді як 20% сторінок внутрішньої мережі відповідають усім стандартам.

    Представники GSA попередили «застій у роботі з доступністю» на заході в середині листопада, до випуску звіту в грудні.

    Але Майк Гіффорд, старший стратег фірми цифрових послуг CivicActions, сказав, що оцінка 2024 року знаменує собою ключовий крок у оцінці прогресу в Розділі 508 за рік.

    «Це сталося вже двічі», — сказав Гіффорд. «Єдиний спосіб переконатися, що доступність є пріоритетом для департаментів, які надають послуги американцям, — переконатися, що ці послуги принаймні оцінюються, і існує процес, за допомогою якого ви можете порівнювати агентства та те, як добре, вони зосереджують свої внутрішні системи на доступності».

    Отже, що 397-сторінковий звіт говорить нам про те, де агентства могли покращитися та чому загальна відповідність залишається низькою? Ось п’ять основних висновків з оцінювання 2024 року:

    Розділ 508 керівників програм зростає

    У той час як агенції відмовилися від відповідності, відбулося підвищення терміну зрілості розділу 508 в усьому уряді. Цей індекс вимірюється за допомогою кількох елементів, включаючи політику, придбання, тестування та навчання.

    Одна з головних галузей, на яких агентства зосереджувалися протягом минулого року, — наймання або призначення керівника програми Section 508. Меморандум від грудня 2023 року Управління управління та бюджету Білого дому наказало агентствам негайно найняти керівників програм із розділу 508.

    У 2024 фінансовому році 56% агентств повідомили про те, що вони працюють на неповний робочий день у розділі 508 PM, тоді як 33% агентств сказали, що вони мають повний робочий день. Лише 11% агентств повідомили, що не мають розділу 508 PM, порівняно з 21% у 2023 фінансовому році.

    Оцінка також виявила, що агентства призначали більше персоналу та часу в цілому для роботи з Розділу 508 у 2024 фінансовому році.

    «Хоча деякі організації повідомили про збільшення персоналу та ресурсів підрядників відповідно до розділу 508 за останній рік, багато організацій відзначили, що забезпечення ресурсами в цілому було — і залишається — проблемою», — додається у звіті.

    Процеси придбання мають вирішальне значення

    Остання оцінка GSA також показує, що багато агентств не перевіряють, чи продукти та послуги, які вони купують, відповідають стандартам цифрової доступності.

    У той час як більшість включає вимоги щодо доступності в заявках на ІТ, 46,% з них повідомили, що «іноді або ніколи» перевіряють доступність того, що було доставлено. Як зазначає GSA, «це все ще дуже високий відсоток організацій, які приймають результати контрактів, не знаючи, чи відповідають вони договірним вимогам щодо цифрової доступності».

    Гіффорд сказав, що агентства повинні забезпечити доступ своїх програмних і контрактних офісів до експертних знань розділу 508.

    «Там потрібно мати експертів з питань доступності», — сказав Гіффорд. «Ви також повинні мати експертів із питань доступності в команді із закупівель, щоб, якщо хтось виникне запитання про те, який продукт є найдоступнішим для X, Y і Z, хтось міг би прочитати [Voluntary Product Accessibility Template] і зрозуміти, що заявляють постачальники».

    У звіті рекомендовано вимагати Розділ 508 як основний чинник придбання.

    Він також закликає Конгрес зосередитися на доступності «програмного забезпечення з широким використанням», оскільки агентства часто використовують однакові або подібні продукти для продуктивності, опитувань, веб-сайтів та інших цифрових інструментів.

    Гіффорд сказав, що для агентств буде ключовою співпраця, щоб вимагати від постачальників ІТ кращої доступності.

    «Жодна інша організація у світі не купує стільки цифрових продуктів, як уряд США», — сказав Гіффорд. «Є можливість відіграти провідну роль, піти і сказати: «Нам потрібно переконатися, що наші постачальники та постачальники, які обслуговують уряди в усьому світі, створюють програмне забезпечення, яке є доступним». Їх не було останні 30 років».

    Тестування розділу 508 покращується

    Оцінка розділу 508 виявила, що більшість агентств повідомили про використання автоматизованих і ручних інструментів для тестування веб-сайтів та іншого цифрового вмісту на доступність.

    Але планування доступності залишається ключовою проблемою — 41% респондентів сказали, що іноді або ніколи не інтегрували відповідність розділу 508 у своє технологічне планування.

    Агентства розповіли GSA про численні проблеми, включаючи «різну прихильність до доступності в різних програмах, доступність все ще розглядається як запізніла думка, відповідність цифрової доступності не є частиною життєвого циклу технології, обмежені засоби тестування або їх відсутність і відсутність персоналу для тестування».

    Але загалом GSA відзначила, що тестування та інтеграція в життєвий цикл технології за розділом 508 покращилися за останній рік.

    Якість даних є ключовою проблемою

    Оцінка GSA ґрунтується на даних, отриманих власноруч, тобто дані придатні для неправильного тлумачення та інших проблем із якістю.

    «Дивлячись на дані як цього року, так і минулого року, в обох випадках були проблеми з якістю даних», — сказав Гіффорд. «Це трапляється будь-коли в уряді, коли хтось заповнює форму, легко зробити помилку».

    GSA визнає це у своєму звіті. Він виявив 575 помилок перевірки в усіх надісланих даних. З 245 організацій, які повідомили GSA, 182 мали принаймні одну помилку перевірки.

    «Оскільки ми продовжуємо спостерігати неправильне розуміння запитань і варіантів відповідей, GSA, OMB і Access Board вдосконалять і переформулюють питання і варіанти відповідей для ясності, додадуть вміст до розділу розуміння, щоб пояснити мету запитання та методи збору інформації для варіанти відповіді та продовжуйте доповнювати визначення термінів», – йдеться у звіті.

    Лідерство є ключовим

    Окрім технічної відповідності та політичних заходів, оцінка GSA також оцінює відданість керівництва доступності. А для 58% суб’єктів звітності показники ефективності доступності були невідомі або таких показників не було в планах ефективності керівництва.

    «Агентства повинні розробити показники, пов’язані з доступністю, щоб включити їх до річних планів ефективності керівництва. Підвищення підзвітності може збільшити пріоритетність цифрової доступності, ймовірно, покращуючи відповідність ІКТ», – йдеться в оцінці.

    Меморандум адміністрації Байдена від грудня 2023 року щодо Розділу 508 — перша подібна директива за понад десять років — заклала основу для того, щоб агентства приділяли більше уваги вимогам доступності. Незрозуміло, чи буде нова адміністрація Трампа виконувати ці зусилля.

    Гіффорд сказав, що за останні 30 років уряд США відстає від багатьох країн Європи, коли йдеться про цифрову доступність.

    «Якщо США хочуть повернути собі місце лідера у створенні інклюзивного та інноваційного цифрового середовища, то потрібні інвестиції, щоб переконатися, що ці люди можуть бути залученими», — сказав він.

    Авторське право © 2025 Federal News Network. Всі права захищені. Цей веб-сайт не призначений для користувачів, які знаходяться в межах Європейської економічної зони.

  • Дані зробили революцію у футбольних трансферах. Коли це зробить те саме з тактикою в реальному часі?

    Дані зробили революцію у футбольних трансферах. Коли це зробить те саме з тактикою в реальному часі?

    Бум футбольної аналітики міцно встановився, але її роль у грі залишається дискутованою.

    Деякі стверджують, що дані настільки очистили гру, що футбол став занадто одноманітним для пересічного вболівальника. Для інших підхід на основі даних романтизують як інструмент, який допомагає клубам знайти перевагу у створенні своєї історії аутсайдерів.

    Незалежно від вашої думки, аналіз даних у поєднанні з відеотехнологіями стає дедалі складнішим у футболі — навіть якщо його вплив на тактичний підхід команди продовжує обговорюватися.

    АтлетикМайкл Кокс нещодавно навів переконливий аргумент про те, що робота, яка проводиться в рамках футбольної аналітики, могла бути не такою мірою застосована на полі, як ми думали. Хоча вербування на основі даних — і навіть штучний інтелект — стає все більш цінним для клубів, залишається менше прикладів статистичних даних, які безпосередньо впливають на прийняття рішень у грі.

    Питання в тому, чому може існувати це роз’єднання?

    йти глибше

    ІДИ ГЛИБШЕ

    Чи вплив аналітики на сучасний футбол був переоцінений?


    З точки зору клубу, бар’єри можуть бути більш елементарними, ніж ви можете собі уявити.

    Обмежувальні фактори часто можуть знаходитися поза межами досягнутих технологічних досягнень. Наприклад, зростання внутрішньоігрового відеоаналізу було придушено протягом майже 10 років після того, як у середині 2000-х заборонили відеопристрої біля поля — головним чином для захисту арбітрів від скарг на їхню роботу — і правила не були послаблені до 2018 року.

    Тренерам і менеджерам доводилося чекати перерви, щоб переглянути будь-які відеоматеріали, але пристрої біля поля тепер є звичним явищем, що має помітний вплив на прийняття тактичних рішень.

    Використання відео в поєднанні з даними набуло популярності в останні роки. Наприклад, «MatchTracker» від Catapult поєднує дані відстеження гравців із відео в режимі реального часу, щоб візуалізувати те, що відбувається на полі, і інформувати про тактичні рішення на рівні команди чи гравця.

    зробили революцію у футбольних трансферах Коли це зробить те Дані зробили революцію у футбольних трансферах. Коли це зробить те саме з тактикою в реальному часі?

    Розвиток носимих технологій у наданні даних про продуктивність також може стати цінним джерелом інформації, яка може інформувати менеджера про тактичну стратегію під час гри.

    «Ми можемо відстежувати відстань між гравцями та відстань між лініями — отже, довжину та ширину команди», — пояснює Даніель Шопов з Barin Sports, який розробляє GPS-пристрої для елітних спортсменів.

    «Під час гри ми вимірювали, наскільки суперник тиснув на команду, з якою ми працювали, оскільки лінії захисту та півзахисту зближувалися. Ця інформація продиктувала заміну, тож тренер зрештою грав із п’ятіркою, дозволивши тим лініям розтягнутись. Ми змогли відстежити форму цієї команди в режимі реального часу, а потім поєднати це з фізичним станом, щоб знати, якого гравця замінити».

    йти глибше

    ІДИ ГЛИБШЕ

    Як розвиток носимих технологій змінює футбол

    Як би просто це не звучало, інвестиції в правильну інфраструктуру є ще одним бар’єром, який не кожен клуб подолав при використанні аналізу даних і відео. Це може бути настільки просто, як наявність пристроїв, необхідних для правильного підключення мережевого кабелю на стадіоні для запису відео в реальному часі та дозволу позначати події в грі (наприклад, реєструвати послідовність завершення удару, контратаку чи стандарт).

    Нещодавно побудований стадіон «Тоттенхем Хотспур» або «Gtech Community Stadium», ймовірно, буде повністю оснащений найновішими технологіями, що дозволить аналітикам на трибуні використовувати такі методи для надсилання тактичних повідомлень лаві запасних. З гіршими умовами на стадіонах клуби нижчого рівня футбольної піраміди можуть не мати такої розкоші.

    Едвард Саллі понад 20 років працював у відділі аналізу продуктивності в City Football Group, Manchester City і Bolton Wanderers і уважно спостерігав за цією технологічною еволюцією.

    «Ми, безперечно, починаємо спостерігати більше тренерів, які використовують відео та дані належним чином, щоб сприяти прийняттю рішень», — сказав Саллі, який зараз є директором із рішень для клієнтів компанії Hudl, що займається аналізом продуктивності.

    «Також стає доступним більше даних у реальному часі, і все більше компаній заохочують цей прогрес для використання даних у режимі реального часу для керівництва тренерами».

    Для Саллі усунення цих бар’єрів на шляху до успіху має вирішальне значення для подальшого прогресу спортивного аналізу. Hudl нещодавно придбала футбольну аналітичну компанію StatsBomb з метою поєднання високоякісного відео та даних для аналізу в грі в реальному часі.

    йти глибше

    ІДИ ГЛИБШЕ

    Hudl купує футбольну аналітичну компанію StatsBomb

    «Дані StatsBomb майже оперативні, тому вони фільтрують позначені події протягом хвилини або двох після того, як події відбуваються», — сказав Саллі.

    «Якщо ви тренер або аналітик, ви хочете зосередитися на плані гри, який ви придумали в день матчу. Чи працює наш підхід? Про які стратегічні зміни мені потрібно знати? Ви не хочете зосереджуватися на тегах «пас, удар, навіс», якщо можете допомогти.

    «В ідеалі ви хочете зосередитися на справді вражаючих, орієнтованих на ігровий план речах, але вам потрібен такий рівень деталізації живих даних, щоб допомогти вам впливати на це».

    1736532839 783 Дані зробили революцію у футбольних трансферах Коли це зробить те Дані зробили революцію у футбольних трансферах. Коли це зробить те саме з тактикою в реальному часі?


    (Джонатан Москроп/Getty Images)

    Висока плинність кадрів, як це часто буває у футбольному менеджменті, може стати перешкодою для створення узгодженої аналітичної структури, оскільки сприйнятливість до аналізу даних і відео може змінюватися від одного менеджера до іншого.

    Загроза бути звільненим може призвести до короткострокового мислення, що означає, що рішення не завжди сприяють найкращим практикам у довгостроковій перспективі. Така відсутність безпеки в галузі може визначати прогрес футбольної аналітики в клубі, лізі чи в усьому виді спорту.

    «У багатьох лігах, з якими ми працюємо, постійно змінюються тренери — це дуже залежить від ефективності», — сказав Саллі.

    «Це посилює нестабільність у лізі, а потім погіршується якість на полі, що впливає на комерціалізацію ліги, доходи та бажання інвестувати далі — отже, все це є наслідком цієї нестабільності. »

    йти глибше

    ІДИ ГЛИБШЕ

    Як відділи даних розвивалися та поширювалися в англійських футбольних клубах

    Дозволяти співробітникам процвітати – це недооцінена якість.

    Наявність одного члена персоналу, який займається обробкою даних, навряд чи пошкрябає поверхню в клубі, оскільки люди часто зобов’язані відповідати на спеціальні запити від тренерів. Натомість наймання команди спеціалістів із обробки даних, інженерів із обробки даних та аналітиків даних забезпечить міцну основу для створення справжнього глибокого впливу в довгостроковій перспективі.

    Як показано нижче в нещодавньому аналізі Traits Insights, спостерігається помітне зменшення кількості аналітичних співробітників у футбольних лігах Англії. У той час як у клубі найкращої шістки Прем’єр-ліги може бути в середньому 13,8 співробітників у всій аналітичній команді, цей показник значно падає, коли ви працюєте з рештою ліги та за її межами.

    зробили революцію у футбольних трансферах Коли це зробить те Дані зробили революцію у футбольних трансферах. Коли це зробить те саме з тактикою в реальному часі?

    Це може здатися нудним, але оптимізація робочих процесів усуває тимчасові обмеження, які накладаються на аналітичний персонал, і дає їм більше часу для обміну думками з ключовими особами, які приймають рішення, такими як тренери чи спортивні директори. Це може бути автоматизація звітів із даними після матчів, об’єднання даних із багатьох джерел у цілісну базу даних або розробка моделей даних, які тісно відповідають стилю гри клубу.

    Ключовим є визначення пріоритетів фінансів у довгостроковій перспективі. Такі клуби, як «Ліверпуль», «Брентфорд» і «Брайтон і Гоув Альбіон», часто вважаються золотим стандартом у підході до даних, але зобов’язання кожного клубу використовувати такі процеси є найважливішим фактором їхнього успіху.

    «Створення якісної інфраструктури даних коштує грошей, але багато клубів не роблять цього, тому що це дорого — але чи дорого це в контексті?» сказав Саллі. «Якщо ви не використовуєте дані, щоб вплинути на мільйони, які ви витрачаєте на гравців, тренерів, стратегії реабілітації чи запобігання травмам, то це буде дорого коштувати.

    «Але якщо у вас є план і ви використовуєте ці дані, щоб крутити диск у своїй роботі, тоді це має великий сенс. Якщо ви витрачаєте 10 мільйонів фунтів стерлінгів на гравця, то цифра, близька до 300 000 фунтів стерлінгів, є відносно невеликою сумою грошей у загальній картині, але вона допоможе вам приймати більш розумні рішення».

    Брайтон був яскравим прикладом цього в останні роки. Завдяки підходу, який базується на даних у всьому клубі, вони купують гравців за низькі ціни та продають їх значно дорожче.

    За даними Transfermarkt, лише «Челсі» та «Манчестер Сіті» отримали вищий прибуток від продажу гравців, ніж «Брайтон» у 393 мільйони фунтів стерлінгів з 2020-21 років — з Мойзесом Кайседо (куплений за 4 мільйони фунтів стерлінгів, проданий за 115 мільйонів фунтів стерлінгів), Марком Кукуреллою (від ~16 до ~60 мільйонів фунтів стерлінгів). ) і Алексіс Мак Аллістер (від ~10,3 до ~35 млн фунтів стерлінгів). помітні приклади.

    Такі інвестиції з боку ієрархії максимізують шанси на те, що аналітичні проекти будуть помічені, використані та включені в ширше стратегічне планування клубу. Більша можливість передати цю інформацію тренеру, менеджеру чи спортивному директору має вирішальне значення.

    «Якщо ви весь час просто обробляєте дані на ноутбуці, у вас буде дуже мало часу для фактичної роботи над великими проектами, які, як ви знаєте, будуть рухати циферблат», — сказав Саллі.

    «Багато людей у ​​цьому просторі будуватимуть чудові статистичні моделі, але іноді їх не бачать потрібні люди, і це дуже деморалізує. Це часто трапляється в галузі, і ми прагнемо змінити це на краще».

    1736532839 61 Дані зробили революцію у футбольних трансферах Коли це зробить те Дані зробили революцію у футбольних трансферах. Коли це зробить те саме з тактикою в реальному часі?


    Інші види спорту, такі як NFL, випереджають футбол з точки зору аналізу даних у реальному часі (Ric Tapia/Getty Images)

    Усунути перешкоди — це одне, але як дані можуть сформувати тактику команди в майбутньому?

    Оскільки клуби не бажають ділитися ідеями та надавати іншим конкурентну перевагу, прогрес може не прискоритися настільки, як хотілося б багатьом. Тим не менш, розвиток штучного інтелекту може зіграти ключову роль, аналізуючи відео в реальному часі та дані під час ігор, щоб надати тренерам розуміння.

    «Налаштування в день матчу дуже напружені, тому найкращі тренери виділяють час, щоб опрацювати будь-які тактичні зміни — вони можуть зробити таку оцінку своїми очима дуже швидко», — сказав Саллі.

    «Завдяки цьому наступному поколінню технологій, які можуть обробляти дані набагато ефективніше, ніж люди, це створить нову хвилю розуміння, яке може запропонувати тренерам тактичні зміни в режимі реального часу».

    Це показує, що аналітичний шлях ще далекий від завершення. Прикладів використання даних для безпосереднього впливу на гру може бути обмежено, але причини простіші, ніж здаються.

    (Дизайн заголовка: Імонн Далтон; фото: Getty Images)

  • Як одиниці старту NFL підійшли до Dynamic Kickoff 2024?

    Як одиниці старту NFL підійшли до Dynamic Kickoff 2024?

    Як одиниці старту NFL підійшли до Dynamic Kickoff 2024?

    10 годин тому


    одиниці старту NFL підійшли до Dynamic Kickoff 2024 Як одиниці старту NFL підійшли до Dynamic Kickoff 2024?

    У сезоні НФЛ 2024 року дебютував новий Dynamic Kickoff. Після найнижчої результативності початкового удару в історії НФЛ у сезоні 2023 року новий формат мав на меті вирішити проблему низького показника результативності початкового удару та зменшити рівень травм під час початкового удару.

    Див. пояснення динамічного старту

    Згідно з новим правилом, у 2024 році було зареєстровано ще 332 початкових повернення, що означає збільшення показника початкового повернення до 32,8%, порівняно з 21,8%. Ми також побачили 59 великих віддань — віддачі на 40 і більше ярдів — найбільше в лізі з 2016 року.

    Хоча віддача в лізі зростала, не всі команди ставилися до гри однаково.

    Щоб розглянути стратегію кожної команди, ми визначили, де припали початкові удари для кожної команди протягом сезону 2024 року.

    На діаграмі нижче показано місця приземлення стартових ударів від команд AFC. Команди відображаються в порядку зростання (зліва направо та зверху вниз) за відсотком ударів, які впали в ендзону. «Х’юстон Техас» найкомфортніше запрошував на повернення з найвищим показником ударів у зону приземлення (60%). Навпаки, Індіанаполіс Кольтс були більш консервативними, вибиваючи м’яч в ​​ендзону 92% часу.


    одиниці старту NFL підійшли до Dynamic Kickoff 2024.svg Як одиниці старту NFL підійшли до Dynamic Kickoff 2024?

    Відзначилися кілька команд AFC. «Піттсбург Стілерс», як правило, починали з середини поля, тоді як «Х’юстон Тексанс» і «Лос-Анджелес Чарджерс» демонстрували більшу різноманітність у тому, куди їхній гравець розміщував м’яч. Jacksonville Jaguars і Indianapolis Colts воліли бити глибоко в ендзону, хоча Jaguars, як правило, цілилися ліворуч, а Colts — праворуч.

    У NFC найагресивнішими були Washington Commanders, які завдали 60% своїх ударів у зону приземлення. New Orleans Saints (51%), Dallas Cowboys (42%) і Carolina Panthers (41%) також були відносно агресивними у коротких ударах. «Лос-Анджелес Ремс» і «Арізона Кардіналс» показали невелику різноманітність у своїй стратегії ударів — обидві команди спрямовували більшість своїх ударів у задню середину енд-зони.


    1736478949 393 Як одиниці старту NFL підійшли до Dynamic Kickoff 2024.svg Як одиниці старту NFL підійшли до Dynamic Kickoff 2024?

    Цікава тенденція: п’ять команд, які більшість своїх ігор проводили в закритих приміщеннях — «Кардинали», «Детройт Лайонс», «Колтс», «Рамс» і «Міннесота Вікінгс» — прагнули забити м’яч у ендзону.

    Ми припускаємо, що команди продовжуватимуть удосконалювати свій підхід протягом плей-офф. До тих пір ми можемо очікувати більше результатів з початку сезону.

  • Машинне навчання вдосконалює рішення для одноклітинного аналізу

    Машинне навчання вдосконалює рішення для одноклітинного аналізу


    зареєструватися безкоштовно прослухати цю статтю

    дякую Прослухайте цю статтю за допомогою програвача вище.

    Хочете прослухати цю статтю БЕЗКОШТОВНО?

    Заповніть форму нижче, щоб розблокувати доступ до ВСІХ аудіостатей.

    Дослідники накопичили величезні бази даних експресії одноклітинних генів, щоб зрозуміти, як найдрібніші деталі впливають на біологію людини. Однак сучасні методи аналізу не можуть працювати з великим обсягом даних і, як наслідок, дають упереджені та суперечливі результати. Вчені при Святий Юда Дитяча дослідницька лікарня створила алгоритм машинного навчання, здатний масштабуватися за допомогою цих одноклітинних сховищ даних, щоб надавати більш точні результати. Новий метод був опублікований сьогодні в Клітинна геноміка.

    До одноклітинного аналізу дані масової експресії генів давали високорівневі, але неуточнені результати для багатьох захворювань. Аналіз однієї клітини дозволяє дослідникам дивитися на окремі клітини, що цікавлять, що схоже на окреме зерно кукурудзи замість поля. Ці детальні висновки вже зробили прорив у розумінні деяких хвороб і методів лікування, але труднощі з тиражуванням і масштабуванням аналізу даних, розмір яких продовжує збільшуватися, зупинили прогрес.

    «Ми запровадили новий набір інструментів, який можна масштабувати, оскільки набори даних секвенування одноклітинної РНК продовжують зростати», — сказав автор-кореспондент Paul Geeleher, PhD, Святий Юда Кафедра обчислювальної біології. «Стався експоненціальний вибух у часі обчислення для аналізу однієї клітинки, і наш метод повертає точний аналіз у прийнятні часові рамки».

    Усі методи вивчення експресії генів в одній клітині створюють великі обсяги даних. Коли вчені одночасно перевіряють мільйони клітин, об’єм комп’ютерної пам’яті та обчислювальної потужності, необхідні для обробки даних, є величезними. Команда Geeleher звернулася до іншого типу апаратного забезпечення, щоб допомогти вирішити проблему.

    Хочете більше останніх новин?

    Підпишіться на Технологічні мережі' щоденний інформаційний бюлетень, який щодня доставляє останні наукові новини прямо до вашої поштової скриньки.

    Підпишіться БЕЗКОШТОВНО

    «Ми створили метод, який використовує графічні процесори або графічні процесори», — сказав перший автор Сюейін Лю, доктор філософії, Святий Юда Кафедра обчислювальної біології. «Інтеграція GPU дала нам обчислювальну потужність для виконання обчислювальних навантажень масштабованим способом».

    Машинне навчання без нагляду для одноклітинного аналізу

    Обсяг даних часто змушує дослідників йти на поступки та робити припущення, які вносять упередження під час проведення аналізу стандартними методами. The Святий Юда вчені використали підхід штучного інтелекту, який усуває таке упередження з цих виборів.

    «Наш метод використовує неконтрольоване машинне навчання, яке автоматично визначає більш надійні та менш довільні параметри для аналізу», — сказав Лю. «Вона вчиться групувати клітини на основі їхніх різних активних біологічних процесів або типів клітин».

    Оскільки алгоритм навчається та аналізує представлені дані, дослідники можуть використовувати його для будь-якого значного набору даних секвенування одноклітинної РНК. Оскільки він досліджує кожен новий великий набір даних окремо та використовує лише підказки програми експресії, щоб зробити висновки, дослідники назвали цей підхід Консенсусом і масштабованим висновком програм експресії генів (CSI-GEP). При застосуванні до найбільших одноклітинних баз даних РНК CSI-GEP дав кращі результати, ніж будь-який інший метод. Найбільш вражаючим є те, що алгоритм міг ідентифікувати типи клітин і активність біологічних процесів, пропущених іншими методами.

    «Ми створили інструмент, широко застосовний для вивчення будь-якої хвороби за допомогою аналізу одноклітинної РНК», — сказав Гілехер. «Метод працював значно краще, ніж усі існуючі підходи, які ми тестували, тому я сподіваюся, що інші вчені розглянуть можливість використовувати його, щоб отримати кращу цінність своїх одноклітинних даних».

    Посилання: Liu X, Chapple RH, Bennett D та ін. CSI-GEP: підхід неконтрольованого машинного навчання на основі графічного процесора для відновлення програм експресії генів у одноклітинних РНК-секвенаційних даних атласу. Клітинна геноміка. 2025; 5 (1). зробити: 10.1016/j.xgen.2024.100739

    Ця стаття перепублікована з наступних матеріалів. Примітка: матеріал міг бути відредагований щодо довжини та змісту. Для отримання додаткової інформації, будь ласка, зв’яжіться з цитованим джерелом. З нашою політикою публікації прес-релізів можна ознайомитися тут.

  • Майбутнє робочих місць, за даними Всесвітнього економічного форуму

    Майбутнє робочих місць, за даними Всесвітнього економічного форуму

    Відповідно до останнього звіту Всесвітнього економічного форуму про майбутнє робочих місць, світовий ринок праці готовий до суттєвих змін до 2030 року, коли багато робочих місць зазнають зриву.

    Ця зміна глобального ландшафту зайнятості призведе до створення 170 мільйонів нових ролей і подальшого переміщення 92 мільйонів існуючих посад, що призведе до чистого приросту 78 мільйонів робочих місць у всьому світі.

    Дослідження WEF показало, що рушійною силою цих кардинальних змін є швидкий технологічний прогрес, зміна демографічних моделей, ескалація геоекономічної напруги та зростання економічного тиску. Ці сили колективно змінюють галузі та професії в глобальному масштабі.

    Найбільшою проблемою для розширення бізнесу буде зростаюча різниця між наявними та необхідними навичками, оскільки зміниться майже 40% компетенцій, необхідних на робочому місці. Ця невідповідність кваліфікації вже викликає серйозне занепокоєння, оскільки майже дві третини роботодавців (63%) називають це основною перешкодою для зростання. Оскільки ринок праці продовжує швидко трансформуватися, ця прогалина може створити ще більш критичну перешкоду.

    У той час як очікується, що попит на технологічні знання у сфері штучного інтелекту, великих даних і кібербезпеки зростатиме, орієнтовані на людину здібності, такі як творче мислення, стійкість і здатність до адаптації, залишатимуться важливими. Професійне зростання залежатиме від поєднання цих технічних навичок і навичок спілкування.

    Динаміка ринку праці

    Зростання вартості життя стало каталізатором змін на ринку праці, за даними WEF, половина роботодавців очікує, що це змінить їхні бізнес-моделі.

    Незважаючи на нещодавнє послаблення глобальної інфляції, постійний ціновий тиск у поєднанні з уповільненням економічного зростання, за прогнозами, матиме далекосяжні наслідки для зайнятості. Ця економічна турбулентність змусить як компанії, так і працівників переглянути свої позиції та стратегії на ринку, що стає все більш нестабільним.

    Крім того, очікується, що відмінні моделі демографічних тенденцій справлятимуть значний вплив на світову робочу силу.

    Старіння населення в більш розвинутих економіках стимулює попит на медичних працівників, тоді як збільшення населення працездатного віку в регіонах з низьким рівнем доходу сприяє зростанню ролей, пов’язаних з освітою. Щоб подолати ці прогалини, компаніям потрібно буде надати пріоритет вдосконаленню управління талантами, викладання та наставництва.

    Крім того, геополітична напруженість є основною проблемою для роботодавців: 34% компаній вважають її головною проблемою. Хвильові наслідки цих конфліктів, включаючи торговельні обмеження та зміни в промисловій політиці, змушують багато компаній переглянути свої операційні стратегії.

    Деякі досліджують варіанти офшорингу та решорінгу, щоб зменшити ризики та отримати вигоду від нових можливостей. Крім того, геополітичний тиск посилює попит на спеціалізовані навички, особливо в таких сферах, як кібербезпека, оскільки підприємства прагнуть захистити свої інтереси в дедалі складнішому глобальному середовищі.

    Цифрова трансформація

    З домінуванням ШІ 50% роботодавців у всьому світі планують змінити свою діяльність. У відповідь на ці технологічні досягнення 77% компаній повідомили, що мають намір підвищити кваліфікацію своєї робочої сили. Однак зростання автоматизації не без наслідків, оскільки 41% роботодавців очікують скорочення штату в певних сферах.

    Примітно, що майже половина роботодавців розглядають внутрішню реструктуризацію, переміщаючи співробітників з вразливих до ШІ посад на інші посади в організації. Це рішення дозволить усунути поточну нестачу навичок, а також пом’якшити потенційний негативний вплив технологічного зриву на зайнятість.

    Переможці та переможені

    Згідно зі звітом, до 2030 року передові професії сприятимуть зростанню кількості робочих місць. Очікується, що кількість таких ролей, як сільськогосподарські робітники, водії-доставники та будівельники, значно збільшиться. Ця тенденція поширюється на важливі сектори, причому очікується значне зростання в охороні здоров'я та освіті, насамперед серед медсестер і вчителів середніх шкіл.

    Ролі в області штучного інтелекту, робототехніки та енергетичних систем також будуть користуватися великим попитом. Фахівці з великих даних, інженери фінтехів, спеціалісти зі штучного інтелекту та машинного навчання, а також розробники програмного забезпечення та додатків є одними з найшвидше зростаючих позицій у відсотковому вираженні.

    Глобальний зсув у бік сталого розвитку також впливає на тенденції ринку праці. Посади в сфері переходу на зелену та енергетику стають все більш помітними, а такі посади, як спеціалісти з автономних і електромобілів, інженери-екологи та інженери з відновлюваної енергетики, займають важливе місце серед професій, що розвиваються найшвидше.

    У той час як одні сектори розширюються, інші зазнають занепаду. Традиційні ролі, як-от касири та адміністративні помічники, продовжують зменшуватися, і тепер до них приєдналися такі посади, як графічні дизайнери, завдяки швидкому розвитку генеративного ШІ.

    Подібним чином підприємства очікують зменшення кількості ролей, таких як клерки поштової служби, банківські касири та клерки із введення даних.

  • Атаки штучного інтелекту тепер становлять більший ризик, ніж загрози для кінцевих точок

    Атаки штучного інтелекту тепер становлять більший ризик, ніж загрози для кінцевих точок

    Атаки на основі штучного інтелекту почали випереджати напади на системи кінцевих точок.

    Опитування, проведене фахівцем з управління ІТ Kaseya серед постачальників керованих послуг (MSP), показало, що 67% зазнали атаки від загрози, що походить від ШІ, за останні 12 місяців, і що атаки ШІ незабаром можуть стати більшою загрозою, ніж атаки на кінцеві точки.

    «Штучний інтелект є водночас і засобом, і загрозою в сучасному ІТ-ландшафті», — йдеться у звіті Kesaya.

    «МСП дедалі більше стурбовані атаками за допомогою ШІ».

    Висновки збігаються з висновками CyberRisk Alliance, який так само виявив, що організації вважають ШІ однією з найбільших загроз безпеці в найближчі роки, хоча вони також оптимістично налаштовані, що захисні інструменти ШІ також зможуть допомогти їм автоматизувати щоденні завдання безпеки та звільнити професіоналів із безпеки для вирішення більш критичних і складних питань.

    За словами Касея, MSP розглядають безпеку як одне з ключових питань, коли справа стосується розвитку їхнього бізнесу. У звіті виявлено, що багато провайдерів планують розширити спектр своїх пропозицій безпеки в наступному році.

    З опитаних 42% сказали, що запровадять навчальні курси безпеки для своїх клієнтів, а 45% планують запропонувати аудит безпеки. Крім того, 43% запровадять перевірку вразливостей і сканування, а 40% додадуть опцію створення внутрішньої політики безпеки для клієнтів.

    Ці послуги привабливі для організацій не лише тому, що вони забезпечують кращу безпеку мережі та захист від атак, але й тому, що вони вважаються ключовими вимогами для отримання та підтримки страхового покриття кібербезпеки.

    З іншого боку, у звіті також виявлено, що багато MSP продовжують стикатися з перешкодами, коли справа доходить до продажу своїх клієнтів послуг кібербезпеки.

    Головною серед цих перешкод була тривала апатія до ризиків атак і зламу мережі, оскільки майже половина опитаних заявили, що клієнти, схоже, не зацікавлені в службах безпеки.

    «Зростання «апатії споживачів» як головного бар’єру цього року — стрибок із сьомого місця минулого року — підкреслює нагальну потребу для MSP навчати клієнтів про кіберризики за допомогою таких ініціатив, як навчання безпеки та симуляції фішингу», — зазначає Касея.

    Також проблемою для постачальників послуг є складність пропонованих продуктів кібербезпеки (38%) і недостатня підготовка персоналу (36%).

  • Використовуйте найкращі практики CI/CD для автоматизації операцій керування кластером Amazon OpenSearch Service

    Використовуйте найкращі практики CI/CD для автоматизації операцій керування кластером Amazon OpenSearch Service

    Швидкий і надійний доступ до інформації має вирішальне значення для прийняття розумних бізнес-рішень. Ось чому компанії звертаються до Amazon OpenSearch Service, щоб розширити свої пошукові та аналітичні можливості. Служба OpenSearch спрощує розгортання, роботу та масштабування пошукових систем у хмарі, забезпечуючи такі випадки використання, як аналіз журналів, моніторинг додатків і пошук на веб-сайтах.

    Ефективне керування індексами OpenSearch Service і ресурсами кластерів може призвести до значного покращення продуктивності, масштабованості та надійності – усе це безпосередньо впливає на прибутки компанії. Однак галузі бракує вбудованих і добре задокументованих рішень для автоматизації цих важливих операційних завдань.

    Застосування постійної інтеграції та постійного розгортання (CI/CD) для керування ресурсами індексу OpenSearch може допомогти в цьому. Наприклад, збереження конфігурацій індексів у вихідному сховищі дозволяє краще відстежувати, співпрацювати та відкочувати. Використання інструментів інфраструктури як коду (IaC) може допомогти автоматизувати створення ресурсів, забезпечуючи послідовність і зменшуючи ручну роботу. Нарешті, використання конвеєра CI/CD може автоматизувати розгортання та оптимізувати робочий процес.

    У цій публікації ми обговорюємо два варіанти досягнення цієї мети: постачальник Terraform OpenSearch і бібліотеку Evolution. Який з них найкраще підходить для вашого випадку використання, залежить від інструментів, з якими ви знайомі, мови, яку ви вибрали, і наявного конвеєра.

    Огляд рішення

    Давайте пройдемося по простій реалізації. Для цього випадку використання ми використовуємо AWS Cloud Development Kit (AWS CDK), щоб забезпечити відповідну інфраструктуру, як описано на наведеній нижче схемі архітектури, AWS Lambda для запуску сценаріїв Evolution і AWS CodeBuild для застосування файлів Terraform. Ви можете знайти код для всього рішення в репозиторії GitHub.

    Діаграма архітектури рішення

    передумови

    Щоб слідувати цій публікації, вам потрібно мати наступне:

    • Знайомство з Java та OpenSearch
    • Знайомство з AWS CDK, Terraform і командним рядком
    • На вашій машині встановлено наступні версії програмного забезпечення: Python 3.12, NodeJS 20 і AWS CDK 2.170.0 або вище
    • Обліковий запис AWS із роллю AWS Identity and Access Management (IAM), налаштованою з відповідними дозволами

    Побудуйте рішення

    Щоб створити автоматизоване рішення для керування кластером OpenSearch Service, виконайте такі дії:

    1. Введіть наступні команди в терміналі, щоб завантажити код рішення; створити програму Java; побудувати необхідний лямбда-шар; створити домен OpenSearch, дві функції Lambda та проект CodeBuild; і розгорніть код:
    git clone https://github.com/aws-samples/opensearch-automated-cluster-management
    cd opensearch-automated-cluster-management
    cd app/openSearchMigration
    mvn package
    cd ../../lambda_layer
    chmox a+x create_layer.sh
    ./create_layer.sh
    cd ../infra
    npm install
    npx cdk bootstrap
    aws iam create-service-linked-role --aws-service-name es.amazonaws.com
    npx cdk deploy --require-approval never

    1. Зачекайте від 15 до 20 хвилин, доки інфраструктура завершить розгортання, а потім перевірте, чи ваш домен OpenSearch запущений і працює, а функцію Lambda та проект CodeBuild створено, як показано на наступних знімках екрана.

    Домен OpenSearch успішно надано Функцію OpenSearch Migration Lambda створено успішно Функцію OpenSearchQuery Lambda створено успішно Проект CodeBuild успішно створено

    Перш ніж використовувати автоматизовані інструменти для створення шаблонів покажчиків, ви можете переконатися, що жодного з них уже не існує за допомогою OpenSearchQuery Лямбда-функція.

    1. На консолі Lambda перейдіть до потрібного функція
    2. На Тест вкладка, виберіть Тест.

    Функція має повернути повідомлення «Немає шаблонів індексів, створених Terraform або Evolution», як показано на наступному знімку екрана.

    Переконайтеся, що шаблони індексів не створено

    Застосуйте файли Terraform

    По-перше, ви використовуєте Terraform із CodeBuild. Код готовий для тестування, давайте розглянемо кілька важливих елементів конфігурації:

    1. Визначте необхідні змінні для вашого середовища:
    variable "OpenSearchDomainEndpoint" {
      type = string
      description = "OpenSearch domain URL"
    }
    
    variable "IAMRoleARN" {
      type = string
      description = "IAM Role ARN to interact with OpenSearch"
    }

    1. Визначте та налаштуйте провайдера
    terraform {
      required_providers {
        opensearch = {
          source = "opensearch-project/opensearch"
          version = "2.3.1"
        }
      }
    }
    
    provider "opensearch" {
      url = "https://${var.OpenSearchDomainEndpoint}"
      aws_assume_role_arn = "${var.IAMRoleARN}"
    }

    ПРИМІТКА: Станом на дату публікації цього допису в провайдері Terraform OpenSearch є помилка, яка спрацьовує під час запуску вашого проекту CodeBuild і перешкоджає успішному виконанню. Поки це не буде виправлено, використовуйте наступну версію:

    terraform {
      required_providers {
        opensearch = {
          source = "gnuletik/opensearch"
          version = "2.7.0"
        }
      }
    }

    1. Створіть шаблон покажчика
    resource "opensearch_index_template" "template_1" {
      name = "cicd_template_terraform"
      body = 

    Тепер ви готові до тестування.

    1. На консолі CodeBuild перейдіть до відповідного проекту та виберіть Розпочати збірку.

    Складання має завершитися успішно, і ви побачите такі рядки в журналах:

    opensearch_index_template.template_1: Creating...
    opensearch_index_template.template_1: Creation complete after 0s (id=cicd_template_terraform)
    Apply complete! Resources: 1 added, 0 changed, 0 destroyed.

    Ви можете перевірити, чи правильно створено шаблон індексу за допомогою тієї ж функції Lambda, що й раніше, і побачите такі результати.

    Правильно створений індекс тераформи

    Запустіть сценарії Evolution

    На наступному кроці ви використовуєте бібліотеку Evolution. Код готовий для тестування, давайте розглянемо кілька важливих частин коду та конфігурації:

    1. Для початку вам потрібно додати останню версію базової бібліотеки Evolution і AWS SDK як залежності Maven. Повний файл xml доступний у репозиторії GitHub; щоб перевірити сумісність бібліотеки Evolution з різними версіями OpenSearch, дивіться тут.
    
        com.senacor.elasticsearch.evolution
        elasticsearch-evolution-core
        0.6.0
    
    
       software.amazon.awssdk
       auth
    

    1. Створіть Evolution Bean і перехоплювач AWS (який реалізує HttpRequestInterceptor).

    Перехоплювачі — це відкриті механізми, у яких SDK викликає код, який ви пишете, щоб ввести поведінку в життєвий цикл запиту та відповіді. Функція перехоплювача AWS полягає у підключенні до виконання запитів API і створенні підписаного запиту AWS із відповідними ролями IAM. Ви можете використати наведений нижче код, щоб створити власну реалізацію для підпису всіх запитів, зроблених до OpenSearch в AWS.

    1. Створіть власний клієнт OpenSearch, щоб керувати автоматичним створенням індексів, зіставлень, шаблонів і псевдонімів.

    Клієнт ElasticSearch за замовчуванням, який постачається в комплекті як частина залежності Maven, не можна використовувати для створення PUT виклики до кластера OpenSearch. Тому вам потрібно обійти типовий екземпляр клієнта REST і додати a CallBack до AwsRequestSigningInterceptor.

    Нижче наведено приклад реалізації:

    private RestClient getOpenSearchEvolutionRestClient() {
        return RestClient.builder(getHttpHost())
            .setHttpClientConfigCallback(hacb -> 
                hacb.addInterceptorLast(getAwsRequestSigningInterceptor()))
            .build();
    }

    1. Використовуйте Evolution Bean для виклику методу міграції, який відповідає за ініціювання міграції сценаріїв, визначених або за допомогою classpath або filepath:
    public void executeOpensearchScripts() {
        ElasticsearchEvolution opensearchEvolution = ElasticsearchEvolution.configure()
            .setEnabled(true) // true or false
            .setLocations(Arrays.asList("classpath:opensearch_migration/base",
                "classpath:opensearch_migration/dev")) // List of all locations where scripts are located.
            .setHistoryIndex("opensearch_changelog") // Tracker index to store history of scripts executed.
            .setValidateOnMigrate(false) // true or false
            .setOutOfOrder(true) // true or false
            .setPlaceholders(Collections.singletonMap("env","dev")) // list of placeholders which will get replaced in the script during execution.
            .load(getElasticsearchEvolutionRestClient());
        opensearchEvolution.migrate();
    }

    1. Ан Evolution сценарій міграції представляє виклик REST до API OpenSearch (наприклад, PUT /_index_template/cicd_template_evolution), де ви визначаєте шаблони індексів, налаштування та зіставлення у форматі JSON. Evolution інтерпретує ці сценарії, керує їхніми версіями та забезпечує впорядковане виконання. Подивіться наступний приклад:
    PUT /_index_template/cicd_template_evolution
    Content-Type: application/json
    
    {
      "index_patterns": ["evolution_index_*"],
      "template": {
        "settings": {
          "number_of_shards": "1"
        },
        "mappings": {
            "_source": {
                "enabled": false
            },
            "properties": {
                "host_name": {
                    "type": "keyword"
                },
                "created_at": {
                    "type": "date",
                    "format": "EEE MMM dd HH:mm:ss Z YYYY"
                }
            }
        }
      }
    }

    Перші два рядки має йти порожній рядок. Evolution також підтримує рядки коментарів у своїх сценаріях міграції. Кожен рядок, що починається з # або // буде інтерпретовано як рядок коментаря. Рядки коментарів не надсилаються до OpenSearch. Натомість вони фільтруються Evolution.

    Правила іменування файлів сценарію міграції мають відповідати шаблону:

    • Почніть з esMigrationPrefix що є за замовчуванням V або значення, яке було налаштовано за допомогою параметра конфігурації esMigrationPrefix
    • Після цього номер версії, який має бути числовим і може бути структурованим шляхом розділення частин версії крапкою (.)
    • Слідом за versionDescriptionSeparator: __ (символ подвійного підкреслення)
    • Далі йде опис, який може бути будь-яким текстом, який підтримує ваша файлова система
    • Закінчити з esMigrationSuffixes що є за замовчуванням .http і налаштовується та не враховує регістр

    Тепер ви готові виконати свою першу автоматичну зміну. Для вас уже створено приклад сценарію міграції, який ви можете переглянути в попередньому розділі. Він створить шаблон індексу з назвою cicd_template_evolution.

    1. На консолі Lambda перейдіть до своєї функції.
    2. На Тест вкладка, виберіть Тест.

    Через кілька секунд функція має успішно завершитися. Ви можете переглянути вихідні дані журналу в Подробиці розділ, як показано на наступних знімках екрана.

    Функцію міграції успішно завершено

    Шаблон індексу тепер існує, і ви можете перевірити, чи його конфігурація справді відповідає сценарію, як показано на наступному знімку екрана.

    Шаблон індексу Evolution створено правильно

    Прибирати

    Щоб очистити ресурси, створені в рамках цієї публікації, виконайте такі команди (у infra папка):

    Висновок

    У цьому дописі ми продемонстрували, як автоматизувати шаблони індексів OpenSearch за допомогою методів CI/CD та таких інструментів, як Terraform або бібліотека Evolution.

    Щоб дізнатися більше про службу OpenSearch, зверніться до посібника розробника служби Amazon OpenSearch. Щоб глибше вивчити бібліотеку Evolution, зверніться до документації. Щоб дізнатися більше про постачальника Terraform OpenSearch, зверніться до документації.

    Ми сподіваємося, що цей докладний посібник і супровідний код допоможуть вам почати роботу. Спробуйте, поділіться з нами своїми думками в коментарях і не соромтеся звертатися до нас із запитаннями!


    Про авторів

    Каміль БірбесКаміль Бірбес є старшим архітектором рішень в AWS і працює в Гонконзі. Він співпрацює з великими фінансовими установами для розробки та створення безпечних, масштабованих і високодоступних рішень у хмарі. Поза роботою Камілла захоплюється будь-якими видами ігор, від настільних до новітніх відеоігор.

    1736274237 413 Використовуйте найкращі практики CICD для автоматизації операцій керування кластером Amazon Використовуйте найкращі практики CI/CD для автоматизації операцій керування кластером Amazon OpenSearch ServiceШріхарша Субраманья Беголлі працює старшим архітектором рішень в AWS, що базується в Бенгалуру, Індія. Його основна увага — допомога великим корпоративним клієнтам у модернізації їхніх програм і розробці хмарних систем для досягнення їхніх бізнес-цілей. Його експертиза лежить у сферах даних і аналітики.