Машинне навчання вдосконалює рішення для одноклітинного аналізу

Машинне навчання вдосконалює рішення для одноклітинного аналізу


зареєструватися безкоштовно прослухати цю статтю

дякую Прослухайте цю статтю за допомогою програвача вище.

Хочете прослухати цю статтю БЕЗКОШТОВНО?

Заповніть форму нижче, щоб розблокувати доступ до ВСІХ аудіостатей.

Дослідники накопичили величезні бази даних експресії одноклітинних генів, щоб зрозуміти, як найдрібніші деталі впливають на біологію людини. Однак сучасні методи аналізу не можуть працювати з великим обсягом даних і, як наслідок, дають упереджені та суперечливі результати. Вчені при Святий Юда Дитяча дослідницька лікарня створила алгоритм машинного навчання, здатний масштабуватися за допомогою цих одноклітинних сховищ даних, щоб надавати більш точні результати. Новий метод був опублікований сьогодні в Клітинна геноміка.

До одноклітинного аналізу дані масової експресії генів давали високорівневі, але неуточнені результати для багатьох захворювань. Аналіз однієї клітини дозволяє дослідникам дивитися на окремі клітини, що цікавлять, що схоже на окреме зерно кукурудзи замість поля. Ці детальні висновки вже зробили прорив у розумінні деяких хвороб і методів лікування, але труднощі з тиражуванням і масштабуванням аналізу даних, розмір яких продовжує збільшуватися, зупинили прогрес.

«Ми запровадили новий набір інструментів, який можна масштабувати, оскільки набори даних секвенування одноклітинної РНК продовжують зростати», — сказав автор-кореспондент Paul Geeleher, PhD, Святий Юда Кафедра обчислювальної біології. «Стався експоненціальний вибух у часі обчислення для аналізу однієї клітинки, і наш метод повертає точний аналіз у прийнятні часові рамки».

Усі методи вивчення експресії генів в одній клітині створюють великі обсяги даних. Коли вчені одночасно перевіряють мільйони клітин, об’єм комп’ютерної пам’яті та обчислювальної потужності, необхідні для обробки даних, є величезними. Команда Geeleher звернулася до іншого типу апаратного забезпечення, щоб допомогти вирішити проблему.

Хочете більше останніх новин?

Підпишіться на Технологічні мережі' щоденний інформаційний бюлетень, який щодня доставляє останні наукові новини прямо до вашої поштової скриньки.

Підпишіться БЕЗКОШТОВНО

«Ми створили метод, який використовує графічні процесори або графічні процесори», — сказав перший автор Сюейін Лю, доктор філософії, Святий Юда Кафедра обчислювальної біології. «Інтеграція GPU дала нам обчислювальну потужність для виконання обчислювальних навантажень масштабованим способом».

Машинне навчання без нагляду для одноклітинного аналізу

Обсяг даних часто змушує дослідників йти на поступки та робити припущення, які вносять упередження під час проведення аналізу стандартними методами. The Святий Юда вчені використали підхід штучного інтелекту, який усуває таке упередження з цих виборів.

«Наш метод використовує неконтрольоване машинне навчання, яке автоматично визначає більш надійні та менш довільні параметри для аналізу», — сказав Лю. «Вона вчиться групувати клітини на основі їхніх різних активних біологічних процесів або типів клітин».

Оскільки алгоритм навчається та аналізує представлені дані, дослідники можуть використовувати його для будь-якого значного набору даних секвенування одноклітинної РНК. Оскільки він досліджує кожен новий великий набір даних окремо та використовує лише підказки програми експресії, щоб зробити висновки, дослідники назвали цей підхід Консенсусом і масштабованим висновком програм експресії генів (CSI-GEP). При застосуванні до найбільших одноклітинних баз даних РНК CSI-GEP дав кращі результати, ніж будь-який інший метод. Найбільш вражаючим є те, що алгоритм міг ідентифікувати типи клітин і активність біологічних процесів, пропущених іншими методами.

«Ми створили інструмент, широко застосовний для вивчення будь-якої хвороби за допомогою аналізу одноклітинної РНК», — сказав Гілехер. «Метод працював значно краще, ніж усі існуючі підходи, які ми тестували, тому я сподіваюся, що інші вчені розглянуть можливість використовувати його, щоб отримати кращу цінність своїх одноклітинних даних».

Посилання: Liu X, Chapple RH, Bennett D та ін. CSI-GEP: підхід неконтрольованого машинного навчання на основі графічного процесора для відновлення програм експресії генів у одноклітинних РНК-секвенаційних даних атласу. Клітинна геноміка. 2025; 5 (1). зробити: 10.1016/j.xgen.2024.100739

Ця стаття перепублікована з наступних матеріалів. Примітка: матеріал міг бути відредагований щодо довжини та змісту. Для отримання додаткової інформації, будь ласка, зв’яжіться з цитованим джерелом. З нашою політикою публікації прес-релізів можна ознайомитися тут.