Huawei Cloud розгорнула моделі Pangu 5.5 на конференції розробників Huawei 2025, запровадивши новий раунд оновлень, орієнтований на допомогу бізнесу вирішувати проблеми в реальному світі з AI. Остання версія включає оновлення в п'яти ключових областях: обробка природної мови (NLP), комп'ютерне бачення (CV), мультимодальне моделювання, прогнозування та наукові обчислення.
Чжан Пінган, виконавчий директор Huawei та генеральний директор Huawei Cloud, заявив, що лінійка Pangu побудована з метою зробити AI більш корисною для компаній у конкретних секторах. Основна увага приділяється інструментам загального призначення та більше на будівельних моделях, які можуть добре працювати за допомогою даних у реальному світі у складних середовищах, таких як ферми, фабрики та міська інфраструктура.
Детальніший погляд на покращення NLP
Нова модель Pangu NLP має 718 мільйонів параметрів MOE (суміш експертів). Він має 256 експертів, на які система може зателефонувати залежно від завдання. За словами Huawei, це краще в міркуванні, використанні інструментів та математичних завдань.
Модель побудована для роботи з довшими послідовностями тексту, зменшення галюцинацій та перемикання між швидкими відповідями та глибшим мисленням за потребою. Адаптивна установка дозволяє йому надати більш швидкі відповіді на прості запитання, при цьому більше часу на більш важкі – підхід, за якою компанія каже, може підвищити загальну ефективність у вісім разів.
Huawei також представив Deepdiver, інструмент, який підтримує тривалі багатоступеневі відповіді на запитання та збір інформації. Deepdiver може виконати завдання з більш ніж 10 кроками за п’ять хвилин і генерувати детальні повідомлення про понад 10 000 слів. Ідея полягає у зменшенні кількості ручних зусиль, необхідних для роботи знань, особливо в ролях, які покладаються на дослідження та створення документів.
Інструменти для побудови спеціальних моделей
Для підтримки використання підприємств Huawei Cloud пропонує шість основних елементів для побудови моделей промисловості. До них відносяться основи та галузеві моделі, кураторні набори даних, інструменти для інженерії та навчання даних та платформи тестування. За допомогою ModelArts підприємства можуть навчати та вдосконалювати свої моделі за допомогою своїх внутрішніх даних.
Один приклад у реальному світі походить від Китайської академії сільськогосподарських наук (CAAS), яка використовувала моделі Huawei для створення власної системи AI для сільськогосподарських досліджень. Модель може відповідати на запитання на основі наукових літрів та генетичних даних, проведення аналізу генів та експериментів з проектування. Використовуючи такий підхід, вчені CAAS вдосконалили різноманітність рису, що на 25% коротший, ніж звичайні штами, зробивши його більш стійким до пошкодження вітру без зменшення врожаю врожаю.
Моделі, що стосуються домену
Huawei також запускає моделі, пристосовані до п'яти галузей – охорони здоров'я, фінансів, уряду, промислового виробництва та автомобільних. Очікується, що вони будуть жити в червні. Кожна модель навчається за допомогою доменних даних і налаштована на завдання, які є поширеними в цьому секторі.
Наприклад, у автомобілях нова світова модель Pangu генерує синтетичні дані про водіння з карт, введення датчика та команд транспортних засобів. Це створює недорогу альтернативу тестуванню в реальному світі. Guangzhou Automobile Group (GAC Group) використовує модель для імітації даних LIDAR та відео, що дозволяє розробникам швидше відтворювати рідкісні сценарії водіння та тестування програмного забезпечення.
Розширене використання в прогнозуванні та наукових обчисленнях
Модель прогнозування Pangu використовує архітектуру триплетного трансформатора для обробки таблиць, журналів та зображень в одній основі. Такі компанії, як Conch Cement, використовують це для прогнозування міцності продукту та оптимізації сумішей сировини. Система підтримує повторне використання відходів, як знесений бетон та промислові побічні продукти, зберігаючи якість продукції.
У прогнозуванні погоди місцеві метеорологічні бюро в Шеньчжені та Чонгкіні прийняли Пангу для покращення короткострокового прогнозування дощів. Енергетичні компанії, включаючи Shenzhen Energy, використовують ту саму платформу для прогнозування вітрової та сонячної потужності, допомагаючи їм ефективніше збалансувати енергетичні навантаження.
Оновлення комп'ютерного зору
Huawei також випустив модель CV на 30 мільярдів параметрів, використовуючи нову структуру МО. Модель підтримує декілька типів введення, включаючи зображення, інфрачервоні, лідарні, радіолокаційні та спектр. Він побудований для виявлення проблем у промислових умовах – як невеликі тріщини або теплові аномалії в обладнанні – які важко помітити людським оком.
CNPC, Китайська національна нафтова компанія, застосувала модель у таких сферах, як розвиток нафти, хімічне виробництво та технічне обслуговування обладнання. У виробництві система виявляє несправності з субміліметровою точністю, збільшуючи швидкість виявлення на 40% та скорочуючи ручні зусилля на 25%.
Див. Також: Подивіться правильно: Загроза кампанії, що обдурить розробників у github repos

Хочете дізнатися більше про кібербезпеку та хмару від лідерів галузі? Ознайомтеся з Cyber Security & Cloud Expo, що проходить в Амстердамі, Каліфорнії та Лондоні. Комплексна подія спільно розташована з іншими провідними подіями, включаючи тиждень цифрової трансформації, IoT Tech Expo, Blockchain Expo та AI та Big Data Expo.
Вивчіть інші майбутні події технологій підприємства та вебінари, що працюють від Techforge тут.