Залежно від бажаної мови для особистого та професійного спілкування, ви можете сприймати це як належне, щоб ваші пристрої розуміли вас. Якщо ви розмовляєте англійською, французькою, португальською, турецькою, хінді чи японською, телефон або планшет добре виходити прямо з коробки. Якщо ви хочете забронювати рейс, напишіть маму, відстежуйте свої кроки, опублікуйте Tiktok або надішліть електронний лист у Деванагарі, Кореї, арабській, бенгальській, тамільській чи іншій мові, яку підтримують ваші пристрої та додатки, ваш досвід відносно без тертя. Але якщо ви читаєте і пишете в Тигрині, скажімо, або монгольській, Шенгаїнській чи курдській мові, ваші варіанти цифрових взаємодій є більш обмеженими – або принаймні складнішими.
З приблизно 7000 мов людства в даний час використовує для вираження себе, від 50 до 100 з них підтримуються основними операційними системами та браузерами та мають шрифти, шрифти та клавіатури, що дозволяють використовувати їх на пристроях. Решта, у тому числі багато мільйонів доповідачів,-це те, що дослідники називають цифровими неблагополучними або нижчими ресурсами, це означає, що в різній мірі вони мають менше інфраструктури, що дозволяє їх використовувати в цифрових просторах.
“Ви робите математику”, – сказав професор історії Стенфорда Томас Маллані. “Це надзвичайно довгий хвіст мов, що залишилися позаду”.
Mullaney-спів-директор разом із професором англійської мови Елейн Трехарн з Силікону, стенфордською ініціативою, метою якої є просування цифрового включення, що дозволяє доповідачам мовних мов брати участь у цифрових просторах та в процесі, що допомагають зберегти ці мови від вимирання.
Кремнію, короткий для Стенфордської ініціативи щодо включення та збереження мови в старих та нових ЗМІ, об'єднує мовні спільноти, гравців технічного сектору, міжнародні організації, включаючи Unicode та ЮНЕСКО, та академічні установи по всьому світу, щоб просунути роботу над децентралізованими зусиллями, які значною мірою залишаються добровольцями. Програма практикуючих кремнію підтримує дослідників, дизайнерів та програмістів, які працюють у просторі. Її програма стажування створює трубопровід для лінгвістики, інформатики та інших студентів, багато хто з особистими зв’язками з мовами, що перебувають у майбутньому, продовжувати цю роботу в майбутньому.
Як і в якій мірі мова повинна бути представлена в цифрових просторах – і справді, чи слід її взагалі представляти – це питання, на які можна відповісти лише ораторами цієї мови. Ці рішення можуть бути ускладнені політичними факторами, включаючи недовіру, коріння в колоніальній мовній політиці та історичне придушення діалектів та мов меншин.
“Цей простір дуже нюансований і має багато вимірів”, – сказав Дії Ян, доцент кафедри інформатики, який спеціалізується на соціально усвідомлених мовних технологіях. “Ми хочемо відносно рівного доступу до цифрових ресурсів. Але в деяких культурних групах чи регіонах люди, можливо, не віддають перевагу їх мові, яка буде задокументована або представлена”.
Керуючись мовними спільнотами, лідери кремнію кажуть, що робота цифрового включення створює міст до онлайн -знань та дає можливість інноваціям з потенціалом обслуговувати потреби громади. “Багато організацій зацікавлені в здатності доводити телебачення в сільські села, які далеко не центр міста”, – сказав Маллані. “Але ви не можете забронювати зустріч у лікаря, якщо ваш телефон не може впоратися з вашою мовою. Ви не можете купувати нічого в Інтернеті. Ви не можете займатися онлайн -освітою. Усі ці речі залежать від наших пристроїв, знаючи, що робити з мовами, якими ми говоримо”.
Маллані, який провів 15 років, досліджуючи еволюцію технології обчислювальної китайської мови для своєї книги Китайський комп'ютер: глобальна історія інформаційної епохице сангвінічно про багато практичних бар'єрів для просування цифрового включення – у багатьох випадках все, що потрібно, – це правильний роз'єм. Підтвердження абревіатури мови за дні тижня, щоб вони могли бути кодовані, наприклад, правильно, наприклад, на пристрої, або отримання вченого доступу до історичного тексту може бути таким же простим, як телефонний дзвінок або покриття вартості квитка на літак. “Це не схоже на вирішення ядерного синтезу”, – сказав він. “Це більше схоже на те, щоб бути планувальником весілля”.
На конференції Face/Interface Silicon у січні науковці, дизайнери та інженери зібралися для вивчення дизайну глобального типу та взаємодії людини-комп'ютера. Старша Гелена Айтенфісу та молодша Еміяри Кирило Іквут-Уква, частина першої когорти інтернів Стенфорда-Унікоду, представлена на їхній роботі, вдосконалюючи інструмент, що використовується для введення даних, що стосуються локальної, до загального сховища даних локалів. | Мішель Менцу Чанг
Незважаючи на те, що зниження мовного різноманіття вже давно пов'язане з глобалізацією, швидке зростання технологій штучного інтелекту прискорило темп. Втрата мови та цифрове виключення стали пов'язаними у взаємно посилюючому циклі, кажуть лідери кремнію, в яких мовах, яким не вистачає великих тіл цифрового тексту, необхідних для навчання моделей AI, буде все складніше наздогнати.
“Я не богословська людина, але метафора, яка спадає на думку, полягає в тому, що є підйомні води, і там будується ковчег, і мови, які не на цьому ковчегу, не збираються переходити в наступний вік”, – сказав Маллані.
Однією з найбільших зрушень розвитку мовної моделі за останні кілька років, – сказав Ріші Боммасані, кандидат доктора наук з інформатики та суспільства для Центру досліджень моделей Фонду Стенфорда Хая, є те, що “великі дані” стали, ну, більшими. І разом з ним наслідки для мов з нижчим ресурсом. “Останні моделі Meta навчаються приблизно на 30 трлн слів”, – сказав він. “Коли ми починаємо думати про дані в такому масштабі, одна з ключових речей, яку ми бачимо, – це те, що ці проблеми складаються”.
Хелена Айтенфісу, старший спеціаліст з інформатики, поставила це просто: “Це якась проблема з куркою та яйцем, правда? Вам потрібно багато даних, щоб ці складні інструменти працювали, але для недостатньо представлених мов, дані – це те, чого у вас немає – і у вас немає інструментів, щоб отримати його”.
Боммасані зазначив, що мовні моделі вже не є лише корисними інструментами для міркувань про мову; Вони все частіше інтегруються в набагато більш наслідкові додатки, від того, щоб зробити прогнози охорони здоров'я та підтримувати судові послуги, щоб дозволити людям без програмування знань для розробки цифрових інструментів – подальше підвищення ставок.
“Ця технологія надає нам нові можливості, але те, як вона буде розповсюджена і з якими мовами в які частини світу незрозумілі”, – сказав він. “Це здається дуже важливим, коли ти думаєш про те, як АІ призведе до кращих чи гірших результатів у світі”.
За деякими підрахунками, половина мов, про які розмовляють сьогодні, може зникнути в цьому столітті. Якщо, як каже Маллані, ми можемо думати про кожну людську мову як про власну філософію часу, простору та існування – “повністю функціональної теорії всього” – кожної єдиної точки на колективній карті способів буття, яка може допомогти нам виявити, що означає бути людиною, що ми втрачаємо, якщо половина цих моментів зникне?
Відповідь може залежати від вашої теорії збереження мови. “Чи кидати його за скло і технічно ви його врятували – просто сканувати речі та приклеїти його в сховище і сподіваємось на найкраще? Або це збереження завдяки повному ресурсі мови, щоб бути максимально кінетичною та живою?”
Для отримання додаткової інформації
Томас Маллані – професор історії і, ввічливо, східноазіатських мов та культур у Школі гуманітарних наук та наук.
Елейн Трехарн – професор Роберта Боуман Деннінг у школі гуманітарних наук та наук. Вона є професором англійської мови та, ввічливістю, німецьких досліджень та порівняльної літератури.
Diyi Yang – доцент кафедри інформатики в Інженерній школі.