Світові новини, Суспільство, Технології
Штучний інтелект для африканських мов: Цифрова інклюзія та збереження культури
Pumza FihlaniНовини Йоганнесбурга
BBCХоча Африка є домівкою для величезної кількості світових мов – за деякими оцінками, понад чверть – багато з них відсутні у сфері розробки штучного інтелекту (ШІ).
Це пов’язано як з браком інвестицій, так і з доступністю даних. Більшість ШІ-інструментів, таких як Chat GPT, що використовуються сьогодні, тренуються на англійській, а також на інших європейських та китайських мовах. Вони мають величезну кількість онлайн-текстів для вивчення.
Але оскільки багато африканських мов є переважно усними, а не письмоними, існує дефіцит тексту для тренування ШІ, щоб зробити його корисним для носіїв цих мов. Для мільйонів людей на континенті це означає бути виключеними з цифрової ери.
Дослідники, які намагаються вирішити цю проблему, нещодавно випустили найбільший відомий набір даних африканських мов. «Ми думаємо нашими рідними мовами, мріємо ними і інтерпретуємо світ через них. Якщо технології цього не відображають, ціла група ризикує залишитися позаду», – говорить професор Вукосі Маріваті з Університету Преторії, який працював над проєктом.
«Ми переживаємо цю революцію ШІ, уявляючи все, що можна з нею зробити. А тепер уявіть, що є частина населення, яка просто не має доступу, тому що вся інформація англійською мовою». Проєкт Africa Next Voices об’єднав лінгвістів та комп’ютерних вчених для створення ШІ-готових наборів даних 18 африканськими мовами. Це може бути лише невелика частина з понад 2000 мов, що, за оцінками, розмовляють на континенті, але учасники проєкту сподіваються розширитися в майбутньому.
За два роки команда записала 9000 годин мовлення з Кенії, Нігерії та Південної Африки, фіксуючи повсякденні сценарії у сфері сільського господарства, охорони здоров’я та освіти. Серед записаних мов були кікуйю та дхолуо в Кенії, хауса та йоруба в Нігерії, а також ісізулу та тшивенда в Південній Африці, деякими з яких розмовляють мільйони людей.
«Вам потрібна якась основа для старту, і саме це робить Africa Next Voices, а потім люди будуватимуть на цьому та додаватимуть свої інновації», – каже професор Маріваті, який керував дослідженням у Південній Африці. Його кенійська колега, комп’ютерний лінгвіст Ліліан Ванзаре, каже, що запис мовлення на континенті означав створення даних, спрямованих на відображення того, як люди насправді живуть і говорять. «Ми збирали голоси з різних регіонів, вікових груп та соціальних верств, щоб це було якомога інклюзивніше. Великі технологічні компанії не завжди можуть побачити ці нюанси», – каже вона. Проєкт став можливим завдяки гранту Фонду Білла і Мелінди Гейтс на суму 2,2 мільйона доларів. Дані будуть у відкритому доступі, що дозволить розробникам створювати інструменти, які перекладають, транскрибують та відповідають африканськими мовами.
За словами професора Маріваті, вже є невеликі приклади того, як корінні мови, що використовуються в ШІ, можуть вирішувати реальні проблеми в Африці.

Фермерка Келебогіле Мосіме керує 21-гектарною ділянкою в Рустенбурзі, серці платинового регіону Південної Африки. 45-річна жінка працює з невеликою командою, вирощуючи ряд овочів – зокрема, квасолю, шпинат, цвітну капусту та помідори.
Вона почала лише три роки тому з вирощування капусти, і для допомоги використовує додаток під назвою AI-Farmer, який розпізнає кілька південноафриканських мов, включаючи сесото, ісізулу та африкаанс, щоб допомагати вирішувати різні проблеми.
«Як людина, яка ще вчиться фермерству, ви стикаєтеся з багатьма проблемами», – каже пані Мосіме. «Щодня я бачу переваги від можливості використовувати свою рідну мову сетсвана в додатку, коли стикаюся з проблемами на фермі. Я можу запитати будь-що і отримати корисну відповідь.»
«Для людини в сільській місцевості, як я, яка не знайома з технологіями, це дуже корисно. Я можу запитати про різні варіанти боротьби зі шкідниками, це також допомагає в діагностиці хворих рослин», – сяє вона під широкою солом’яною капелюхом.
Lelapa AI – це молода південноафриканська компанія, що створює ШІ-інструменти африканськими мовами для банківських та телекомунікаційних компаній. Для її генерального директора Пелономі Моілоа те, що доступно зараз, є дуже обмеженим.
«Англійська – це мова можливостей. Для багатьох південноафриканців, які нею не говорять, це не просто незручно – це може означати втрату доступу до основних послуг, таких як охорона здоров’я, банківські послуги або навіть державна підтримка», – каже вона. «Мова може бути величезним бар’єром. Ми говоримо, що цього не повинно бути». Але це більше, ніж просто бізнес і зручність.
Для професора Маріваті існує небезпека, що без ініціатив щодо африканських мов буде втрачено щось інше: «Мова – це доступ до уяви», – каже він. «Це не просто слова – це історія, культура, знання. Якщо корінні мови не будуть включені, ми втратимо більше, ніж дані; ми втратимо способи бачити і розуміти світ».
Вам також може бути цікаво:
Getty Images/BBC

