أثار تطوير نماذج الذكاء الاصطناعي التوليدي (AI) التي تتعلم من مجموعات البيانات الجماعية المستخرجة من الويب لإنشاء نصوص وصور ومقاطع فيديو أصلية والمزيد مخاوف متزايدة بشأن الانتحال والمصادر غير الأخلاقية للبيانات والاستيلاء الثقافي. في حين أن هذه التقنيات يمكن أن تساعد في الحفاظ على لغات السكان الأصليين وإحيائها، فإن جمع البيانات دون موافقة يخاطر بإساءة الاستخدام وتشويه ثقافة السكان الأصليين وحرمان الأقليات من حقوقها، كما يقول الخبراء.
قالت كاريتيانا تايورو، عالمة الأخلاقيات الماورية والأكاديمية الفخرية في جامعة أوكلاند: «البيانات تشبه أرضنا ومواردنا الطبيعية. إذا لم تتمتع الشعوب الأصلية بالسيادة على بياناتها الخاصة، فسيتم ببساطة إعادة استعمارها في مجتمع المعلومات هذا». تأتي تعليقات Taiuru بعد أن قامت OpenAI بتدريب روبوت الدردشة Whisper الخاص بها على 680.000 ساعة من الصوت من الويب، بما في ذلك 1381 ساعة من te reo Maori.
حذرت الأمم المتحدة من أن العديد من لغات السكان الأصليين مهددة بالاختفاء، حاملة معها الثقافات والمعارف والتقاليد. في نيوزيلندا، حيث تتمتع لغة الماوري بالانتعاش، تهدف الحكومة إلى الحصول على مليون متحدث أساسي بحلول عام 2040. قال بيتر لوكاس جونز، الرئيس التنفيذي لشركة Te Hiku Media، وهي منظمة غير ربحية تدير عمليات البث والمحفوظات الماورية وتروج للغة، إن هذا يعني أن الأنظمة الرقمية التي تستخدم الماوري سيتم طرحها بأعداد متزايدة.
لكنه قال إنه من «المثير للقلق» رؤية منظمة غير ماورية تطرح نموذجًا للكلام باستخدام لغتها. أوضح جونز أن ما نراه مع نماذج الذكاء الاصطناعي الكبيرة هذه هو البيانات التي يتم سحبها من الإنترنت مع القليل من الاهتمام بأي تحيز يمكن أن يكون موجودًا في البيانات، ناهيك عن أي حقوق ملكية فكرية مرتبطة.
غضب قادة السكان الأصليين عندما سعت شركة طيران نيوزيلندا إلى وضع علامة تجارية عليها بعبارة «كيا أورا» – التي تعني «مرحبًا» أو «صحة جيدة» باللغة الماورية – مما يسلط الضوء على التوترات بشأن محاولات استمالة لغتهم وثقافتهم من قبل مجموعات خارجية. يحذر النقاد من أن مجموعات السكان الأصليين، التي لا تشارك عمومًا في تصميم أو اختبار أنظمة الذكاء الاصطناعي، معرضة لخطر التحيز الذي يمكن تضمينه في الخوارزميات، في حين أن نماذج الذكاء الاصطناعي التوليدية قد تنشر أيضًا معلومات غير صحيحة.
قالت كاريتيانا تايورو إن بيانات ومعارف السكان الأصليين بحاجة إلى الحماية. هناك اعتراف متزايد بالحاجة إلى حماية بيانات ومعارف السكان الأصليين، حيث حددت منظمة التجارة العالمية تدابير في عام 2006 لتوفير حماية الملكية الفكرية لـ «المعارف التقليدية والفولكلور». يمكن للقبائل المعترف بها فيدراليًا في الولايات المتحدة تقييد جمع البيانات عن محجوزاتها. ومع ذلك، قال مايكل راننج وولف، عالم أخلاقيات الذكاء الاصطناعي والأمريكي الأصلي الذي أسس منظمة السكان الأصليين غير الربحية في مجال الذكاء الاصطناعي، إن جمع البيانات «يمكن أن يطير تحت الرادار ويتجنب الولاية القضائية للقبيلة».