تواجه شركة أنثروبيك دعوى قضائية جماعية تهدد بتغيير جذري في كيفية حصول شركات الذكاء الاصطناعي على بيانات التدريب لنماذجها اللغوية الكبيرة. تركز القضية على مزاعم بأن الشركة نزلت ملايين الأعمال المحمية بحقوق الطبع والنشر من مكتبات وهمية، بما في ذلك LibGen وPiLiMi، لتطوير نموذج Claude، الذي يعد الآن أحد أكثر نماذج الذكاء الاصطناعي التوليدية انتشاراً في العالم.بحسب AI Magazine

حكم فيدرالي

أصدر القاضي الفيدرالي ويليام ألسوب أخيراً حكماً يثير حالة من عدم اليقين في قطاع الذكاء الاصطناعي. وقد قرر القاضي أن تدريب نماذج الذكاء الاصطناعي على الكتب التي تقتنى بشكل قانوني يعد استخداماً عادلاً، ما يلغي متطلبات اتفاقيات الترخيص مع أصحاب حقوق النشر. ومع ذلك، فقد ميز ألسوب بشكل حاسم كيفية حصول الشركات على هذه المواد.

حلول معقدة

وقال لوك ماكدونا، أستاذ القانون المشارك في كلية لندن للاقتصاد: “يبدو أن القاضي يقترح أنه إذا كنت قد اشتريت مليون كتاب من أمازون في شكل رقمي، فيمكنك إجراء التدريب، وسيكون ذلك قانونياً، ولكن التنزيل من موقع القرصنة هو المشكلة”.

دعوى جماعية

أصبحت القضية دعوى جماعية، ما يتيح لأي مؤلف استخدمت أعماله دون إذن الانضمام إلى الدعوى. هذا التطور يحول نطاق التعويضات المحتملة من عدد محدود من المدعين إلى آلاف المدعين المحتملين.

قد تكون العواقب المالية على أنثروبيك كارثية. ويشير إد لي، أستاذ القانون بجامعة سانتا كلارا، إلى أن هذا الحكم قد يعرض أنثروبيك لمسؤولية تنهي أعمالها.

تعويضات كبيرة

تتراوح التعويضات القانونية بين 750 دولاراً إلى 150 ألف دولار أمريكي لكل عمل، مع تطبيق الحد الأقصى في حال اعتبر الانتهاك متعمداً. ويقدر إد أن شركة أنثروبيك قد تواجه تعويضات تتراوح بين مليار و3 مليارات دولار أمريكي إذا شملت الدعوى الجماعية 100 ألف عمل فقط.

1.05 تريليون دولار

وبحسب الدراسات فإن أسوأ السيناريوهات، أن تواجه الشركة غرامة تصل إلى 1.05 تريليون دولار أمريكي إذا قررت هيئة محلفين أن أنثروبيك قامت عمداً بقرصنة 6 ملايين كتاب محمي بحقوق الطبع والنشر. تمثل هذه الأرقام حجم مسؤولية من شأنه أن يقزم تقييم الشركة ومواردها الحالية.

حراس البيانات

قد ينتقل عبء الإثبات إلى أنثروبيك لإثبات حصولها على مواد تدريبية بشكل قانوني. يشرح ريتشارد جونسون، المؤسس المشارك والمدير التنفيذي للعمليات في شبكة حراس البيانات، هذه التداعيات قائلاً: “فجأة، قد يطلب من أنثروبيك إثبات عدم استخدامها بيانات مقرصنة – أو على الأقل حصولها عليها بشكل قانوني. إذا لم يكن ذلك ممكناً، فإنها تواجه أزمة قانونية وأزمة سمعة قد تستمر لفترة طويلة”.

إن حصول شركة أنثروبيك على وضعية الدعوى الجماعية يضاعف بشكل كبير من المخاطر المالية المحتملة. يوضح ريتشارد: “هذا يحول عدداً قليلاً من المدعين إلى آلاف، ويعني أن الأضرار قد تصل إلى مليارات الدولارات”.

أول دعوى قضائية جماعية

تمثل هذه القضية أول دعوى قضائية جماعية معتمدة ضد شركة ذكاء اصطناعي بشأن استخدام مواد محمية بحقوق الطبع والنشر، ومن المقرر أن تبدأ المحاكمة في الأول من ديسمبر 2025. ويتوقع الخبراء القانونيون أن تؤدي هذه السابقة إلى إثارة دعاوى قضائية مماثلة في قطاع الذكاء الاصطناعي.

فترة محاسبة

يعتقد ريتشارد أن الصناعة تواجه فترة محاسبة: “هذه لحظة محاسبة للصناعة. لسنوات، كان الجميع يعلم أن شركات الذكاء الاصطناعي تلجأ إلى الاختصارات، وأن سرقة المواد المحمية بحقوق الطبع والنشر دون موافقة المستخدم هي الأبرز، لكن سباق السرعة للتغلب على المنافسين جعل الأمر “مخاطرة مقبولة””.

منظومة الذكاء الاصطناعي

تمتد الآثار إلى ما هو أبعد من أنثروبيك لتشمل منظومة الذكاء الاصطناعي الأوسع. فالشركات التي طورت نماذج باستخدام أساليب مماثلة لجمع البيانات قد تواجه تحديات قانونية مماثلة. يقول ريتشارد: “إذا قضت المحكمة بأن التدريب على البيانات المقرصنة لا يعد استخداماً عادلاً، فقد يبطل ذلك عدداً هائلاً من النماذج الحالية بين عشية وضحاها”.

قضية الأنثروبولوجيا

قد تؤثر البيئة السياسية الحالية على الحكم النهائي. ويشير لوك إلى أن إدارة ترامب ستقاوم على الأرجح أي حكم قد “يدمر شركة ذكاء اصطناعي بشكل جوهري”، نظراً لتصاعد المنافسة الدولية على التفوق في مجال الذكاء الاصطناعي بين الولايات المتحدة والصين.

إذاً البعد السياسي يعقد قضية حقوق طبع ونشر قد تبدو بسيطة. وقد يؤثر نهج الإدارة في تنظيم الذكاء الاصطناعي ودعم شركاته المحلية في الاعتبارات القضائية وإجراءات الاستئناف المحتملة.

لقد غيرت هذه القضية بالفعل ممارسات القطاع نحو مناهج أكثر حذراً في الحصول على البيانات. يوضح ريتشارد: “لهذا السبب، تتطلع الشركات الطموحة إلى بيانات رائدة ذات مصادر أخلاقية. لأنه بمجرد إرساء هذه السابقة، ستكون عملية إعادة بناء مجموعات البيانات شاقة وأكثر تكلفة”.

قضية رأي عام

يبدو أن الرأي العام يميل لصالح منشئي المحتوى على شركات الذكاء الاصطناعي في هذه النزاعات، ما قد يؤثر على قرارات هيئات المحلفين والنهج التنظيمية الأوسع. ومن المرجح أن ترسي النتيجة أطراً قانونية تحدد ممارسات جمع البيانات المسموح بها لتدريب الذكاء الاصطناعي في جميع أنحاء القطاع.

أخلاقيات الحصول على البيانات

يتوقع ريتشارد إجراءات قانونية واسعة النطاق عقب هذه القضية: “سترفع دعاوى قضائية أخرى كثيرة خلال الـ 12-18 شهراً المقبلة. ستجبر هذه الدعاية قطاع الذكاء الاصطناعي على إعادة النظر جذرياً – ليس فقط في الامتثال، بل أيضاً في أخلاقيات الحصول على البيانات”.