شاومي تكشف عن نموذج صوتي جديد للذكاء الاصطناعي

أعلنت شركة شاومي، إطلاق نموذج صوتي جديد مفتوح المصدر، يحمل اسم MiDashengLM-7B، والمخصص لتعزيز تجارب المستخدمين في مجالات السيارات الذكية والأجهزة المنزلية.

يمثل النموذج الجديد تطورًا ملحوظًا في أدوات الذكاء الاصطناعي التي لم تعد تقتصر على المعالجة النصية، بل توسعت لتشمل التفاعل الصوتي الفوري والدقيق، ما يفتح آفاقًا أوسع لتطبيقات أكثر مرونة في الحياة اليومية.

ويستند MiDashengLM-7B، إلى النموذج الصوتي الأساسي لشاومي، ويأتي مدمجًا مع نموذج Qwen2.5-Omni-7B المفتوح المصدر الذي طورته شركة علي بابا، في خطوة تعزز من قوة المعالجة وتنوع حالات الاستخدام.

وبحسب موقع XiaomiTime المتخصص، سجل النموذج أداءً مذهلًا على 22 معيارًا عامًا، حيث تفوق على منافسيه من حيث سرعة الاستجابة وكفاءة المعالجة.

ويبلغ زمن التوكن الأول – أي الوقت المستغرق للرد بأول كلمة – أقل بنسبة 25% من متوسط الزمن لدى حلول الذكاء الاصطناعي المشابهة.

يمتلك MiDashengLM-7B قدرة على معالجة عدد عمليات متزامنة يزيد بمقدار 20 ضعفًا مقارنةً بالنماذج التقليدية، دون الحاجة إلى سعة إضافية من الذاكرة، ما يجعله مثاليًا للبيئات التي تتطلب أداءً فوريًا وفعالًا.

قامت شاومي بتدريب النموذج الصوتي الجديد على بيانات عامة متاحة المصدر، ما يعزز من شفافية الأداء ويدعم مجتمع المطورين في تطوير أدوات الذكاء الصوتي القابلة للتكامل بسهولة مع الأنظمة الذكية المختلفة.