شرحت شركة جوجل تقنية الرادار (Soli) لاكتشاف حركات اليد الموجودة داخل هواتف الشركة الذكية (Pixel 4)، وبالرغم من أن العديد من تفاصيل الأجهزة كانت معروفة في السابق، إلا أن الشركة وضحت للمرة الأولى نماذج الذكاء الاصطناعي من (Soli)، والتي دُربت على اكتشاف إيماءات الحركة والتعرف عليها مع زمن تأخر منخفض.
وتدعي جوجل أن تقنية (Soli) الموجودة في أجهزة (Pixel 4) و (Pixel 4 XL) – وهي أول أجهزة استهلاكية تتميز بهذه الميزة – يمكنها تمكين أشكال جديدة من السياق وإدراك الإيماءات على أجهزة مثل الساعات الذكية، مما يمهد الطريق أمام التجارب التي تناسب المستخدمين ذوي الإعاقات بشكل أفضل.
وتحتوي وحدة (Soli) داخل (Pixel 4)، والتي كانت جهدًا تعاونيًا بين مجموعة التكنولوجيا والمشاريع المتقدمة (ATAP) من جوجل وفرق منتجات بيكسل (Pixel) وأندرويد (Android)، على رادار بتردد 60 جيجاهيرتز ومستقبلات هوائية مع مجال رؤية مدمج بزاوية 180 درجة يسجل المعلومات الموضعية بالإضافة إلى أشياء مثل المدى والسرعة.
وتعكس الموجات الكهرومغناطيسية المعلومات مرة أخرى إلى الهوائيات، وتعزز المرشحات المخصصة (من ضمنها المرشحات الممثلة للاهتزازات الصوتية الناجمة عن الموسيقى) نسبة الإشارة مع تخفيف التداخل غير المرغوب فيه والتمييز بين الانعكاسات من الضوضاء والضجة.
وتُدخل تحولات الإشارة في نماذج التعلم الآلي من (Soli) لتصنيف الإيماءات الأقل من ميليمتر، والتي يتطلب تطويرها وفقًا لجوجل التغلب على العديد من التحديات الرئيسية:
- ينفذ كل مستخدم حركات بسيطة مثل التمرير بطرق لا تعد ولا تحصى.
- تظهر الحركات الدخيلة داخل نطاق المستشعر في بعض الأحيان كحركات مشابهة للإيماءات.
- يبدو أن العالم كله يتحرك عندما يتحرك الهاتف من وجهة نظر المستشعر.
واضطرت جوجل إلى تطوير خوارزميات لاكتشاف الإيماءات بدقة، وذلك نظرًا للتنوع الواسع للطرق الفريدة الخاصة بالأشخاص، بحيث قد تختلف طريقة التمرير لشخص ما عن طريقة شخص آخر، كما طورت الشركة خوارزميات لضمان عدم اكتشاف حركات الخلفية بشكل خاطئ على أنها إيماءات.
وابتكرت الفرق المسؤولة عن (Soli) نظامًا يضم نماذجًا مدربة باستخدام الملايين من الإيماءات المسجلة من آلاف المتطوعين من جوجل، والتي استكملت بمئات الساعات من تسجيلات الرادار المحتوية على حركات عامة من متطوعين آخرين من جوجل.
وأخذت جوجل بعين الاعتبار التداخل بين المكونات الأخرى داخل الهاتف، لذا كان على الشركة تطوير تقنيات معالجة إشارة جديدة لتقليل تأثير الاهتزاز الصوتي على إشارة الرادار، مما مهد الطريق لاستخدام (Motion Sense) لتشغيل الموسيقى أيضًا.
ودُربت نماذج الذكاء الاصطناعي باستخدام إطار عمل التعلم الآلي (TensorFlow) من جوجل، وجرى تحسينها للتشغيل بشكل مباشرة على معالج الإشارات الرقمية منخفض الطاقة في أجهزة (Pixel 4)، مما يتيح لتلك النماذج تتبع ما يصل إلى 18 ألف إطار في الثانية حتى عند إيقاف تشغيل المعالج الرئيسي.
وكان التحدي الذي يواجه جوجل هو تفسير الحركات الزمنية بسرعة وبدقة من أجل معرفة ما يفعله المستخدم، إلى جانب حساب حركة الهاتف أثناء المشي أو الاهتزازات أثناء تشغيل الموسيقى، وقالت الشركة: “نحن متحمسون لمواصلة البحث والتطوير فيما يتعلق بالرادار القصير المدى (Soli) ، وذلك في سبيل تمكين قدرات الاستشعار والإدراك”.