الثلاثاء، 14 أغسطس 2018

علوم الحاسب: التقاء تحليل البيانات بفيزياء الكَمّ



استخدام تقنية تجمع بين تعلُّم الآلة، والحوسبة الكمية؛ لتحديد الجسيمات المعروفة باسم بوزونات هيجز. ويمكن أن يكون لهذه الطريقة تطبيقات في العديد من مجالات العلوم.

ستيفن شرام

مع ظهور الحوسبة عالية الكفاءة، والقدرة على معالجة كميات هائلة من البيانات، تستمر الحاجة إلى تقنيات متقدمة في تحليل البيانات في الازدياد. ينطبق هذا بشكل خاص على التجارب التي تُجرى في مصادم الهدرونات الكبير بالقرب من جنيف في سويسرا، حيث تحدث التصادمات بين الجسيمات بمعدل يصل إلى 40 مليون تصادم في الثانية الواحدة1، لتتولد مجموعات هائلة من البيانات. وغالبًا ما تتضمن مجموعات البيانات تلك عددًا ضئيلًا من الجسيمات موضع الاهتمام؛ فعلى سبيل المثال، تنتج الجسيمات التي تُسمى بوزونات هيجز مرة تقريبًا كل مليار تصادم3،2. وفي بحث نشر مؤخرًا في دورية Nature، يشير مُت وزملاؤه4 إلى تقنية لتحليل البيانات، تجمع بين تعلُّم الآلة، والحوسبة الكمية، ويستخدمون تلك التقنية في مشكلة تحديد بوزونات هيجز. يتمتع نهج مُت وزملائه ببعض المزايا، مقارنة بالطرق التقليدية6،5، ويفتح الباب أمام المزيد من فرص البحث.

يجري تحديد الأحداث النادرة في مصادم الهدرونات الكبير، مثل إنتاج بوزون هيجز، باستخدام أدوات تصنيف؛ وهي بمثابة توليفة من متغيرات تعتمد قِيَمها على الجسيمات التي تنتج في التصادمات. ويجب تحسين أدوات التصنيف؛ لرفع حساسية تحليل البيانات للأحداث النادرة إلى أقصى حد ممكن، ونبذ الأحداث الأساسية الوفيرة المتكررة عادةً، التي تنتج عن عمليات فيزياء الجسيمات الاعتيادية. وقد تحقق هذا التحسن عادةً، إما عن طريق اختبار توليفات المتغيرات يدويًّا، أو باستخدام تقنيات تعلُّم الآلة. ولكل من هذين الأسلوبين مزاياه في الحالات المختلفة، وكلاهما كان له دور أساسي في اكتشاف بوزون هيجز8،7 في عام 2012.

غالبًا ما يكون لأدوات التصنيف بشرية الصنع دلالة فيزيائية واضحة، ويمكن تحسينها باستخدام قَدْر صغير نسبيًّا من البيانات، غير أن عملية التحسين يمكن أن تتطلب قدرًا كبيرًا من الوقت البشري. وإضافة إلى ذلك، فإنها نادرًا ما تستغل الارتباط بين المتغيرات على نحو كامل، ما يعني أن تحليل البيانات لا يكون حساسًا للإشارة موضع الاهتمام إلى أقصى حد ممكن.

وعلى النقيض من ذلك، فإن تقنيات تعلُّم الآلة تحتاج في الأغلب إلى وقت حوسبة، بدلًا من الوقت البشري؛ لإيجاد أفضل توليفات للمتغيرات. علاوة على أنها تستغل كلًّا من الارتباطات الخطية وغير الخطية بين المتغيرات، وبالتالي تقوم برفع حساسية تحليل البيانات إلى أقصى حد ممكن، غير أن تلك التقنيات تتطلب قدرًا ضخمًا من البيانات، وعادة ما تكون أداة التصنيف المثلى بلا دلالة فيزيائية واضحة.

يشير مُت وزملاؤه إلى تقنية تحليل بيانات بديلة، تُسمى "التطويع الكَمِّي لتعلُّم الآلة"، تجمع مزايا كلٍّ من النهجين التقليديين؛ فبدلًا من الاعتماد على البشر، لاختبار كافة التوليفات المحتملة للمتغيرات، تتحول مسألة التحسين إلى شكل يمكن لحاسب كَمِّي أن يفهمه. وبعد ذلك، يُكلف الحاسب - أو عملية محاكاة تقليدية خاصة به - باكتشاف أداة التصنيف المثلى. ويكون لأداة التصنيف النهائية دلالة فيزيائية واضحة، وتأخذ بعين الاعتبار الارتباطات الخطية بين المتغيرات.

وفيما يخص تحديد بوزون هيجز، أوضح الباحثون أن التطويع الكَمِّي لتعلُّم الآلة يحتاج إلى مجموعة بيانات صغيرة نسبيًّا، للحصول على تحليل بيانات حساس لأقصى حد ممكن. وعلى النقيض من ذلك، وجدوا أن تقنيات تعلُّم الآلة التقليدية6،5، التي تتطلب كمية ضخمة من البيانات، تحقِّق مكاسب ضئيلة فحسب فيما يتعلق بالحساسية.

من حيث المبدأ، ينبغي لمزايا التطويع الكَمِّي لتعلُّم الآلة أن تكون قابلة للتحويل إلى مسائل أخرى  من مسائل تحليل البيانات، غير أن مقارنة الحساسية التي أجراها مُت وزملاؤه جرى تقييمها في حالة حدثٍ من السهل نسبيًّا تحديده، ألا وهو: تحلُّل بوزون هيجز إلى زوج من الفوتونات. ويلزم إجراء المزيد من الدراسات؛ لتقرير ما إذا كانت حساسية تحليلات بيانات التطويع الكَمِّي لتعلُّم الآلة منافِسة للطرق التقليدية6،5 أم لا، وذلك عند دراسة عمليات فيزيائية أكثر تعقيدًا.

وعلى الرغم من أنه قد يكون من المفيد تحديد أداة تصنيف مثلى باستخدام مجموعة بيانات صغيرة فحسب، فإن العديد من تحليلات فيزياء الجسيمات يتطلب مجموعات بيانات ضخمة لأسباب أخرى، مثل تقليل الشكوك. لذا، إذا كانت تقنيات تعلُّم الآلة تتفوق على تقنية التطويع الكَمِّي لتعلُّم الآلة، فإن علماء فيزياء الجسيمات عادة سيستخدمون تعلُّم الآلة؛ لتعظيم حساسية التحليل، بغضّ النظر عن الاحتياج إلى مجموعة بيانات ضخمة.

وعلى النقيض، من المرجح أن تكون تقنية التطويع الكَمِّي لتعلُّم الآلة أكثر فائدة في الحالات التي يكون فيها تعلُّم الآلة غير ممكن، أو غير مفيد للغاية؛ فهي تكون مفيدة للعديد من دراسات فيزياء الجسيمات، عن طريق توفير فائدة محدودة فيما يتعلق بحساسية التحليل، بحد أدنى من الجهد، والاحتفاظ بالحدس الفيزيائي لكل متغير في التحليل. بيد أن هذا النهج سيكون أكثر قيمة على الأرجح خارج نطاق فيزياء الجسيمات؛ في المجالات التي تكون فيها مجموعات البيانات أصغر، وبالتالي تكون الفوائد أكبر.

ولم يجد مُت وزملاؤه أي أدلة تشير إلى أن تقنية التطويع الكَمِّي لتعلُّم الآلة المطبَّقة في حاسب كَمِّي يمكن أن تتفوق بأي شكل من الأشكال على محاكاة العملية نفسها على حاسب اعتيادي، بل أوضح الباحثون، في الواقع، أن الحاسب الكَمِّي الخاص بهم يؤدي على نحو أسوأ قليلًا من المحاكاة، بسبب أوجه القصور التي تشوب مكوناته. علاوة على أن الحجم الصغير نسبيًّا للحاسب الكَمِّي الخاص بمُت وزملائه كان يعني أن الباحثين بحاجة إلى استخدام أوزان "بوليان" عند تحسين أدوات التصنيف؛ حيث يكون كل متغير إمّا مستخدمًا، أو غير مستخدم، والمتغيرات المستخدمة تأخذ أوزانًا متساوية في التحليل. وكما ذكر الباحثون، يمكن تحسين حساسية تقنية التطويع الكَمِّي لتعلُّم الآلة باستخدام حاسب كَمِّي أكثر قوة، يسمح للمتغيرات بأن تكون لها أوزان مختلفة، ويستفيد من الارتباطات المضادة بين المتغيرات.

ورغم أن معدّات الحوسبة الكمية التي استخدمها الباحثون مَثَّلَت عائقًا أمام عملهم، فإن عدم وجود ميزة مقارنة بالمحاكاة التقليدية يعني أن الباحثين يمكنهم الاستفادة من التطويع الكَمِّي لتعلُّم الآلة في الحواسب العادية. وإضافة إلى ذلك، فإن محاكاة مُت وزملائه التقليدية يمكنها بالفعل أن تستخدم متغيرات مرجحة عند تحسين أدوات التصنيف، وهو ما يشير إلى إمكانية تحسين نتائج الباحثين في المستقبل.

References

1.         Evans, L. & Bryant, P. J. J. Instrum. 3, S08001 (2008). | article
2.         Antchev, G. et al. (TOTEM Collaboration) Phys. Rev. Lett. 111, 012001 (2013).
3.         de Florian, D. et al. (LHC Higgs Cross Section Working Group) CERN Yellow Report 2017-002-M (2017).
4.         Mott, A., Job, J., Vlimant, J.-R., Lidar, D. & Spiropulu, M. Nature 550, 375–379 (2017). 
5.         Chollet, F. https://github.com/fchollet/keras (2015).
6.         Chen, T. & Guestrin, C. Preprint at https://arxiv.org/abs/1603.02754(2016).  | article
7.         Aad, G. et al. (ATLAS Collaboration) Phys. Lett. B 716, 1–29 (2012). | article
8.         Chatrchyan, S. et al. (CMS Collaboration) Phys. Lett. B 716, 30–61 (2012). | article



ستيفن شرام يعمل في قسم الفيزياء النووية وفيزياء الجسيمات بجامعة جنيف، 1211 جنيف، سويسرا.
البريد الإلكتروني: steven.schramm@cern.ch


ليست هناك تعليقات: