الثلاثاء، 14 أغسطس 2018

علوم الحاسب: التقاء تحليل البيانات بفيزياء الكَمّ



استخدام تقنية تجمع بين تعلُّم الآلة، والحوسبة الكمية؛ لتحديد الجسيمات المعروفة باسم بوزونات هيجز. ويمكن أن يكون لهذه الطريقة تطبيقات في العديد من مجالات العلوم.

ستيفن شرام

مع ظهور الحوسبة عالية الكفاءة، والقدرة على معالجة كميات هائلة من البيانات، تستمر الحاجة إلى تقنيات متقدمة في تحليل البيانات في الازدياد. ينطبق هذا بشكل خاص على التجارب التي تُجرى في مصادم الهدرونات الكبير بالقرب من جنيف في سويسرا، حيث تحدث التصادمات بين الجسيمات بمعدل يصل إلى 40 مليون تصادم في الثانية الواحدة1، لتتولد مجموعات هائلة من البيانات. وغالبًا ما تتضمن مجموعات البيانات تلك عددًا ضئيلًا من الجسيمات موضع الاهتمام؛ فعلى سبيل المثال، تنتج الجسيمات التي تُسمى بوزونات هيجز مرة تقريبًا كل مليار تصادم3،2. وفي بحث نشر مؤخرًا في دورية Nature، يشير مُت وزملاؤه4 إلى تقنية لتحليل البيانات، تجمع بين تعلُّم الآلة، والحوسبة الكمية، ويستخدمون تلك التقنية في مشكلة تحديد بوزونات هيجز. يتمتع نهج مُت وزملائه ببعض المزايا، مقارنة بالطرق التقليدية6،5، ويفتح الباب أمام المزيد من فرص البحث.

يجري تحديد الأحداث النادرة في مصادم الهدرونات الكبير، مثل إنتاج بوزون هيجز، باستخدام أدوات تصنيف؛ وهي بمثابة توليفة من متغيرات تعتمد قِيَمها على الجسيمات التي تنتج في التصادمات. ويجب تحسين أدوات التصنيف؛ لرفع حساسية تحليل البيانات للأحداث النادرة إلى أقصى حد ممكن، ونبذ الأحداث الأساسية الوفيرة المتكررة عادةً، التي تنتج عن عمليات فيزياء الجسيمات الاعتيادية. وقد تحقق هذا التحسن عادةً، إما عن طريق اختبار توليفات المتغيرات يدويًّا، أو باستخدام تقنيات تعلُّم الآلة. ولكل من هذين الأسلوبين مزاياه في الحالات المختلفة، وكلاهما كان له دور أساسي في اكتشاف بوزون هيجز8،7 في عام 2012.

غالبًا ما يكون لأدوات التصنيف بشرية الصنع دلالة فيزيائية واضحة، ويمكن تحسينها باستخدام قَدْر صغير نسبيًّا من البيانات، غير أن عملية التحسين يمكن أن تتطلب قدرًا كبيرًا من الوقت البشري. وإضافة إلى ذلك، فإنها نادرًا ما تستغل الارتباط بين المتغيرات على نحو كامل، ما يعني أن تحليل البيانات لا يكون حساسًا للإشارة موضع الاهتمام إلى أقصى حد ممكن.

وعلى النقيض من ذلك، فإن تقنيات تعلُّم الآلة تحتاج في الأغلب إلى وقت حوسبة، بدلًا من الوقت البشري؛ لإيجاد أفضل توليفات للمتغيرات. علاوة على أنها تستغل كلًّا من الارتباطات الخطية وغير الخطية بين المتغيرات، وبالتالي تقوم برفع حساسية تحليل البيانات إلى أقصى حد ممكن، غير أن تلك التقنيات تتطلب قدرًا ضخمًا من البيانات، وعادة ما تكون أداة التصنيف المثلى بلا دلالة فيزيائية واضحة.

يشير مُت وزملاؤه إلى تقنية تحليل بيانات بديلة، تُسمى "التطويع الكَمِّي لتعلُّم الآلة"، تجمع مزايا كلٍّ من النهجين التقليديين؛ فبدلًا من الاعتماد على البشر، لاختبار كافة التوليفات المحتملة للمتغيرات، تتحول مسألة التحسين إلى شكل يمكن لحاسب كَمِّي أن يفهمه. وبعد ذلك، يُكلف الحاسب - أو عملية محاكاة تقليدية خاصة به - باكتشاف أداة التصنيف المثلى. ويكون لأداة التصنيف النهائية دلالة فيزيائية واضحة، وتأخذ بعين الاعتبار الارتباطات الخطية بين المتغيرات.

وفيما يخص تحديد بوزون هيجز، أوضح الباحثون أن التطويع الكَمِّي لتعلُّم الآلة يحتاج إلى مجموعة بيانات صغيرة نسبيًّا، للحصول على تحليل بيانات حساس لأقصى حد ممكن. وعلى النقيض من ذلك، وجدوا أن تقنيات تعلُّم الآلة التقليدية6،5، التي تتطلب كمية ضخمة من البيانات، تحقِّق مكاسب ضئيلة فحسب فيما يتعلق بالحساسية.

من حيث المبدأ، ينبغي لمزايا التطويع الكَمِّي لتعلُّم الآلة أن تكون قابلة للتحويل إلى مسائل أخرى  من مسائل تحليل البيانات، غير أن مقارنة الحساسية التي أجراها مُت وزملاؤه جرى تقييمها في حالة حدثٍ من السهل نسبيًّا تحديده، ألا وهو: تحلُّل بوزون هيجز إلى زوج من الفوتونات. ويلزم إجراء المزيد من الدراسات؛ لتقرير ما إذا كانت حساسية تحليلات بيانات التطويع الكَمِّي لتعلُّم الآلة منافِسة للطرق التقليدية6،5 أم لا، وذلك عند دراسة عمليات فيزيائية أكثر تعقيدًا.

وعلى الرغم من أنه قد يكون من المفيد تحديد أداة تصنيف مثلى باستخدام مجموعة بيانات صغيرة فحسب، فإن العديد من تحليلات فيزياء الجسيمات يتطلب مجموعات بيانات ضخمة لأسباب أخرى، مثل تقليل الشكوك. لذا، إذا كانت تقنيات تعلُّم الآلة تتفوق على تقنية التطويع الكَمِّي لتعلُّم الآلة، فإن علماء فيزياء الجسيمات عادة سيستخدمون تعلُّم الآلة؛ لتعظيم حساسية التحليل، بغضّ النظر عن الاحتياج إلى مجموعة بيانات ضخمة.

وعلى النقيض، من المرجح أن تكون تقنية التطويع الكَمِّي لتعلُّم الآلة أكثر فائدة في الحالات التي يكون فيها تعلُّم الآلة غير ممكن، أو غير مفيد للغاية؛ فهي تكون مفيدة للعديد من دراسات فيزياء الجسيمات، عن طريق توفير فائدة محدودة فيما يتعلق بحساسية التحليل، بحد أدنى من الجهد، والاحتفاظ بالحدس الفيزيائي لكل متغير في التحليل. بيد أن هذا النهج سيكون أكثر قيمة على الأرجح خارج نطاق فيزياء الجسيمات؛ في المجالات التي تكون فيها مجموعات البيانات أصغر، وبالتالي تكون الفوائد أكبر.

ولم يجد مُت وزملاؤه أي أدلة تشير إلى أن تقنية التطويع الكَمِّي لتعلُّم الآلة المطبَّقة في حاسب كَمِّي يمكن أن تتفوق بأي شكل من الأشكال على محاكاة العملية نفسها على حاسب اعتيادي، بل أوضح الباحثون، في الواقع، أن الحاسب الكَمِّي الخاص بهم يؤدي على نحو أسوأ قليلًا من المحاكاة، بسبب أوجه القصور التي تشوب مكوناته. علاوة على أن الحجم الصغير نسبيًّا للحاسب الكَمِّي الخاص بمُت وزملائه كان يعني أن الباحثين بحاجة إلى استخدام أوزان "بوليان" عند تحسين أدوات التصنيف؛ حيث يكون كل متغير إمّا مستخدمًا، أو غير مستخدم، والمتغيرات المستخدمة تأخذ أوزانًا متساوية في التحليل. وكما ذكر الباحثون، يمكن تحسين حساسية تقنية التطويع الكَمِّي لتعلُّم الآلة باستخدام حاسب كَمِّي أكثر قوة، يسمح للمتغيرات بأن تكون لها أوزان مختلفة، ويستفيد من الارتباطات المضادة بين المتغيرات.

ورغم أن معدّات الحوسبة الكمية التي استخدمها الباحثون مَثَّلَت عائقًا أمام عملهم، فإن عدم وجود ميزة مقارنة بالمحاكاة التقليدية يعني أن الباحثين يمكنهم الاستفادة من التطويع الكَمِّي لتعلُّم الآلة في الحواسب العادية. وإضافة إلى ذلك، فإن محاكاة مُت وزملائه التقليدية يمكنها بالفعل أن تستخدم متغيرات مرجحة عند تحسين أدوات التصنيف، وهو ما يشير إلى إمكانية تحسين نتائج الباحثين في المستقبل.

References

1.         Evans, L. & Bryant, P. J. J. Instrum. 3, S08001 (2008). | article
2.         Antchev, G. et al. (TOTEM Collaboration) Phys. Rev. Lett. 111, 012001 (2013).
3.         de Florian, D. et al. (LHC Higgs Cross Section Working Group) CERN Yellow Report 2017-002-M (2017).
4.         Mott, A., Job, J., Vlimant, J.-R., Lidar, D. & Spiropulu, M. Nature 550, 375–379 (2017). 
5.         Chollet, F. https://github.com/fchollet/keras (2015).
6.         Chen, T. & Guestrin, C. Preprint at https://arxiv.org/abs/1603.02754(2016).  | article
7.         Aad, G. et al. (ATLAS Collaboration) Phys. Lett. B 716, 1–29 (2012). | article
8.         Chatrchyan, S. et al. (CMS Collaboration) Phys. Lett. B 716, 30–61 (2012). | article



ستيفن شرام يعمل في قسم الفيزياء النووية وفيزياء الجسيمات بجامعة جنيف، 1211 جنيف، سويسرا.
البريد الإلكتروني: steven.schramm@cern.ch


ناسا تنطلق نحو الهالة الشمسية



سوف يصل مسبار «باركر» Parker الشمسي إلى نقطة دنو من الشمس، لم تبلغها البشرية من قبل.


ألكسندرا فيتز


أبشر يا إكاروس.. فقد صَنعَتْ وكالة ناسا مركبة فضائية يمكنها الطيران عبر الغلاف الجوي للشمس، دون أن تنصهر.
في السادس من أغسطس، إذا تم كل شيء كما خُطط له، سينطلق مسبار «باركر» Parker الشمسي - البالغة قيمته 1.5 مليار دولار أمريكي - من منصة إطلاق في كيب كانافيرال في فلوريدا. وفي خلال ثلاثة أشهر فقط، سوف يصبح أقرب إلى الشمس من أي مركبة فضائية قبله؛ وذلك لأخْذ أول قياسات مباشرة على الإطلاق للكَمّ الهائل من الطاقة في هذا النجم.
وهذه ليست سوى البداية، فعلى مدى السنوات السبع المقبلة سوف تحلّق المركبة حول الشمس 23 مرة أخرى، مقتربة أكثر فأكثر، حتى تكون في النهاية قد حلقت حوالي 6.2 مليون كيلومتر فوق السطح، أي داخل الهالة الشمسية؛ وبذلك تكون أقرب بسبع مرات من المسافة القياسية التي حققتها مركبة الفضاء الألمانية «هيليوس 2» Helios 2 في عام 1976.
يهدف مسبار «باركر» الشمسي إلى الإجابة على بعض أكبر الأسئلة البارزة حول الشمس، مثل كيفية تسخين الهالة حولها إلى ملايين الدرجات، فيما يبقى السطح تحتها باردًا نسبيًّا1. وسوف تزور المركبة الفضائية محل نشوء الرياح الشمسية، التي هي فيض من الجسيمات النشطة، التي تنساب إلى النظام الشمسي بسرعات تصل إلى 800 كيلومتر في الثانية. ومتى تصطدم الرياح الشمسية بالأرض؛ فإنها تولِّد شفقًا قطبيًا جميلًا، غير أنها قد تؤدي أيضًا إلى تعطيل الاتصالات عبر الأقمار الصناعية وأنظمة الملاحة.
"سوف نكون هناك، حيث تَحْدُث كل الأشياء المثيرة"، هكذا تقول نيكولا فوكس، العالِمة في الفيزياء الشمسية بمختبر الفيزياء التطبيقية (APL) بجامعة جونز هوبكنز في لوريل بولاية ميريلاند، وهي أيضًا العالمة المسؤولة عن مشروع البعثة.
من شأن البيانات المأخوذة من هذا المسبار، الذي يغوص في الأعماق، أن تساعد الباحثين على تعزيز فَهْمهم للصورة المعقدة لكيفية تجميع الجسيمات، والمجالات المغناطيسية، والطاقة في الشمس. ومن جانبها، تقول نيكولين فيال، العالمة في الفيزياء الشمسية بمركز جودارد لرحلات الفضاء، التابع لوكالة ناسا، في جرينبيلت بولاية ميريلاند: "هذا أمر من شأنه أن يقلب الموازين".
منذ عام 1958، وفيزيائيو الفضاء يحلمون ببعثة تحلِّق عبر الهالة الشمسية، أو على الأقل تسافر داخل مدار كوكب عطارد، وهو الكوكب الأقرب للشمس. وفي العام نفسه، اقترح يوجين باركر، وهو عالِم في الفيزياء بجامعة شيكاجو بولاية إلينوي، الذي سُمي المسبار باسمه، وجود الرياح الشمسية للمرة الأولى2.
وبعد عقود من التخطيط، تقترب المهمة أخيرًا من الانطلاق. وبعد ثمانية أسابيع من الإقلاع، سوف تمر المركبة محلِّقة من أمام كوكب الزهرة، مستخدِمة جاذبية الكوكب للإبطاء والتسلل إلى مدار أضيق حول الشمس. وبعد خمسة أسابيع من ذلك، في الثالث من نوفمبر، سوف يقترب المسبار للمرة الأولى - على بعد أكثر من 24 مليون كيلومتر - من سطح الشمس، أو 35 مرة طول نصف القطر الشمسي.
ومن هناك، سوف تدور المركبة الفضائية حول الشمس، مقتربةً أكثر بالتدريج، بينما تمر محلِّقة من أمام كوكب الزهرة ست مرات أخرى. ومن شأن هذا المسار أن يمنح المسبار الوقت الكافي لجمع المعلومات، كما يقول يانبينج جو، المهندس لدى APL، الذي صمم مسار البعثة.
وفي مكان ما بين المرة الأولى التي يقترب فيها من الشمس (عند 35 نصف قطر شمسي)، والمرات الأخيرة (في نطاق 10 أنصاف أقطار شمسية)، سوف يواجه المسبار سطح «ألڤين» Alfvén، وهو الحد الذي تصبح عنده الرياح الشمسية أسرع من الصوت. يهيمن المجال المغناطيسي للشمس على داخل سطح «ألڤين»، فيما تكون الرياح الشمسية خارجه أكثر انفصالًا، وتفيض بعيدًا من تلقاء نفسها.
وسوف يكون عبور هذا الحدّ بمركبة فضائية مشابِهًا – رمزيًّا - للحظة التي دخل فيها مسبار «فوياجر 1» Voyager 1 إلى الفضاء بين النجمي في عام 2012، كما يقول جاستن كاسبر، وهو عالِم في الفيزياء بجامعة ميتشيجان في آن أربور، كان قد درس عمليات انتقال «ألڤين»3. وسوف تسجل هذه اللحظة حدث مرور البشرية إلى عالَم آخر في النظام الشمسي. يقول كاسبر: "إنني واثق من أنّ شيئًا مميزًا سوف يحدث".
يقف مسبار «باركر» الشمسي بشكل عمودي، محمَّلًا بمجموعة من الأدوات المصمَّمة لفحص الهالة الشمسية مباشرة. ويحمي الأدوات درع حراري، عرضه 2.4 متر، ومصنوع من رغوة كربونية، سُمْكها 11 سنتيمترًا، محصورة بين طبقتين من مركب كربوني. ويمكنها تحمُّل درجات حرارة تقترب من 1,400 درجة مئوية. وستظل الألواح الشمسية التي تشغل المركبة الفضائية مبردة، من خلال نظام أنابيب المياه المماثِل لمبرِّد محرك السيارة. وفي أثناء السخونة الحارقة إثر الاقتراب من الشمس، سوف تُثنى غالبية الألواح الشمسية عائدةً للمبيت في ظل الدرع الحراري.
يأمل علماء البعثة أن يسهم مسبار «باركر» الشمسي في إطلاق حقبة جديدة من دراسات الشمس. فوكالة الفضاء الأوروبية تخطط لإطلاق مركبتها الفضائية «سولار أوربيتر» Solar Orbiter في عام 2020، التي سوف تدرس الشمس عند خطوط العرض الأعلى، ومن نقطة أبعد في الفضاء مما سيفعله مسبار «باركر» الشمسي. وبحلول عام 2020 كذلك، سوف يبدأ تليسكوب دانيال كيه. إينوي الشمسي في هاواي في العمل على إنشاء خرائط يومية للهالة الشمسية.
ومن جهته، يتطلع باركر، البالغ من العمر 91 عامًا، إلى رؤية الأمواج والاضطرابات في الرياح الشمسية، التي تنبأ بها، بينما يقيسها المسبار الذي يحمل اسمه. ويقول: "أتوقع أن أجد بعض المفاجآت".


References
            Fox, N. J. et al. Space Sci. Rev. 204, 7–48 (2016). | article
            Parker, E. N. Astrophys. J. 128, 664–676 (1958). | article
            Kasper, J. C. et al. Astrophys. J. 849, 126 (2017).  | article



استخدِموا تعلُّم الآلة للعثور على مواد الطاقة



يرى إدوارد سارجنت وزملاؤه أن الذكاء الاصطناعي يمكنه أن يُسرّع من وتيرة البحوث المتعلقة بالمواد الفولتضوئية الجديدة، ومواد البطاريات، ومواد احتجاز الكربون.
فيل دي، وجينيفر ويي، ويوشوا بنجيو، وآلان أسبورو جوزيك، وإدوارد سارجنت




العالَم بحاجة إلى المزيد من الطاقة، لذا، تستثمر الحكومات والشركات مليارات الدولارات في تطوير تقنيات لإنتاج الطاقة، وتحويلها، وتخزينها1. ومع اقتراب خلايا السيليكون الشمسية من الوصول إلى حد أدائها الأقصى، يتطلع الباحثون إلى بدائل قائمة على خلايا البيروفسكايت، والنقاط الكمية2. ينبغي أن تصبح البطاريات المخزِّنة للطاقة أرخص ثمنًا، وأكثر كفاءة، وأطول عمرًا3، كما يجب تصنيع الأجهزة من مواد آمنة، ومتاحة بوفرة، مثل النحاس، والنيكل، والكربون، بدلًا من الرصاص، أو البلاتين، أو الذهب.ويجب كذلك أن تُظهِر تحليلات دورات حياة المواد  تحسّنًا في البصمات الكربونية، فضلًا عن القدرة على مواءمة حجم التحدي العالمي للطاقة.

تَصْدُر كميات هائلة من البيانات المستقاة من التجارب حول خصائص هذه المواد. فعلى سبيل المثال، يؤوي «المعهد الوطني الأمريكي للمعايير والتكنولوجيا» 65 قاعدة بيانات، يحتوي بعضها على ما قد يصل إلى 67,500 قياس، كما نُشر منذ عام 2010 ما يزيد على 1.7 مليون بحث علمي حول البطاريات والخلايا الشمسية وحدها.

يجب تسريع وتيرة محاولات الربط بين هيكل المادة، ووظيفتها؛ فمساحة البحث واسعة. ولا زال يتم العثور تجريبيًّا على كثير من المواد، حيث تُصنع المواد المُحتملة، وتُختبر عدة عينات منها في المرة الواحدة. وتتعرض عمليات البحث للتحيز البشري، إذ غالبًا ما يركِّز الباحثون على تكوينات قليلة من العناصر، يرونها مثيرة للاهتمام.

يجري العمل حاليًّا على تطوير أساليب حاسوبية، تولِّد الهياكل تلقائيًّا، وتقيِّم ميزاتها الإلكترونية وخصائصها الأخرى4. فعلى سبيل المثال، يستخدم "مشروع المواد" Materials Project حواسيب فائقة؛ للتنبؤ بخواص جميع المواد المعروفة5، وهو الآن يطرح قوائم تحتوي على الخصائص المتوقعة لأكثر من 700 ألف مادة، إلا أن الاحتمال الكبير أنْ تُترجَم هذه البيانات إلى تطبيقات صناعية وتجارية لا يزال أمنية بعيدة المنال.
عرض لوحدة شمسية في أحد المعارض في طوكيو.

إن تعلُّم الآلة – بمعنى الخوارزميات التي يتم تدريبها للعثور على أنماط في مجموعات البيانات - قد يُسَرِّع بشكل كبير اكتشاف مواد الطاقة. وقد استُخدم بالفعل للتنبؤ بنتائج عمليات المحاكاة الكمية؛ لتحديد الجزيئات والمواد المحتملة للاستخدام في بطاريات التدفق، والصمامات الثنائية العضوية الباعثة للضوء6، والخلايا الفولتضوئية العضوية، ومحفزات عملية تحويل ثاني أكسيد الكربون7. وتستطيع الخوارزميات التنبؤ بالنتائج في بضع دقائق، بالمقارنة بمئات الساعات التي تستغرقها عمليات المحاكاة8.
ومع ذلك، لا تزال هناك تحديات قائمة. فلا يوجد تمثيل عام لمواد الترميز، كما تتطلب التطبيقات المختلفة خواص مختلفة، مثل تكوين العنصر، والبنية البلورية، والتوصيل. ومن النادر إيجاد بيانات تجريبية منظَّمة بشكل جيد متعلقة بالمواد، كما تعتمد الاختبارات الحاسوبية للفرضيات على افتراضات ونماذج قد تكون غير واقعية في الأوضاع التجريبية.

وعليه، ينبغي أن يزداد التعاون بين مجتمعات تعلُّم الآلة، ومجتمعات علوم الطاقة. ويجب على هذه المجتمعات أن تدرك قدرات واحتياجات بعضها بعضًا. وبناءً عليه، فنحن نطرح التوصيات التالية الصادرة عن ورشة عمل، أدارها «المعهد الكندي للبحوث المتقدمة» في شهر مايو 2017 بمدينة بوسطن في ولاية ماساتشوستس.
أربعة جسور
قم بمشاركة البيانات المفيدة. ينبغي أن ينظم علماء المواد بياناتهم في نماذج موحدة، وقابلة للقراءة آليًّا، مثل ملفات "القيم المفصولة بفواصل" CSV، التي يشيع استخدامها في تطبيقات جداول البيانات. وفي الوقت الحاضر، تُكثف النتائج أكثر في رسوم بيانية وجداول، وتنظم كل مجموعة بياناتها على نحو مختلف، كما تتنوع ظروف الاختبار، والإطر التجريبية. وتلجأ العديد من الفرق إلى معالجة نطاقاتها الأولية، أو تطبيع بياناتها، وغالبًا ما تتعرض النماذج لحدوث أخطاء بها وتحيزات، في ظل غياب أدلة تجريبية لمعايرة النتائج.

وينبغي على وكالات التمويل الحكومية ودور النشر أن تطالب بتحميل البيانات على قاعدة بيانات متاحة للعامة، مثل "مشروع المواد" Mat¬erials Project، أو نظام حفظ بيانات المواد Materials Data Curation System، أو منصة "سيترينيشن"Citrination 9. ويمكن أن تشترك الاتحادات والجامعات في تحمُّل تكاليف الاحتفاظ بقواعد البيانات هذه؛ مع ذِكر المصدر عند الاستشهاد بها. وفي المقابل، يمكن إنشاء كيان مستقل لحفظ قاعدة بيانات تجريبية، بالطريقة نفسها غالبًا التي تتم بها مشاركة البِنى البلورية للبروتينات حاليًّا في بنك بيانات البروتين Protein Data Bank. ومن المهم تضمين النتائج السلبية، إذ تحتاج خوارزميات تعلُّم الآلة أن يصبح بمقدورها التمييز بين المواد التي تحقق الأهداف المتعلقة بالأداء، وتلك التي لا تفعل.

كما ينبغي تشجيع ثقافة المشاركة في مجتمع علم خواص المادة. فمجتمعات علوم الحاسب الآلي والطب تجني فوائد كثيرة من إتاحتها مجموعات البيانات الضخمة الخاصة بها لتعلُّم الآلة. على سبيل المثال، تستخدم شركة «آي بي إم واطسون هيلث» IBM Watson Health في كامبريدج بولاية ماساتشوستس تعلُّم الآلة من أجل تحسين اكتشاف العقاقير، وعلاجات السرطان.

تشجيع التعاون مع المسابقات. تمثِّل جوائز "التحدي الكبير" وسيلة فعالة من حيث التكلفة، لتعزيز الابتكار. وعلى سبيل المثال، أثمرت مبادرة "إكس برايز" XPRIZE عن تحقيق إنجازات في احتجاز الكربون، واستخدامه، واستكشاف المحيطات، والذكاء الاصطناعي. وقد مُنحت جائزة "أنصاري إكس برايز" Ansari XPRIZE للرحلات شبه المدارية لعام 2004 للمركبة "سبيس شيب وان" SpaceShipOne، وهي أول سفينة فضاء خاصة تخترق الفضاء الخارجي. وتستخدم منصة "كاجل"Kaggle  المسابقات، لتجميع الحلول لمشكلات النمذجة الحاسوبية وعلم البيانات، مثل التنبؤ بنشاط الجزيئات الشبيهة بالعقاقير. كما أن الأحداث التي تقام من نوع "هاكاثون" hackathon المدعوم، الذي تديره شركات مثل "إينجل هاك" AngelHack في سان فرانسيسكو بكاليفورنيا، قد تمكنت من تطوير تطبيقات للشركات، بما في ذلك شركة "ماستركارد" Mastercard.

نحن نقترح عقد مسابقات لتعلّم الآلة، من أجل تشجيع العثور على مواد جديدة للطاقة في مجموعات البيانات المتاحة للعامة، مثل تلك الخاصة بمبادرة مواد الجينوم، أو مبادرة مختبر اكتشاف المواد الجديدة (NOMAD) الأوروبية، أو منصة "سيترينيشن". سيكون الهدف من وراء ذلك هو التنبؤ بمادةٍ ما لتطبيق أو خاصية معينة. فعلى سبيل المثال، المسامية النانوية هي عامل أساسي لمواد احتجاز الكربون، والفجوة بين النطاقات الإلكترونية هي موصّف مهم للخلايا الشمسية، والصلابة يمكن استخدامها لتطوير مواد مركبة خفيفة الوزن للنقل. كما يمكن لتعلُّم الآلة التعامل مع عدد من الخواص في وقت واحد.

يمكن للمسابقات أن تتم رعايتها من قِبل الأقسام الجامعية، أو المعاهد المدعومة تجاريًّا، مثل «معهد فكتور الكندي للذكاء الاصطناعي» في تورنتو، و«معهد مونتريال لخوارزميات التعلم»، أو «معاهد بحوث شركة تويوتا» الموجودة في الولايات المتحدة. ويمكنها أن تتخذ شكلًا مماثِلًا للعبة طيّ البروتينات على شبكة الإنترنت "فولديت" Foldit، التي يلعبها الناس من أجل متعة الاستكشاف، وأيضًا للتنافس والتفوق على الآخرين. ويمكن إدارة الملكية الفكرية على نسق يشبه "إكس برايز".

صياغة لغة مشتركة. الكيميائيون، وعلماء الحاسب الآلي، وخبراء تعلم الآلة، ومهندسو المواد، والمبرمجون، والفيزيائيون؛ كلٌّ له مجال تخصص، ونظام تسمية خاص به، فمثلًا، تجد أن مهندسي المواد ماهرون في تصنيع المواد من تركيبات متنوعة، وسيحتاج باحثو تعلُّم الآلة أن يفهموا هذه التفاصيل الدقيقة؛ كي يتمكنوا من التنبؤ بالمواد التي لها استخدام عملي.

نحن نقترح أن تنظم الجامعات ورشات عمل، وفصولًا صيفية، وأن تضع مناهج تربط بين هذه المجالات. هناك فصول صيفية تُدَرِّس بالفعل الكيمياء الحاسوبية التقليدية، وتعلُّم الآلة لتطبيقات علوم الحاسب الآلي، لكنّ قليلًا من هذه البرامج ما يجمع بين الاثنين. ويجب إنشاء المزيد من المنتديات لأغراض التدريب، مثل برنامج "فَهْم الأنظمة كثيرة الجزيئيات، من خلال تعلُّم الآلة" Understanding Many-Particle Systems with Machine Learning، الذي يديره «معهد الرياضيات البحتة والتطبيقية» في لوس أنجيليس بكاليفورنيا.

سَرِّع الأمور، واجعلها تعمل آليًّا. إن استكشاف مواد الطاقة، كونه مجال بحثي سريع التطور، فهو يشكل منصة اختبار مثالية لتقنيات تعلُّم الآلة المتقدمة. يَفترِض تعلُّم الآلة وجود مجموعة تدريبية ثابتة؛ فعلى سبيل المثال، يتم تدريب روبوتات السيارات ذاتية القيادة على القيادة باستخدام صور وفيديوهات للطرق، لكن ذلك قد يتسم بالبطء، كما يصعب تكرار النتائج، أو هي تختلف من مستخدِم إلى آخر. وعلى النقيض، يتغير مشهد البيانات الخاصة بمواد الطاقة باستمرار مع ظهور معلومات ونماذج جديدة. وهنا، يصبح المجال المتنامي الخاص بالتعليم المعزز العميق مفيدًا، حيث يَستكشف المستخدمون فيه العناصر البيئة المتغيرة من حولهم؛ لإيجاد أفضل الحلول. ومن شأن تطبيق هذه الخوارزميات على عمليات استكشاف المواد أن يجعل عمليات البحث – تدريجيًّا - أكثر كفاءة، وسيسمح للمتعلم أن يستكشف فضاء الجزئيات، مثلما يفعل الكيميائيون.

ماذا بعد؟

إن تطوير أساليب تعلُّم الآلة يشكل أحد أهم أهداف "تحدي ابتكار مواد الطاقة النظيفة"، الذي يديره التعاون العالمي "ميشن إنوفيشن" Mission Innovation. يموَّل التعاون من قِبَل تعهدات حكومية طوعية، ويجب أن تلتزم الدول بتعهداتها بضخ الاستثمارات اللازمة.
والخلاصة هي أن هناك حاجة إلى مزيد من الاستثمارات في مجال الذكاء الاصطناعي، وبحوث المواد القائمة على علم الروبوتات حول العالم. وتجب إتاحة المزيد من البيانات للأشخاص القائمين على برمجة الروبوتات، كما يجب أن يتواصل القائمون على التجارب، وخبراء الروبوتات، ومصممو الخوارزميات، ويتعاونوا أكثر؛ من أجل تسهيل عملية اكتشاف الأخطاء وإصلاحها.
إن الوقت يقترب على الانتهاء، قبل أن نصل إلى تقنيات الطاقة الجديدة التي يحتاجها العالَم.
فيل دي لونا طالب دراسات عليا في قسم علم خواص المادة وهندستها في جامعة تورنتو، كندا. جينيفر ويي طالبة دراسات عليا في قسم الكيمياء والأحياء الكيميائية، جامعة هارفارد، كامبريدج، ماساتشوستش، الولايات المتحدة الأمريكية. يوشوا بنجيوأستاذ في معهد مونتريال لخوارزميات التعلم (MILA)، قسم علوم الحاسب الآلي وبحوث العمليات، جامعة مونتريال، كندا. آلان أسبورو جوزيك أستاذ بقسم الكيمياء والأحياء الكيميائية، جامعة هارفارد، كامبريدج، ماساتشوستش، الولايات المتحدة الأمريكية. إدوارد سارجنت أستاذ في قسم الهندسة الكهربائية وهندسة الحاسوب، جامعة تورنتو، كندا.

البريد الإلكتروني: ted.sargent@utoronto.ca؛ و alan@aspuru.com


References
Bernstein, A. et al. Nature 538, 30 (2016). | article
Chu, S., Cui, Y. & Liu, N. Nature Mater. 16, 16–22 (2016).
| article
Huskinson, B. et al. Nature 505, 195–198 (2014).
| article
Curtarolo, S. et al. Nature Mater. 12, 191–201 (2013).
| article
Jain, A. et al. APL Mater. 1, 11002 (2013) | article
Gómez-Bombarelli, R. et al. Nature Mater. 15, 1120–1127 (2016).
| article
Liu, M. et al. Nature 537, 382–386 (2016).
| article
Ji, H. & Jung, Y. J. Chem. Phys. 146, 064103 (2017).
| article
O’Mara, J., Meredig, B., & Michel, K. J. Miner. Met. Mater. Soc. 68, 2031–2034 (2016).
| article