سيجد المزيد من الأشخاص طريقهم إلى Python من أجل أعباء عمل علوم البيانات ، ولكن هناك سبب لجعل R و Python مكملين وليس تنافسيين.
نظرًا لأن علم البيانات يصبح أمرًا بالغ الأهمية لكل مؤسسة ، فقد أصبح من المهم تحديد الأدوات المناسبة للمساعدة في إتقانها. اللغتان الأكثر شيوعًا لمعالجة مشاكل علوم البيانات هما Python و R. كلتا لغتي البرمجة هما مصدران مفتوحان لدى مجتمعات كبيرة. لكن Python و R يجلبان أيضًا قوتهما الفريدة لعلوم البيانات ، مما يجعل من الصعب تحديد أيهما يستخدم.
R مقابل Python: الاختلافات الرئيسية
R هي بيئة تفاعلية مفتوحة المصدر لإجراء التحليل الإحصائي. إنها ليست لغة برمجة على الإطلاق ، ولكنها تتضمن لغة برمجة للمساعدة في التحليل.
كما هو موضح في موقع R , Outlined عبارة عن مجموعة متكاملة من مرافق البرامج لمعالجة البيانات والحساب والعرض الرسومي [الذي] يتضمن … مجموعة كبيرة ومتماسكة ومتكاملة من الأدوات الوسيطة لتحليل البيانات …” على الرغم من أن R لم تكن الأداة الأولى من نوعها ، إلا أنها كانت مبكرة في علم البيانات وكانت عنصرًا أساسيًا في الأوساط الأكاديمية لبعض الوقت.
على النقيض من ذلك ، فإن Python هي لغة برمجة مفتوحة المصدر “مفسرة وموجهة للكائنات وعالية المستوى مع دلالات ديناميكية” ، وفقًا لموقع الويب الخاص بالمشروع. ومع ذلك ، فإن هذا لا ينصفها حقًا. Python هي لغة سهلة التعلم وذات أغراض عامة وغالبًا ما تكون اللغة الأولى التي يتعلمها المطور ، لأنها كانت لغة تدريس منذ فترة طويلة.
قال بيتر وانغ ، الرئيس التنفيذي لشركة Anaconda ، ذات مرة: “إنه سهل الاستخدام ، ويسهل التقاطه ، ويستخدمه الأطفال ، ويستلمه غير المبرمجين في عطلة نهاية الأسبوع”. “هذا ليس عرضيًا [ولكنه] كان جزءًا متشددًا من التصميم منذ البداية ومتعمدًا تمامًا.”
كنتيجة طبيعية قريبة ، كانت بايثون دائمًا رائعة كلغة صمغ. كما شددت المحللة في RedMonk ، راشيل ستيفنز ، “بهذا المعنى ، من المنطقي جدًا أن تستثمر الشركات في Python كطريقة للاستثمار في الكود الخاص بها.” بعبارة أخرى ، تساعد Python المؤسسات على جعل الكود القديم جزءًا من تطلعاتها الحديثة للقيام بعلوم البيانات.
ربما يكون هذا هو المكان الذي تبرز فيه فائدة Python الأساسية لعلوم البيانات: الجميع يعرف ذلك.
اقرء ايضا : مزود خدمات البيانات الكبيرة السحابية
قال فان ليندبرج ، المستشار العام لمؤسسة Python Software Foundation: “Python هي ثاني أفضل لغة لكل شيء”. “قد يكون R هو الأفضل بالنسبة للإحصاءات ، ولكن Python هي الثانية … والثانية الأفضل بالنسبة لتعلم الآلة ، وخدمات الويب ، وأدوات الصَدَفة ، و (أدخل حالة الاستخدام هنا).”
قد يقلل ليندبيرج من قوة بايثون في بعض المجالات ؛ من الواضح أنه ليس دائمًا ثاني أفضل الأفضل ، لكن وجهة نظره صحيحة من حيث الاتجاه: “إذا كنت تريد القيام بأكثر من مجرد الإحصائيات ، فإن اتساع بايثون يعد فوزًا ساحقًا.”
بمعنى آخر ، تعد Python جيدة بما يكفي بحيث يختار المطورون وغيرهم استخدامها لمجموعة واسعة من حالات الاستخدام. Python ، مثل Java ، هي لغة برمجة للأغراض العامة ؛ ومع ذلك ، على عكس جافا ، من السهل جدًا تعلمها واستخدامها. على هذا النحو ، يتم استخدامه لجميع أنواع الأشياء ، مما يؤدي إلى “نمو هائل” ، كما وصفه وانغ ذات مرة. لا عجب إذن أنه إذا قمنا بتحليل النمو النسبي والانحدار بين Python و R في إعلانات وظائف عالم البيانات ، من 2019 إلى 2021 ، كما فعل Terence Shin ، فمن الواضح أن Python تربح على حساب R.
R مقابل Python: أيهما أفضل لعلوم البيانات؟
على الرغم من أن لغة Python أثبتت أنها أكثر شهرة من R ، فإن هذا لا يعني أنها دائمًا أفضل. كما هو الحال مع معظم الأشياء في التكنولوجيا ، يعتمد الأمر على ما تأمل في تحقيقه. على الرغم من أن بايثون لديها عائق أقل للتعلم وأن تصبح منتجة ، إلا أن نهج R غير القياسي يمكن أن يكون مرهقًا للتعلم ، بالنسبة لبعض المهام ، من المفيد الاستثمار في تعلم R. وبالطبع ، بالنسبة لبعض الأشياء ، مثل التنقيب عن البيانات والأساسي تصور البيانات ، فمن المحتمل أن تختار أيًا منهما.
ومع ذلك ، يجب أن ينبع ما تختاره من المشكلة التي تحاول معالجتها بالإضافة إلى الاستثمارات طويلة الأجل التي تخطط أنت وشركتك لإنجازها.
على سبيل المثال ، يعد R مناسبًا بشكل أفضل للحساب الإحصائي وتصور البيانات لأن R مصمم خصيصًا بواسطة الإحصائيين للتحليل الإحصائي والرقمي لمجموعات البيانات الكبيرة. لا تحتاج إلى كتابة الكثير من التعليمات البرمجية في R لإجراء تحليل إحصائي عميق وتصور للبيانات.
ومن الصحيح أيضًا أنه بالنسبة لبعض المجالات مثل علوم الحياة ، قد تكون حزم R متطورة بشكل خاص ، مما يجعل R اختيارًا جيدًا. يعتمد الكثير على ما تقوم ببنائه وخلفيتك. كما قال رايان هوبسون ، شريك Align BI ، في مقابلة ، “أعتقد أن لغة R هي لغة أسهل للإحصائيين الذين قد لا يكون لديهم خلفية عن البرمجة.”
ولكن “خلفية البرمجة” بالتحديد هي التي تجعل Python الفائز الواضح للمطورين أو غيرهم من المهتمين بالبيانات الضخمة والذكاء الاصطناعي (AI) وخوارزميات التعلم العميق.
قال وانج: “كان لبايثون نطاق أوسع [من R] منذ البداية [مع الهندسة والعلوم] الحمض النووي المخبوز في نواة بايثون”. من الصحيح الموضوعي أن لغة Python أكثر شيوعًا بشكل كبير ، عبر مجموعة واسعة من حالات الاستخدام ، من R ، وتصبح أكثر شيوعًا كل يوم.
بعد ذلك ، هناك حقيقة مفادها أن طبيعة علم البيانات ذاتها تتغير.
“كان هناك أيضًا توسع يتجاوز ما كان تقليديًا مجرد فريق علم بيانات ؛ على سبيل المثال ، في Netflix ، لدينا دور مدير منتج الخوارزميات ، “أشارت كريستين دويغ ، مديرة الابتكار للتجارب الشخصية في Netflix. هناك المزيد من التكامل مع فريق التصميم ، مع الفرق الإبداعية “.
هذا التوسع في تخصص علم البيانات يجادل لمجموعة متنوعة من الأشخاص الذين يساعدون في عبء عمل علم البيانات ، والذي بدوره يفضل لغة مثل Python التي يتم استخدامها على نطاق أوسع.
ومن ثم ، هناك سؤال حقيقي للغاية حول ما إذا كان الأمر يستحق الاستثمار في R لحل مجموعة ضيقة نسبيًا من حالات الاستخدام مقابل Python ، والتي تتيح للمؤسسة تلبية مجموعة واسعة من حالات الاستخدام. قد تكون الإجابة نعم ، لكن عليك أن تفكر مليًا.
أو ربما تحتاج فقط إلى الانتظار. بعد كل شيء ، تعمل كل من مجتمعات R و Python بنشاط على تحسين قدراتها النسبية ، وإضافة حزم ومكتبات لتعميق وتوسيع فائدتها. ومع ذلك ، في هذا المجال ، تذهب الميزة إلى Python ، بسبب الحجم النسبي لمجتمعها ، ولكن أيضًا بسبب نسب كود الغراء.
وفقًا لـ Wang ، من المحتمل جدًا أنه بدلاً من استبدال R لبعض حالات الاستخدام ، “ربما يقوم شخص ما ببناء غلاف Python لطيف لفضح طبقة رقيقة لفضح بعض قدرات R.” بعبارة أخرى ، ليس من الصعب تخيل بايثون تحتضن تلك العناصر الأصلية للغة R ، لذلك لا يتعين على المطورين وعلماء البيانات الاختيار.
يخدم كل من R و Python جمهورهما بشكل جيد. نعم ، مجتمع Python أكبر بكثير ومن المرجح أن يسحب حزم R إلى نظام Python البيئي أكثر من العكس ، ولكن قد يكون الأمر الذي ستستخدمه في النهاية مسألة وليس أو.
شركة الافنان لتكنلوجيا المعلومات تقدم لكم خدمات البرمجة باللغات العالمية التي تطلبونها وتوفر لكم كادر محترف من المبرمجين في المجال
المصدر : R vs Python: What are the main differences?
التنبيه: مزود خدمات البيانات الكبيرة السحابية2022