من كام يوم نشرت البوست ده على Youtube Community
وبطبيعة الحال، فيه ناس سألوا عن إيه اللي بتكلم فيه ده؟ وفيه شكروا في المجال وفيه حذروا منه… وفيه قالوا إيه العلاقة بين اللي كاتبه ده وتعليم الذكاء الاصطناعي؟ زي الباشمهندس كده:
ولو السؤال مش واضح في السكرين شوت، هكتبهولك:
يقول الباشمهندس كما عرف نفسه: “سؤال اية علاقة AI Data Labelling & Annotation بال Data Entry ؟ وازاي مهمته هتبقي بتساعد في تدريب الذكاء الاصطناعي ؟ توضيح بس عشان الناس ال هتفكس وتعلق وتقول انت ايه علاقتك بالموضوع ؛ انا AI & Computer vision engineer.”
ولأني بحب الأسئلة دي جدًا، فهجاوب عليها في النشرة بشكل مفصل٫ يمكن تكون سبب في نفع الناس اللي عايزين يستفيدوا بجد.
وهنبدأ بالترتيب… وأنت هتربط كل حاجة ببعض لوحدك بشوية Common Sense.
يعني إيه Data Entry؟
ويكيبيديا بتقول “[مُدخِل البيانات] بالإنجليزية [Data entry] هو من يعمل على تسجيل البيانات الورقية أو الشفوية في أجهزة الحاسوب.”
وعشان نوضح أكتر، وظيفة الداتا انتري أو مدخل البيانات هي وظيفة مكتبية هدفها تحويل البيانات من هيئة (مكتوبة باليد أو في فيديو أو صوت) لـ (بيانات على الكمبيوتر)، على برامج خاصة بالشركة أو برامج عامة زي إكسيل وجوجل شيت.
زي إيه؟
تسجيل البضاعة الواردة والمخزون.
تسجيل الأسعار.
بيانات الموظفين في الشركة
المبيعات.
تفريغ الفيديوهات والتسجيلات الصوتية.
وغيرها حاجات كتير قوي.. والمهم أن دور مُدخل البيانات هو مراجعة وترتيب البيانات دي والتأكد من صحتها والعثور عليها عند الحاجة. ومش بس كده، لكن كمان التحديث وإنشاء نسخ احتياطية من البيانات وأرشفتها وتنظيمها.
ولازم يكون عنده شوية مهارات مهمة قوي:
بيكتب بسرعة على الكيبورد.
بيعرف يتعامل مع الكومبيوتر (مش أي معاملة، يعني لو واخد ICDL يبقى فُل، ولو ذاكر CS50 يبقى عظمة العظمة).
جميل؟ جميل، بس متجريش وتقفل.. كمل قراية عشان مصلحتك، إحنا لسه بنسخن!
يعني إيه Data labelling؟
الـData labelling هي تصنيف عام للبيانات الموجودة في الصورة أو النص أو الفيديو، أو خلينا نقول أن الـData Labelling، يعني عملية بيتم فيها تسمية العناصر الموجودة في الصورة أو النص أو الفيديو بطريقة دقيقة عشان نستخدم البيانات دي في تدريب نماذج الذكاء الاصطناعي والتعلم الآلي.
فمثلا:
ـ في الصور: صورة فيها كلب، هتكتب "كلب"، صورة فيها كلب وقطة وإنسان وعربية، هتكتب "كلب"، "قطة"، "إنسان"، "سيارة".
ـ في النصوص: نص معين، هتصنفه "سياسي"، "فني"، "رياضي"، تكنولوجي".
ـ في الفيديو: تقريبا نفس اللي عملناه في الصور، ولكن بالمشاهد أو الـFames لأن كل فريم أو مشهد ممكن الحاجات اللي فيهم تختلف.
يعني إيه Data Annotation؟
الـ Data Annotation هي عملية إضافة معلومات وصفية أو تسميات للبيانات، زي الصور أو النصوص أو الفيديو، والهدف هو "تدريب" النماذج الذكية (زي خوارزميات التعلم الآلي) على فهم البيانات دي بشكل أفضل.
إيه ده؟ فين الفرق؟ هتعرف لما تكمل قراية!
هقولك.. مثلا:
- في الصور: بتضاف المسميات عشان نحدد الحاجات الموجودة في الصورة زي "قطة"، "سيارة"، "رجل" "إمرأة"، لكن فيه تخصيصات اكتر من كده زي مثلا أنك تعلم على العناصر دي وتحط عليها مربعات، عشان تحدد مكانها في الصورة، أو تكتب ملاحظات فيها تفاصيل وبيانات أكتر عن كل عنصر، تحت "إمرأة" ممكن :إمرأة آسيوية في الأربعينات"... مثلا يعني. وده بيساعد النموذج على تعلم التعرف على العناصر دي في الصور أو الفيديوهات التانية.
ـ في النصوص: الكلمات أو الجمل بتتصنف لفئات معينة زي "إيجابي" أو "سلبي" أو "عدواني" أو "غاضب" أو "حزين" أو "منحاز" أو "محايد" أو "ناقد" وغيرها من التصنيفات، وده بيساعد النموذج أو الموديل على تحليل المشاعر.
ـ في الفيديو: زي ما قولت في الصور بالظبط، أنت بتعلم النموذج أو الموديل أنه يتعرف على العناصر والمشاهد والسلوكيات والأفعال الموجودة في الفيديو، وده بيحصل بالـ Frame برضه، لأن لو الكاميرا بتتحرك مثلا، فممكن تلاقي إشارة مرور ظهرت أو عجلة أو عربية بموديل معين وهكذا.
وواضح أن الهدف "تاني" هو توفير مجموعة بيانات غنية تساعد النماذج دي على التعلم بشكل دقيق، وبالتالي أداءها يتحسن وتقدر تصنف وتتنبأ وتتعرف على الـ Patterns بشكل صحيح.
وده الفرق بين الإتنين.
وإيه علاقة ده بالـData Entry؟ مش هتبطلوا هبد بقى؟
معلش يا جامد يا عميق يا معدي الناحية التانية… كمل قراية.
العلاقة مش مباشرة قوي طبعًا، لكن وظيفة الـData Entry اللي كتير من المهندسين والمبرمجين ومتخصصي الـAI بيبصولها بدونية وشايفينها شغلانة هايفة، عشان هما جامدين أخر حاجتين… كانت في يوم من الأيام شغلانة مطلوبة جدًا، وحتى لغاية دلوقتي فيه بعض الأماكن بتطلبها… لكن برضه ده مش موضوعنا.
موضوعنا أن الوظيفة دي بتدي اللي بيشتغل فيها صفات معينة:
1- السرعة.
2- Attention-to-detail
3- التعامل مع الكومبيوتر ومعرفتك بالمهارات الأساسية وبعض مدخلي البيانات بيتعدوا مرحلة الأساسيات.
4- في حالات التعامل مع برامج إدخال البيانات.
5- حصيلة لغوية قوية، أوقات بشكل عام وأوقات بشكل متخصص.
ودي مهارات مطلوبة جدا جدا في الوظيفتين، سواء الـData Annotation أو الـ Data Labelling.
إيه ده؟ يعني مش عايزين معرفة متخصصة بالـAI؟
الأفضل طبعا يكون عندك معرفة عامة سابقة، لكن مش شرط وبدليل أن وظايف كتير من المتاحة أونلاين واللي بالمناسبة 95% منها عن بعد، بيقول "يستحسن"... لكن مش شرط.
وفيه منهم بيطلب ناس معاهم مؤهل عالي في المطلق، وفيه عايز حد خريج حاجة تقنية، وفيه يقولك أنا عايز Linguistic… كله بيرجع للشركة وللمشروع وللنموذج اللي هتشتغل عليه.
هل فيه وظايف فعلا متاحة؟
أبحث على جوجل أو لينكدن أو إندييد وشوف بنفسك الوظايف وطلباتها ومرتباتها وطريقة الشغل، هتلاقي كتير جدًا.
فهكرر كلامي في البوست اللي فات تاني: "لو شغال Data Entry وبتواجه صعوبة في أنك تلاقي شغل بقالك كتير، ابحث عن
AI Data Labeling & Annotation.
مجال مش جديد لكن الطلب عليه بيزيد، لأن مهمتك هتبقى المساعدة في تدريب أنظمة الذكاء الاصطناعي، خصوصًا على الـ Visual Data زي الصور والفيديوهات.
هل مستمر على كده وهيفضل مطلوب؟ معرفش، لكن كل حاجة بتقول أنه مستمر باستمرار الـ AI.
ولو دمجت ده مع معرفتك بمجال زي الـ Content Design/ UX Writing... هتعدي."
وهزود عليه… لو عايز حاجة على جنب أو عايز تدخل العالم ده في العموم… جرب ومش هتخسر حاجة، المهم أنك تلتزم وأنت بتقدم بالشروط المطلوبة بالظبط وتعمل سي في كويس وCover-Letter قوي. وبالنسبة لشرط الشهادة الجامعية، ممكن يتغاضوا عنه لو عندك خبرة طويلة ومثبتة بمشاريع ثابتة.
طيب سؤال كمان، إيه العلاقة بين الكلام ده والـ Content Design/ UX Writing؟
وظيفة الـUX Writer هو خلق تجربة سهلة للمستخدم خلال تعامله مع التطبيق أو البرنامج أو الموقع أو حتى الجهاز، بأقل الكلمات، وده بيخلي عندهم حصيلة كلمات كبيرة جدًا، لذلك لو عندك ولو خبرة بسيطة في الـContent Design/ UX Writing فهتعمل شغل كويس، ده غير أنه مجال جامد جدا واتكلمت عنه قبل كده.
محتاج إيه عشان تبقى Data Annotator أو Data Labelling جامد وتلاقي شغل بسهولة؟
مهارات الكومبيوتر:
طبعًا ومنطقي لازم تكون بتعرف تتعامل مع الكومبيوتر كويس “جدًا”، وجدًا دي لو عايز تبقى متميز، زي أنك تذاكر CS50 مثلا.
المهارات اللغوية:
المهارات اللغوية مهمة طبعًا، لذلك هتلاقي 90% من الإعلانات بتقول أنهم عايزين مستوى اللغة متقدم أو Native. فلازم تكون لغتك قوية، سواء عربي أو إنجليزي.
الكتابة على الكيبورد “بسرعة”: أنت مش هينفع بأي شكل تبقى بتكتب ببطأ، لازم تتعلم تكتب بسرعة، عشان كم البيانات المطلوب منك يوميًا وفي كل مشروع كبير، ولو مبتكتبش بسرعة، يبقى مش هتسلم شغلك في وقته أو هتلاقيها خسرانة معاك لو بتشتغل بالساعة.
الاهتمام بالتفاصيل أو Attention to Detail:
لازم تبقى دقيق في ملاحظاتك وتعليقاتك وكمان مهتم بأنك تبص كويس على التفاصيل الموجودة في الفيديو أو الصورة أو النص.
قادر على إدارة وقتك ونفسك: خصوصًا لو هتشتغل مستقل أو فريلانسر يعني، لأنك لو مبتعرفش تدير نفسك ووقتك فطبعًا مش هتسلم حاجة في وقتها أو هتسلمها بأخطاء، والأخطاء “تقريبًا” كده مش مقبولة في المجال ده.
التركيز: لازم تستغل في مكان هادي ومن غير أي مشتتات خالص، عشان تركيزك مهم جدًا في اللي بتعمله وهيساعدك تقلل الأخطاء بشكل كبير قوي.
لا يا عم أكيد فيه مهارات تانية!
ماشي… بس دي مهارات هتخليك “متخصص” و”مميز”، يعني مش لازم تبدأ بيها، لكن لازم تحطها في الخطة، زي:
SQL.
لغات البرمجة: معرفتك بلغات زي Python أو R أو Java، هيساعدك جدا.
سؤال كمان، طبيعة الشغل إيه؟
طبيعة الشغل متقسمة ما بين شغل بدوام كامل أو غير كامل، وفريلانسر بدوام كامل أو غير كامل، وفيه أيام محددة في الأسبوع بس، يعني مش الأسبوع كامل.
أتمنى أكون غطيت كل حاجة محتاج تعرفها عن المجال ده، لأني فعلًا عايزك تستكشفه عشان عارف أن ليه مستقبل كويس.
ونصيحة “متسمعش للمحنكين” اللي كل هدفهم يبينولك أنهم فاهمين كل حاجة، حتى لو هيضروك برأيهم.
متنساش تشوف الحلقة… ولو عندك أي سؤال، اكتبه في تعليق هنا أو تعليق على الفيديو.
وطبعا متنساش تشترك في القناة والنشرة.