BLOGS

แชร์ประสบการณ์ Professional Machine Learning Engineer และแนวทางการสอบฉบับอัปเดตปี 2024

Thakorn.T • 05/12/2023
Google Cloud Solutions Specialist

เมื่อพูดถึงการรับรองทักษะวิชาชีพด้าน IT แล้วก็หนีไปพ้นเรื่องของการมี Certificate ใช่ไหม!! ไม่ว่าจะเป็นด้าน Infrastructure, Architect, Networking รวมถึงงานด้าน Data Engineering และ Data Scientist ในหลากหลาย Industry ด้วย ซึ่งแต่ละผู้ให้บริการก็ออก Certificate ให้กับผู้เชี่ยวชาญที่มีทักษะความรู้ใน Software หรือบริการของตัวเอง โดยในบทความนี้จะมาชวนคุยเกี่ยวกับ Certificate ตัวนึงที่รับรองทักษะสำคัญในการเป็น Machine Learning Engineer กับ Google Cloud

รู้จักกับ Google Cloud Certification กันก่อน

Google Cloud Certification คือการรับรองในความรู้ ความสามารถ และความเชี่ยวชาญในการใช้เทคโนโลยี Google Cloud กับธุรกิจต่าง ๆ ซึ่ง Gartner คาดการณ์ว่า 85% ของธุรกิจต่าง ๆ จะอยู่ในรูปแบบ Cloud-native ในปี 2025 ซึ่งเรียกว่า Cloud มีความสำคัญไม่น้อย และการรับรองจาก Google ก็เป็นหนึ่งในข้อพิสูจน์ว่าบุคลากรนั้น ๆ มีความสามารถที่แท้จริงที่จะนำองค์กรสู่ความสำเร็จ

Google Cloud มี Certification ที่หลากหลาย Domain เช่น Network Engineer, Security Engineer, Database Engineer และ Data Engineer เป็นต้น โดยการรับรองแบ่งเป็น 3 ระดับดังนี้

  1. Foundational Certification เป็นระดับพื้นฐานที่เข้าใจแนวความคิดของ Cloud รวมถึง Products และบริการต่าง ๆ บน Google Cloud โดยไม่จำเป็นต้องมี Technical skill เหมาะกับทีม Sales, Planning และ Product Manager ที่ต้องทำงานควบคู่กับทีม Engineers ที่มากความสามารถในสาขาต่าง ๆ ซึ่งใบรับรองในระดับนี้คือ Cloud Digital Leader
  2. Associate Certification เป็นกลุ่มที่มีประสบการณ์และสามารถใช้ Google Cloud ได้อย่างคล่องแคล่ว มีความรู้ในภาพรวม เช่น การ Maintain หรือ Deploy งานต่าง ๆ บน Cloud ซึ่งใบรับรองในระดับนี้คือ Associate Cloud Engineer
  3. Professional Certification เป็นระดับสูงสุดที่แตกออกตามสาขาที่มีความเชี่ยวชาญโดยตรง เช่น ด้าน DevOps ด้าน Machine Learning สามารถออกแบบและจัดการงานต่าง ๆ รวมถึงการนำ Best Practices มาใช้เพื่อให้การดำเนินงานด้วยเทคโนโลยี Google Cloud มีประสิทธิภาพสูงสุด

ทำอย่างไรถึงจะได้รับ Google Cloud Certification

ถ้าตอบแบบง่ายที่สุดก็คือสามารถสอบที่ศูนย์สอบที่รับรองในประเทศนั้น ๆ โดยลงทะเบียนผ่าน Portal ของ Webassessor ที่ลิงก์นี้ https://webassessor.com/googlecloud แต่ก่อนที่จะไปสอบต้องมีความรู้ ความสามารถ และความเข้าใจ Google Cloud product ในสาขาที่สนใจเสียก่อน ซึ่งสามารถเลือกดูข้อมูลว่าทาง Google Cloud จะวัดผลองค์ความรู้ใดบ้างตามสาขาในหน้า Google Cloud Certification

โดยจะมี Journey ในการเรียนรู้ทักษะบน Google Cloud ดังนี้

  1. Learn การลงคอร์สต่าง ๆ บน Coursera, Edx หรือที่แนะนำจะเป็นบน Cloud Skills Boost ที่มี Lab ให้เล่นจริง เป็น Environment บน Google Cloud จริง ๆ เพื่อเพิ่มความเข้าใจได้มากขึ้น และมี Learning path ในเทคโนโลยี Cloud ที่ครบถ้วน
  2. Practice เมื่อมีทักษะแล้ว ก็สามารถลองฝึกกับ Google Cloud Project ของตัวเอง หรือทำ Quiz บน Cloud Skills Boost ได้ และเมื่อผ่านก็จะมี Badges ต่าง ๆ ประดับ Profile
  3. Prepare เตรียมตัวสอบ สามารถลองดู Sample Questions หรือ Guide ต่าง ๆ บน Google Cloud Certification เพื่อทบทวน จากนั้นก็เลือกศูนย์สอบกันที่ Webassessor ได้เลย
  4. Certify สอบจริง สามารถสอบได้ทั้ง Online และที่ศูนย์สอบ แต่การสอบที่ศูนย์สอบจะดีกว่าเพราะอยู่ในสภาพแวดล้อมที่ค่อนข้างมีสมาธิ หลังสอบเสร็จก็จะทราบผลเลยทันที
  5. Ongoing Learning ถ้าสอบผ่านแล้วก็อย่าลืมลับคมอยู่เสมอ! วางแผนสอบ Certification ที่เกี่ยวข้องต่อไป

ซึ่ง Journey เหล่านี้ใช้เรียนรู้ได้กับทุก Certificate แต่จะขอมาลงรายละเอียดกับ Professional Machine Learning ให้ผู้ที่สนใจ Domain นี้เห็นภาพกันมากขึ้น

Professional Machine Learning Engineer คืออะไร ?

Certificate นี้จะเป็นด้าน ML Engineer โดยตรงที่ทำ AI / Machine Learning บน Google Cloud หลายคนอาจจะเคยสอบ Professional Data Engineer กันมาแล้ว เนื้อหาจะส่วนการทำ AI อยู่บ้าง ด้วย BigQuery ML และ AutoML แต่หลัก ๆ จะเป็นส่วนการทำ Data Management ในการ Ingest Data Orchestration และพ่วงเรื่อง Model มากกว่า แต่ Professional Machine Learning Engineer จะเน้นหนักเรื่อง MLOps การวัดผล Model และการ Optimized ให้เหมาะสมในแต่ละธุรกิจหรือ Use-cases

สำหรับใครที่จะสอบ Certificate นี้ต้องมีความรู้พื้นฐานด้าน Data Science อยู่แล้ว ในการทำ Machine Learning Deep Learning และประกอบกับ AI Infrastructure ด้วย เช่น การตั้งเครื่อง VM ที่มี GPU, TPU, การ Served Model ให้ทีมอื่น ๆ ไปใช้งานต่อ และการทำ Workflow Orchestration เพื่อเป็น Concept ในการทำ MLOps นั่นเอง ซึ่งคิดว่าควรมีพื้นฐานของ Professional Data Engineer ก่อนที่จะทำการสอบ Professional Machine Learning Engineer ให้ง่ายขึ้น

เพราะ ML Engineering จะมีการผสมผสานระหว่าง Data Engineering และ App Engineering กล่าวคือขาข้างหนึ่งก็ต้องมีความเข้าใจในด้าน Data Foundation และขาอีกข้างก็ต้องมีความเข้าใจใน Application ว่าจะไปใช้งานต่อให้เกิดประโยชน์กับธุรกิจอย่างไรและ Integrate เข้าด้วยกันได้อย่างไร

เทคนิคการสอบ Machine Learning Engineer

ในหัวข้อนี้จะเป็นไกด์แนะนำสำหรับใช้ในการสอบ ขออนุญาตเริ่มที่รายละเอียดของการสอบก่อนว่าวัดผลเนื้อหาอะไรแล้วค่อยย้อนกลับไปเรื่องการเรียนรู้หรือทบทวนกัน

หากเข้าไปที่เว็บ https://cloud.google.com/learn/certification/machine-learning-engineer จะมีรายละเอียดการสอบ เช่น ระยะเวลาการสอบ 2 ชั่วโมง ค่าสอบ $200 ชุดข้อสอบเป็นภาษาอังกฤษทั้งหมด และจะมีข้อสอบประมาณ 50-60 ข้อ เป็นทั้งแบบตัวเลือกเดียวหรือตอบได้หลายตัวเลือก ซึ่งชุดข้อสอบจะเป็นการสุ่ม บางคนไปสอบวันเดียวกัน ก็อาจจะได้ชุดข้อสอบที่ไม่เหมือนกัน

จากประสบการณ์ซึ่งได้มีการลงทะเบียนสอบในช่วงปลายเดือนตุลาคม 2023 เป็นช่วงเวลาที่ Google อัปเดท Machine Learning Exam กับ Data Engineer Exam พอดี ดังนั้นข้อสอบจะทันสมัยมากขึ้น (หรืออาจจะยากขึ้นตามสไตล์ Google ก็ได้ 😛) โดยจะเรียกชุดข้อสอบใหม่ที่นำมาทดสอบว่า Beta Certification Exams คือชุดข้อสอบจริงที่เตรียมปล่อยก่อนจะไป GA (General Available) 

คนที่ลง Beta Exams จะเป็นกลุ่มคนแรกที่ได้ทำข้อสอบใหม่ก่อนใครในโลก และมีค่าสอบที่ถูกลง 40% จาก $200 ก็เหลือ $120 แต่ต้องทำข้อสอบครบทุกข้อซึ่งมีประมาณ 120 ข้อ และใช้เวลานั่งในห้องสอบถึง 4 ชั่วโมง ส่วนคะแนนการสอบว่าผ่านหรือไม่ผ่านนั้น จะไม่ทราบผลทันทีต้องใช้เวลาอีก 1 เดือนโดยประมาณถึงจะทราบผล เรียกว่าสอบไปครึ่งวันแล้วต้องรอลุ้นผลกันก่อน ซึ่ง Google ก็จะนำไปประมวลผลอีกทีเพื่อมาจัดเป็นชุดข้อสอบที่เป็นเวอร์ชัน GA ให้ได้สอบกัน

การลงทะเบียนสอบ

เลื่อนมาล่างสุดจะพบ Google Cloud Certified – Professional Machine Learning Engineer (English) ในที่นี้ได้เลือกแบบ Onsite Proctored โดยกด Buy Now ได้เลย (ถ้าใครเคยสอบ Google Cloud มาแล้วไม่ผ่าน จะมีระยะเวลารอคอย 14 วันเป็นต้นไป ถึงจะขึ้นปุ่ม Buy Now อีกที)

และเลือกศูนย์สอบที่สะดวก เลือกวัน-เวลาสอบ และสุดท้ายคือชำระเงินตามราคาสุทธิ

หลังจากชำระเงินแล้วจะมี Email confirm การสมัครก็สามารถพิมพ์เมลนั้นไปที่ศูนย์สอบในวันเวลาดังกล่าวได้เลย ในการสอบนั้นจะไม่อนุญาตให้นำเครื่องมือสื่อสารเข้าไป ไปแต่ตัวกับหัวใจล้วน ๆ ทำตัวสบาย ๆ ให้สมองปลอดโปร่งและทำข้อสอบ

ทริคในการไปสอบแบบสั้น ๆ

  • นอนให้เต็มที่ ออกจากบ้านเช้า ๆ ไปก่อนเวลาเผื่อรถติด ถ้าไปสายอาจหมดสิทธิ์ในการสอบ
  • โจทย์ข้อสอบอาจจะยาวมาก เหมือนอ่านเรียงความ จะมีเวลาในการตอบเฉลี่ยข้อละ 2 นาที ต้องรีบอ่าน รีบตอบ บางครั้งอาจจะอ่านจากท้ายโจทย์ก่อนว่าถามอะไร แล้วค่อยอ่านโจทย์แบบจับใจความ
  • การตัดตัวเลือกอาจจะยากหน่อย เพราะข้อสอบ Google อ่านแล้วส่วนใหญ่เหมือนถูกทุกข้อ ข้อนี้ก็ถูก ข้อนั้นก็ทำได้ ดังนั้นขอให้เลือกตอบข้อที่ถูกที่สุด
  • ข้อไหนไม่มั่นใจอย่าเสียเวลา กด Mark as Review ไว้ แล้วค่อยกลับมาดูทีหลังก่อนส่งข้อสอบก็ได้ แต่จริง ๆ เวลามีค่อนข้างจำกัด ดังนั้นอาจพึ่งศักดิ์สิทธิ์ที่นับถือ และจิ้มไปก่อนในข้อที่มีแนวโน้มจะถูกเผื่อกลับมารีวิวไม่ทัน

เนื้อหาในการสอบ

เมื่อรู้แล้วว่าจะสมัครสอบยังไง ทีนี้มารีวิวเนื้อหาที่หน้า Machine Learning Engineer Certification กัน โดยให้เลื่อนมาที่ Step 2 จะมี See current exam guide อยู่ก็สามารถกดที่ลิงก์ดังกล่าวได้เลย

ในไกด์จะบอกภาพรวมว่าต้องมีความรู้ด้านใดบ้าง ซึ่งเป็นเนื้อหางานของ Machine Learning Engineer

ให้เลื่อนมาดูรายละเอียดแต่ละ Section จะมีทั้งหมด 6 Sections ซึ่งสรุปได้ดังนี้

Section 1: Architecting Low-code ML Solutions

การประยุกต์การทำ ML ในแบบฉบับ Low-code เนื่องจากว่าบางโมเดลไม่จำเป็นต้องลง Effort ถึงขั้นเริ่มด้วย Code: Python หรือ Import Tensorflow มาใช้ จะเน้นการใช้ Products ที่ Low-code ก็สามารถได้ผลลัพธ์เหมือนกัน เช่น BigQuery ML ดังนั้นควรสร้าง Model ต่าง ๆ จาก BigQuery ML เป็นการทำ Feature Engineering และ Prediction ด้วย BigQuery ML ได้

การรู้ว่า Use-cases ควรสร้าง Model หรือควรใช้ ML APIs เลยทำให้ไม่ต้อง Train Data เช่น Cloud Vision API, NLP API, Speech API, Document AI, Retail API เพื่อให้ทีม Application นำไปใช้ใน Production App ของตัวเองได้

สุดท้ายเป็นการใช้ AutoML ในการทำ Use-cases พวก Tabular, Image, Text และที่สำคัญควรทราบว่าจะ Deploy Model ที่ได้จาก AutoML เป็น Endpoints ได้อย่างไรด้วย

เทคนิคในหัวข้อนี้คือ โจทย์ที่ดูแล้วไม่จำเป็นต้อง Customized Model มาสามารถหยิบจับ Products ข้างต้นมาได้ และแนะนำให้เลือกบริการข้างต้นมาใช้ ทำให้ประหยัด Cost ทั้งเวลา และ Manday ซึ่งใน Section นี้ควรเก็บคะแนนให้ครบเพราะโจทย์มีความซับซ้อนน้อยที่สุด

Section 2: Collaborating Within and Across Teams to Manage Data and Models

การทำงานร่วมกันภายในทีมเพื่อบริหารจัดการ Model กล่าวคือเมื่อเป็น ML Engineer จะทำงานกันเป็นทีมอาจจะร่วมกับทีมอื่น และจะมีพูดถึง การ Explore และ Preprocessing Data ด้วย BigQuery, Apache Spark, PySpark, Hadoop ที่มี Concept Lake เข้ามา และอาจมี SparkML มาเกี่ยวข้อง แต่ข้อที่เกี่ยวกับ Spark อาจจะน้อยเมื่อเทียบกับการ Preprocessing ด้วย TensorFlow Extended (TFX) และ BigQuery

การบริหารจัดการ Dataset ให้ทีมอื่นพร้อมใช้ เช่น การใช้ Vertex AI Feature Store และการควบคุม Policy เช่น PII หรือ PHI Data

การทำ Model Prototype บน Jupyter Notebook ด้วยบริการบน Vertex AI Workbench อาจมีลง Code TensorFlow, PyTorch, Scikit-learn และ Spark หลังจากนั้นก็ Tracking Model ด้วย Vertex AI Experiment, Vertex AI Pipelines และ Kubeflow ซึ่งตรงนี้อาจมีพ่วงเรื่องการ Validate Model ด้วยว่าเอา Model ไหนดี หรือเอาอันไหนเตรียมเป็น Final Model กล่าวคือเป็นเรื่อง Model ล้วน ๆ

Section 3: Scaling Prototypes into ML Models

หลังจาก Model Prototypes มานั้น ก็มาดูว่า Build Model บน Architecture แบบไหนดี Framework ไหนดี แล้วก็ Training กับข้อมูลจริงที่ใหญ่ ๆ ด้วย Vertex AI Custom Training หรือ Kubeflow ใช้เครื่องแบบไหน Train ดี แนบ GPU ไปด้วยดีไหม ถ้า Fail จะ Troubleshoot ยังไง โจทย์อาจจะมีตัวอย่าง Error มาให้แก้ ที่สำคัญอยากให้อ่านเรื่อง Distributed Training อาจจะมีออกข้อสอบแน่นอนอย่างน้อย 1-2 ข้อ ในเรื่อง Reduction Server

Section 4: Serving and Scaling Models

เมื่อได้ Final Model มา หลังจากการ Training ที่เสร็จสมบูรณ์ ก็ต้องคำนึงถึงการ Serving Model ให้ทีมต่าง ๆ ได้ใช้ จะ Served แบบไหนดี เป็น Batch หรือ Online Prediction ในรูปแบบ APIs ซึ่งโจทย์อาจมีการใช้ BigQuery ML แล้วนำ Model ไปเก็บบน Vertex AI Registry แล้วค่อย Deploy เป็น Endpoints ก็ได้ หรือการ Prediction ต้องมีการใช้ Hardware พิเศษไหม เช่น เพิ่ม GPU / TPU เข้าไป

บาง Model อาจไม่ต้อง Deploy เป็น Endpoint อาจ Export ออกมา และ Deploy รูปแบบ Edge เช่น เป็น Container ซึ่งฟังดูอาจจะต้องมีความรู้ด้าน DevOps CI/CD หน่อย ๆ แต่ในเนื้องาน Machine Learning ก็จะเรียกเป็นลักษณะ MLOps

และปิดท้ายด้วยการ Tuning ML Model ในการ Train หรือ Served Model ใน Production ให้มี Performance ที่เหมาะสมในเรื่อง Latency, Memory และ Throughput ต่าง ๆ

โจทย์หัวข้อนี้อาจจะต้องดู Keyword ว่าข้อสอบนั้นอยากให้ Minimized อะไร เช่น เวลา หรือ ค่าใช้จ่าย ต้องยึด Objective ในการ Optimized สิ่งเหล่านั้นเป็นหลัก

Section 5: Automating and Orchestrating ML Pipelines

กระบวนการข้างต้นอาจยังไม่ Auto ทั้งหมด โดย Machine Learning Engineer ควรออกแบบให้มัน Auto ฉบับ MLOps ด้วยการจัดการ ML Pipeline ตั้งแต่การดูด Data มา Feature Engineering และมา Train ออกแบบ Model Version ใหม่ที่ Endpoint นั้น ๆ ดังนั้นต้องรู้จักการมีตัว Trigger ไปยัง Cloud Build, Cloud Run ช่วย Provisioning ต่าง ๆ หรือใช้ Kubeflow, Vertex AI pipelines หรือ Composer ใน Orchestration ต่าง ๆ เช่น จะ Retrain Model ต้องเป็น Pipeline ยังไง รวมถึงการดู Metadata ของ Model Artifacts ดูที่ Vertex AI Experiments หรือ Vertex ML Metadata ขึ้นอยู่กับที่โจทย์ถาม

Section 6: Monitoring ML Solutions

Section สุดท้ายคือการ Monitoring Model ว่าถึงจุดที่ต้อง Retrain หรือยัง เพราะ Bug ใน Software Dev ทราบเพราะมี Error แต่ในการทำ ML อาจจะไม่มี Error ก็ต้องอาศัยการ Monitoring ว่า Training Data แต่ละชุดที่มาใหม่ Skew ไหม Feature Attribution Drift หรือเปล่า ตรงนี้ออกแน่นอน!

โจทย์อาจจะมีถามความถี่ในการ Retrain ด้วย ว่าเป็น Schedule ไหม หรือควรได้รับ Trigger แบบไหนถึงจะ Retrain อาจจะต้องอธิบาย Model ได้จนถึง Model Risk เช่น ชุดข้อมูลมี Bias ก็อาจจะต้องทำความเข้าใจหรือใช้พวก XAI ในการทำ Model Explain

สรุปทั้ง 6 Sections

ทั้งหมด 6 หัวข้อเมื่อเชื่อมโยงกันก็จะรวมเป็นเรื่อง MLOps ซึ่งถ้าเคยใช้ Tensorflow และเข้าใจ AI Architecture บน Vertex AI ก็สามารถทำข้อสอบได้เกินครึ่งนึง ทั้งนี้ Google แนะนำว่าควรมีประสบการณ์ด้าน AI อย่างน้อย 3 ปี เคยออกแบบ และจัดการ Solutions เหล่านี้บน Google Cloud อย่างน้อย 1 ปี ก็สามารถทบทวนเนื้อหาแล้วไปสอบได้เลย

แต่ถ้ายังไม่เคยมีประสบการณ์ครบตามไกด์แนะนำให้ลงเรียนใน Cloud Skills Boots หัวข้อ Machine Learning เป็นทั้งเริ่มต้นและทบทวนไปในตัวได้ดีเยี่ยม https://www.cloudskillsboost.google/paths/17 

หรือดู Google Cloud ML and AI Learning Path ผ่านวิดีโอนี้ก็ได้เช่นกัน

ทำข้อสอบซ้อมมือ

หลังจากที่ความรู้แน่นแล้ว ลองเลื่อนมาข้างล่างทำแนวข้อสอบใน Step 3 กัน โดยสามารถคลิกที่ Review sample questions ได้เลย

ซึ่งจะอยู่ในรูปแบบ Google Forms ซึ่งทำเสร็จจะมีเฉลยให้ลองทบทวนได้

หลังจากสอบ Professional Exams

จะทราบผลทันทีหลังจากสอบเสร็จ จากนั้น 1 อาทิตย์จะมีผลสอบอย่างเป็นทางการมาให้ ซึ่ง Certificate จะถูก Verify ในระบบ Blockchain ของ Accredible นั่นเอง

ในอีเมลจะมีไกด์สำหรับนำ Certificate ที่ได้ไปแปะโปรไฟล์ Linkedin หรือลงทะเบียนใน Google Cloud Certified Directory ที่สามารถ Explore Certificate ต่าง ๆ ของเพื่อน ๆ ได้

และจะมีอีเมลอีกฉบับที่มอบ Perk/Swags หรือของขวัญต้อนรับครอบครัว Google Cloud อาจจะเป็นกระเป๋า เสื้อฮู้ด หรือแก้วน้ำ ซึ่งของขวัญก็จะวนเวียนกันไป

Conclusion

พวกเราหวังว่าทุกคนจะมีความเข้าใจใน Professional Machine Learning Engineer มากขึ้นและสามารถนำความรู้ความสามารถไปพัฒนางานด้าน Data Analytics & AI และทีม Google Cloud by Tangerine ขอเป็นอีกหนึ่งพลังที่ช่วยขับเคลื่อนธุรกิจองค์กรสู่ความสำเร็จ

หากมีคำถามใด ๆ สามารถติดต่อทีมงานได้ทันทีที่ https://www.tangerine.co.th/contact-us/
พวกเรามีผู้เชี่ยวชาญที่ได้รับการรับรองในทุก ๆ สาขาพร้อมให้คำปรึกษา

ขอให้ทุกคนโชคดีในการสอบ🎉

สอบถามข้อมูลเพิ่มเติม
Contact Form_TH Sources