เขียน: เชอร์รี่

ทุกวันนี้มีคนจำนวนมากใฝ่ฝันอยากจะทำอาชีพ Data Scientist แต่หลายคนไม่รู้ว่าควรจะเริ่มจากจุดไหน และทำอย่างไรจึงจะกลายมาเป็น Data Scientist ที่ได้รับการยอมรับได้ เชอร์รี่ต้องขอออกตัวก่อนว่า เชอร์รี่เองไม่ใช่คนเก่งอะไรมาก และก็ยังไม่ได้เป็น Data Scientist ที่เก่งสุดๆ ขนาดนั้น ที่สำคัญเชอร์รี่ไม่ได้มีพื้นฐานมาจากสายวิศวะโดยตรง อย่าง Data Scientist หลายๆ คน แต่เชอร์รี่ก็พัฒนาตัวเองจนได้รับโอกาสให้เป็น Junior Data Scientist ที่เซอร์ทิส วันนี้เชอร์รี่จึงอยากจะมาแชร์มุมมองการเข้าสู่วงการ Data Scientist ให้กับคนอีกหลายๆ คนที่กำลังอยากจะก้าวมาสู่วงการนี้ เผื่อว่าจะช่วยให้มีกำลังใจหรือเห็นช่องทางกันได้มากขึ้น

เริ่มจากตอนสมัยที่เชอร์รี่ยังเรียนอยู่ช่วง ป.ตรี เชอร์รี่เรียนสาขาสถิติคณิตศาสตร์ คณะพาณิชยศาสตร์และการบัญชี จุฬาลงกรณ์มหาวิทยาลัย ซึ่งทำให้เชอร์รี่ต้องเรียนวิชาที่เกี่ยวกับด้านธุรกิจ การประยุกต์ใช้ธุรกิจบางอย่าง รวมทั้ง database ประกันภัย เศรษฐศาสตร์ เป็นต้น ต่อมาในปี 2559 เป็นช่วงที่สายงานด้าน data กำลังมาแรงมาก โดยเฉพาะงานของ Data scientist ที่บริษัทใหญ่ๆ ในเมืองไทยกำลังต้องการบุคลากรจำนวนมาก แต่คนที่จะสมัครตำแหน่งนี้ได้ก็ต้องมีประสบการณ์มาก่อนและส่วนใหญ่ก็ดูว่าต้องเป็นคนที่จบมาทางไอทีเท่านั้น เชอร์รี่เลยคิดๆ ดูว่าจะทำยังไงเราถึงจะก้าวเข้าสู่วงการ Data Scientist ได้ เชอร์รี่ก็พบว่าถ้าเราเริ่มจากงานที่เป็นการวิเคราะห์ข้อมูลที่ได้เป็น Consulting จะยิ่งน่าสนใจ เพราะเราจะได้เรียนรู้งานจากหลากหลายธุรกิจ ซึ่งการเข้าใจธุรกิจก็ถือเป็นองค์ประกอบที่สำคัญของการเป็น Data Scientist ที่ดี เพราะเราจะได้นำความรู้ด้าน Data มาประยุกต์ใช้กับธุรกิจได้ สุดท้ายเส้นทางการเป็น Data Scientist ของเชอร์รี่จึงเริ่มจากการเป็น Data analyst ที่ Sertis แล้วจึงค่อยๆ พัฒนาตัวเองเพื่อก้าวเข้าสู่การเป็น Junior Data Scientist

คนที่เป็น Data analyst ที่ Sertis นั้น มีคุณสมบัติที่สำคัญคือ ความสามารถในการเข้าใจ ทั้งในแง่ธุรกิจของลูกค้า สิ่งที่ลูกค้าต้องการ (Requirement gathering) รวมถึงเข้าใจข้อมูลของลูกค้าด้วย Data analyst ต้องมีความสามารถในการออกแบบ report ให้ลูกค้าเข้าใจได้ง่าย (Report design) เตรียมข้อมูลที่ได้รับมาเพื่อวิเคราะห์ให้พร้อม สำหรับการทำ report (Data cleansing) และทำสรุปผลงานเพื่อส่งรายงานให้ลูกค้า ที่สำคัญในการเป็น Data analyst ต้องคิดวิธีที่จะช่วยแก้ปัญหาที่สร้างมูลค่าเพิ่มให้กับลูกค้า มากกว่าที่ลูกค้าต้องการได้ เพราะ Data analyst คือ Consultant ไม่ใช่แค่คนทำ report

หลังจากมีประสบการณ์จากการทำ Data analyst มาในระยะหนึ่ง เชอร์รี่จึงอยากแนะนำคนที่สนใจอยากจะเข้ามาสู่วงการ Data นี้ว่า ควรจะฝึกดูลักษณะข้อมูลแบบต่างๆ ฝึกฝนการใช้งาน SQL เนื่องจากเป็นภาษาที่ใช้ในการจัดการข้อมูล ฝึกการทำ Visualization ให้คนทั่วไปเข้าใจได้ง่าย นอกจากนี้ สำหรับเด็กจบใหม่ที่สนใจเข้ามาสู่วงการ Data analyst ต้องเข้าใจก่อนว่าบริษัทที่จะไปสมัครงานนั้น มีลักษณะงานเป็นแบบไหน ควรมีพื้นฐานความรู้บางอย่างที่ต้องเรียนรู้ก่อนไปสมัคร อาทิ ควรมีความรู้ด้าน Database มาบ้าง หรือถ้าจบไม่ตรงสายอาจจะต้องหาความรู้ด้าน ธุรกิจ การตลาด หรือลงคอร์สออนไลน์จำพวก Data Analyst ไว้เพื่อที่จะแข่งขันกับคนที่จบมาตรงสายมากกว่าเราได้

ต่อมาหลังจากที่พัฒนาทักษะด้าน Data Analyst มามากพอสมควร ประกอบกับความขวนขวายของเชอร์รี่ที่พยายามเรียนคอร์สอื่นๆ ที่เกี่ยวกับ Data Scientist เพิ่มเติม (ซึ่งเชอร์รี่ได้รีวิวคอร์สต่างๆ มาให้ด้านล่าง) เชอร์รี่จึงได้รับโอกาสให้ย้ายไปทำตำแหน่ง Junior data scientist สิ่งแรกที่รับรู้เมื่อเข้ามาทำงานในตำแหน่งนี้คือ OMG คนอื่นพูดเรื่องอะไรกันอยู่ ทำให้เรารู้ทันทีว่ายังมีอีกหลายสิ่งหลายอย่างมากที่เชอร์รี่ต้องเรียนรู้และพัฒนาต่ออย่างรวดเร็ว ยิ่งทุกวันนี้เทคโนโลยีก้าวกระโดดไปไกลมาก อย่างงานทางด้าน Machine Learning หรือ AI (Artificial Intelligence) เช่น AlphaGo, Self-Driving Car, Amazon Go store เป็นต้น เห็นได้ชัดว่าต่างประเทศได้พัฒนาความรู้ความสามารถไปไกลมากแล้ว นอกจากนี้ยังมีคนคิดค้น Model ใหม่ๆ ขึ้นมาทุกวัน เพื่อนำมาปรับใช้ในการช่วยแก้ไขปัญหาต่างๆ ทางธุรกิจ

เชอร์รี่จึงกลับมานั่งคิดทบทวนกับตัวเองว่า แล้วจะทำอย่างไรให้ตัวเองติดตามข้อมูล ข่าวสาร พัฒนาตัวเองให้ก้าวทันโลกที่แสนจะเร็วนี้ได้ เพราะเราหรือคนอื่นๆ เองก็คงไม่มีใครสามารถทำได้ทุกอย่างพร้อมกันทั้งหมดในเวลาที่มีอยู่จำกัดนี้ ดังนั้นเชอร์รี่จึงต้องเลือกโฟกัสในจุดที่เราเองสนใจมากสุดก่อน หรือโฟกัสในจุดที่เราควรจะพัฒนาเป็นอันดับแรก เช่น Coding, Model, Data exploration เป็นต้น ซึ่งก็เป็นสิ่งหนึ่งที่เชอร์รี่อยากจะแนะนำคนที่กำลังอยากจะมาเป็น Data Scientist ด้วยเช่นกัน

จริงๆ แล้วลักษณะการทำงานของ Data Scientist จะคล้ายงาน research and development (R&D) คือ ถ้าเราได้รับปัญหาจากลูกค้ามาเราจะสามารถช่วยลูกค้าอย่างไรได้บ้าง โดยหลักๆ จะเป็นการหาว่าข้อมูลที่ลูกค้ามีจะนำไปใช้กับโมเดลที่สร้างคุณค่าให้กับลูกค้าได้อย่างไร (Bottom up approach เริ่มจากข้อมูลไปหาโมเดล) หรือดูว่าโจทย์ที่ลูกค้าให้มีโมเดลไหนที่จะช่วยได้ รวมถึงการปรับปรุงโมเดลของลูกค้าให้ดีขึ้นอย่างไร และต้องศึกษาว่าในต่างประเทศมีลักษณะข้อมูลหรือปัญหาทางธุรกิจคล้ายๆ กันหรือไม่ เขาใช้โมเดลอะไรมีการปรับใช้อย่างไร นำมาประยุกต์เข้ากับความรู้ที่เรามีอยู่ เพื่อให้ได้คำตอบที่ดีที่สุดสำหรับลูกค้า

จะเห็นได้ว่าลักษณะการทำงานบางส่วนจะคล้ายๆ กับ Data analyst แต่ Data Scientist จะเป็นการโฟกัสไปในทางการสร้างโมเดล เวลาส่วนใหญ่ในการทำงานของ Data Scientist ก็จะหมดไปกับส่วนการทำ data cleaning, data exploration, feature engineering มากกว่าการสร้างโมเดล แต่ปัจจุบันนี้ก็มีบริษัทหลายแห่งพยายามพัฒนาซอฟท์แวร์ที่ช่วยให้ Data Scientist ประหยัดเวลาในการจัดการข้อมูลกันมากขึ้น อย่างของเซอร์ทิสเองเราก็ใช้ Datana ซึ่งเป็น Product ที่เรามีทีมงานของเราพัฒนาร่วมกันกับทีม Data Science เพื่อให้เราสามารถ Customised งานให้เหมาะสมกับลูกค้าแต่ละที่ได้อย่างดีที่สุด

ก่อนจะจบบทความนี้เชอร์รี่ได้รวบรวมเว็บไซต์ต่างๆ ให้กับคนที่สนใจอยากพัฒนาตัวเองเป็น Data Science ได้ฝึกฝน พัฒนาตนเอง พร้อมรีวิวเอาไว้ให้คร่าวๆ เพื่อจะได้ลองดูว่าน่าจะเริ่มต้นจากที่ไหน

————————————————————————————————

รีวิว Course ที่เคยเรียน

  1. Udacity
  • Intro to Data Science
  • Intro to Machine Learning

สองคอร์สนี้ เหมาะสำหรับคนที่ยังไม่เคยเรียนเกี่ยวกับ Machine Learning มาก่อน ซึ่งลักษณะของเนื้อหาจะเป็นการบอกรายละเอียดพื้นฐาน และในแต่ละวีดีโอจะมีควิซให้เพื่อทดสอบการเข้าใจของนักเรียนไปด้วย ถือว่าเป็นคอร์สที่เหมาะสำหรับคนที่ไม่มีพื้นฐานอย่างแท้จริง ไม่เหมาะสำหรับคนที่มีพื้นฐานมาบ้างแล้ว ด้าน Programming ใช้ Python ซึ่งใครไม่รู้จักเลยอาจจะลำบากหน่อยต้องเป็นคนที่เคยเขียนมาก่อนบ้าง

  • Deep Learning nanodegree Foundation

เป็นคอร์สสอน Deep Learning ที่โด่งดังมาก จะเน้นการนำไปประยุกต์ใช้มากกว่าเนื้อหา ซึ่งแนะนำสำหรับคนที่เชียวชาญด้านการเขียน code เข้าใจ OOP มาบ้าง ซึ่งใช้ Python ด้านเนื้อหาจะมีหลากหลายคนสอนด้วยกัน เป็นการเชิญผู้เชี่ยวชาญเรื่องต่างๆมาสอน เนื้อหาในคอร์สนี้เป็นเรื่องที่เข้าใจยาก ต้องค้นคว้าจากข้างนอก ในบางเรื่องก็อาจจะไม่เข้าใจ แนะนำคอร์สนี้สำหรับคนที่ศึกษาด้าน Deep Learning มาระดับหนึ่ง และต้องใช้เวลาในการเรียนค่อนข้างมาก ควรมีเพื่อนลงเรียนพร้อมกันเพื่อช่วยกันเรียน เพราะว่าคอร์สนี้ราคาค่อนข้างแพง ไม่สามารถลงแบบ Audit ได้

  1. Coursera 
  • Machine Learning: Stanford university

เป็นคอร์สในตำนานของวงการที่ทุกคนต้องเรียน Andrew ng สอนเข้าใจง่าย ซึ่งเน้นการเข้าใจหลักการ ด้าน Programming ใช้ OCtave/MATLAB ในการทำการบ้าน ซึ่งโดยส่วนใหญ่เราจะใช้ R หรือ Python มากกว่าในการทำงาน ทำให้ไม่คุ้นเคย ดังนั้นคอร์สนี้ แนะนำสำหรับคนเริ่มต้น เพื่อที่จะเข้าใจ Machine Learnig ถือว่าเป็นพื้นฐานสำคัญ

  • Machine Learning Specialization: University of Washington

Program นี้มีทั้งหมด 4 คอร์สด้วยกัน สามารถเลือกเรียนได้ขึ้นอยุ๋กับว่าสนใจเรื่องไหน ในส่วนของเชอร์รี่เคยเรียน Clustering และ Regrssion ซึ่งถือว่าเป็นคอร์สที่ยาว ลักษณะคอร์สจะเน้นเนื้อหา ซึ่งถือว่าแน่นปึกแน่นอน เพราะเรื่องละคอร์ส ด้าน Programming ใช้ Python ซึ่งถ้าใครไม่อยากเรียนของ Andrew เพราะการบ้านไม่ใช่ Python สามารถลงคอร์สนี้ได้ แนะนำสำหรับคนที่มีความรู้พื้นฐานมาบ้าง

  1. Udemy 
  • Data Science and Machine Learning Bootcamp with R

เป็นคอร์สที่สอนพื้นฐานการเขียน Code โดยคอร์สนี้ใช้ R โดยเริ่มสอนตั้งแต่เริ่มแรกเลย และในแต่ละเรื่องจะมีการบ้านการเขียน Code ให้สามารถฝึกฝนได้ และในช่วงท้ายของคอร์สมีการประยุกต์ในกับ Model พื้นฐานของ Machine Learning แนะนำสำหรับคนที่จะเริ่มเข้าสู่วงการ แต่ยังเขียน Codeไม่ได้ ให้เริ่มจากคอร์สนี้ ได้สามารถซื้อคอร์สนี้ได้ในช่วงโปรโมชัน ราคาประมาณ 300 บาท

  1. HackerRank 
  • SQL,Python

เว็บไซต์ฝึกฝนการเขียน Code เริ่มแรกเชอร์รี่สมัครเพื่อฝึกฝนเขียน SQL เพิ่มเติ่ม ซึ่งจะเป็นการทำ Challenges ไปเรื่อยๆ เก็บคะแนน ซึ่งมีการจัดการแข่งขันตลอด สามารถเข้าร่วมการแข่งขันได้ จะมีการระบุระดับความยากง่ายไว้ด้วย

 

ท้ายนี้เชอร์รี่ก็อยากจะแนะนำสำหรับใครที่สนใจอยากก้าวเข้ามาสู่วงการ Data science แต่ไม่ได้มีพื้นฐานมาจากทางวิศวะหรือไอทีโดยตรงว่า ควรจะฝึกฝนตนเอง ทดสอบฝีมือให้คุ้นเคยกับ data พร้อมหาแนวทางการจัดการกับข้อมูล ซึ่งปัจจุบันก็ฝึกฝนตนเองและหาความรู้ได้จากเว็บไซต์ต่างๆ เป็นจำนวนมาก เชอร์รี่เชื่อว่าถ้าคุณมีความสนใจ ตั้งใจฝึกฝน คุณก็มีโอกาสที่จะก้าวเข้ามาเป็นส่วนหนึ่งของวงการนี้ได้จริงๆ อย่างที่เชอร์รี่ทำได้แล้วในขั้นต้น

 

Written by Sertis Team