เจาะลึกเบื้องหลังวิธีการวิเคราะห์พระราชดำรัสของพระบาทสมเด็จพระเจ้าอยู่หัวรัชกาลที่ 9 ที่ทรงพระราชทานแก่ประชาชนเนื่องในวันคล้ายวันพระราชสมภพด้วยเทคนิคทาง Data Science

ด้วยความน้อมรำลึกถึงพระมหากรุณาธิคุณอันหาที่สุดมิได้ของพระองค์ เซอร์ทิสและไทยพับลิก้าได้นำข้อมูลพระราชดำรัสของพระบาทสมเด็จพระเจ้าอยู่หัวรัชกาลที่ 9 ที่ทรงพระราชทานแก่ประชาชน เนื่องในโอกาสวันคล้ายวันพระราชสมภพ 5 ธันวาคม ตั้งแต่ปี พ.ศ.2511 ถึงปี 2550 มาศึกษา ทบทวน วิเคราะห์เพื่อพิจารณาและน้อมนำพระราชดำรัสของพระองค์มาเป็นแนวทางในการดำเนินรอยตามเบื้องพระยุคลบาทตามแนวทางที่เราจะสามารถทำได้ต่อไป

Data science หรือวิทยาศาสตร์ทางข้อมูล คือ ศาสตร์ในการนำข้อมูลมาใช้ประโยชน์ในด้านต่างๆ ในชีวิตประจำวันหลายครั้งที่คนทั่วไปมักจะตั้งคำถามว่า Data science หรือวิทยาศาตร์ทางข้อมูลคืออะไร เกี่ยวกับอะไร Data Science มีประโยชน์หรือเอามาใช้ในชีวิตประจำวันอย่างไรได้บ้าง

ปัจจุบัน Data science มีบทบาทในชีวิตประจำวันของเราอย่างมากโดยที่เราอาจไม่รู้ตัว เช่น การแนะนำสินค้าหรือบริการได้ใกล้เคียงกับสิ่งที่เราสนใจหรือบางครั้งก็ตรงกับสิ่งที่เรากำลังสนใจอยู่จากเว็บไซต์ต่างๆ การแนะนำเพลงใน Playlist ว่าควรจะฟังเพลงอะไรต่อไปหรือเพลงไหนที่เราอาจจะอยากฟังจาก YouTube การเปิดใช้ Google Map แล้วรู้ได้ว่ารถติดมากน้อยที่เส้นทางใดแล้ว Google map จะแนะนำเส้นทางที่เหมาะสมให้กับเราได้ สิ่งเหล่านี้ล้วนเป็นเรื่องที่อยู่ในชีวิตประจำวันโดยพื้นฐานการทำงานมาจากการใช้วิทยาศาสตร์ข้อมูลมาวิเคราะห์แทบทั้งสิ้น

เซอร์ทิสได้นำความรู้ทาง Data Science มาวิเคราะห์ถึงหัวข้อที่พระองค์ทรงดำรัสถึงบ่อยครั้ง ซึ่งเทคนิคที่เราใช้ก็คือ การใช้ Text Analytics หรือการวิเคราะห์ข้อมูลในภาษาไทย โดย เซอร์ทิสจะนำเสนอข้อมูลในเชิงเทคนิคเพื่อให้ผู้อ่านที่สนใจด้าน Data Science หรือ วิทยาศาตร์ทางข้อมูล ได้มีโอกาสทำความเข้าใจในเบื้องต้นและนำไปใช้เป็นแนวทางเพื่อการวิเคราะห์ข้อมูลอื่นๆ ให้เป็นประโยชน์ต่อสังคมต่อไป

สำหรับเทคนิคที่ เซอร์ทิส ใช้ในการวิเคราะห์สามารถสรุปกระบวนการทั้งหมดเป็นลำดับขั้นได้ดังนี้

  1. การแบ่งคำหรือการตัดคำ (Word Segmentation) ในพระราชดำรัสด้วย Thai Natural Language Processing (NLP)
  2. การวิเคราะห์หัวข้อในพระราชดำรัสด้วย Topic Model
  3. การแสดงผลการวิเคราะห์ (Visualization) ด้วย Parallel Coordinates

King Speech By Sertis-02

เนื่องจากภาษาไทยนั้นเป็นภาษาที่ไม่มีช่องว่างระหว่างคำ จึงทำให้การแบ่งคำเพื่อการวิเคราะห์หาความหมายนั้นมีความซับซ้อนกว่าภาษาอื่นๆ ที่มีการแบ่งคำและเว้นวรรค อาทิ ภาษาอังกฤษ ดังนั้นเราจึงเลือกที่จะใช้วิธีการตัดคำ (Word Segmentation) ในพระราชดำรัสด้วย Thai Natural Language Processing  (NLP)

King Speech By Sertis-03

ซึ่ง เซอร์ทิส ได้ออกแบบการเรียนรู้จากข้อมูลด้วยเครื่องคอมพิวเตอร์ หรือ Machine Learning (ML) Model ซึ่งเป็นโปรแกรมที่ออกแบบมาให้เครื่องคอมพิวเตอร์สามารถเรียนรู้ถึงกระบวนการสร้างคำและความหมายของคำได้จากคลังข้อความภาษาไทย (Corpus) ด้วยกระบวนการทางสถิติ หลังจากนั้นจึงวิเคราะห์หัวข้อหลักในพระราชดำรัสด้วย Topic Model ซึ่งเครื่องจะพิจารณาการกระจายคำในหัวข้อหลักต่างๆ ทางสถิติของในแต่ละปี โดย Model จะแบ่งกลุ่มหัวข้อหลัก (Topic) จากคำที่เครื่องเห็นในพระราชดำรัส ตัวอย่างเช่น หัวข้อเศรษฐกิจจะใช้คำหลักว่า “น้ำมัน” หรือ “การเงิน” มากกว่าหัวข้อหลักสิ่งแวดล้อมซึ่งจะมีคำว่า “ป่า” กับ “แม่น้ำ” โดย Model จะแสดงผลเป็นตัวเลขสัดส่วนว่าแต่ละปีเนื้อหาอยู่ในหัวข้อหลักใด ซึ่งแสดงผลออกมาเป็นเปอร์เซ็นต์

King Speech By Sertis-04

จากนั้นจึงแสดงผลการวิเคราะห์ (Visualization) ด้วย Parallel Coordinates โดยข้อมูลผลลัพธ์ที่แสดงได้แก่ หัวข้อหลักกับ เปอร์เซ็นต์ของหัวข้อหลักในแต่ละปี ซึ่งการนำเสนอสามารถทำได้หลายรูปแบบทั้งแผนภูมิแท่ง (Bar chart) กราฟ และอื่นๆ แต่ เซอร์ทิส เลือกใช้ Parallel Coordinates เพราะเป็นการนำเสนอที่สามารถเก็บรายละเอียดข้อมูลที่มีหลายมิติ (High dimensional visualization) และมีลักษณะ Interactive visualization ที่ทำให้ผู้อ่านเห็นแนวโน้มและหัวข้อต่างๆ รายปีได้ง่ายขึ้น

King Speech By Sertis-05

ผลสรุปจากการวิเคราะห์พระราชดำรัสนั้นทำให้เราพบว่า ในหัวข้อหลักๆ ที่ในหลวงรัชกาลที่ 9 ได้ทรงดำรัสถึงนั้น ได้แก่ การศึกษา การบริหารจัดการ ศาสนา สิ่งแวดล้อม กฎหมายและการเมือง สิ่งหนึ่งที่เซอร์ทิสและไทยพับลิก้าเองมั่นใจได้ว่าเราจะสามารถมีส่วนร่วมในการขับเคลื่อนสังคมนั่นคือ การศึกษา โดยเรามีปณิธานว่าเราจะเผยแพร่ข้อมูลข่าวสาร ความรู้ ที่น่าเชื่อถือให้กับประชาชน เพื่อให้ประชาชนได้ใช้ข้อมูลเหล่านี้เป็นพื้นฐานในการต่อยอดพัฒนาความรู้ให้มากขึ้น เพื่อให้สังคมไทยเป็นสังคมที่ขับเคลื่อนด้วยข้อมูลที่เกิดจากการพิจารณาด้วยสติปัญญา มากกว่าการใช้แค่อารมณ์เป็นเครื่องมือในการตัดสินปัญหาต่างๆ ซึ่งจะทำให้สังคมไทยพัฒนาได้ไวและก้าวไกลมากยิ่งขึ้น

หมายเหตุ: สามารถดู Interactive Parallel Coordinates ได้ที่นี่

Written by Sertis Team