top of page

โมเดล Face Landmark Localization เทคนิคใหม่ เทคโนโลยีตรวจจับใบหน้าที่แม่นยำกว่าเดิม

รูปภาพนักเขียน: SertisSertis


ปัจจุบันนี้เราดำเนินมาถึงยุคที่เทคโนโลยีก้าวหน้าในระดับที่เราสามารถสร้าง ‘ตา’ ให้กับคอมพิวเตอร์ หรือที่เรียกว่า Computer Vision ได้แล้ว ซึ่งความก้าวหน้านี้นำไปสู่การเกิดเทคโนโลยีต่อยอดที่ก่อให้เกิดประโยชน์มากมาย เช่น เทคโนโลยีด้านการจดจำหรือสแกนใบหน้า (Face Recognition) ที่ใช้ในระบบรักษาความปลอดภัย เทคโนโลยีตรวจจับวัตถุ (Object Detection) ที่ใช้ในการแยกแยะวัตถุ รวมถึงเทคโนโลยีตรวจจับท่าทาง (Human Pose Estimation) ที่สามารถนำไปประยุกต์ใช้กับการวิเคราะห์ทางด้านกีฬา หรือติดตามตัวบุคคลได้

ทาง Sertis เอง ได้เล็งเห็นประโยชน์ที่จะต่อยอดได้จากเทคโนโลยีดังกล่าว และได้มีการจัดตั้งทีม Sertis Computer Vision ซึ่งนอกจากจะเป็นผู้พัฒนาอุปกรณ์ตรวจจับใบหน้า Sertis Face Recognition แล้ว ยังได้มีการค้นคว้าและวิจัยด้าน Computer Vision อย่างต่อเนื่อง

ในครั้งนี้ ทีมพัฒนาจาก Sertis Computer Vision ซึ่งประกอบด้วย Samuel W. F. Earp, Aubin Samacoits, Sanjana Jain, ภาวิต น้อยนงเยาว์ และศิวะ บุญพรรณมงคล ได้คิดค้นวิธีการระบุตำแหน่งจุดสำคัญบนใบหน้า (Face Landmark Localization) ให้แม่นยำขึ้นโดยการใช้ Heatmap และ Training เทคนิคอื่น ๆ เพื่อพัฒนาโมเดลที่มีประสิทธิภาพขึ้นอีกขั้น

Face Landmark Localization เป็นขั้นตอนที่สำคัญมากของระบบตรวจจับใบหน้า และการสร้างหรือการแปลงโฉมภาพใบหน้า ซึ่งเป็นเทคโนโลยีที่เราเห็นกันอย่างแพร่หลายและสร้างประโยชน์ได้มาก ไม่ว่าจะเป็นการใช้ในการทำงาน รักษาความปลอดภัย หรือการใช้เพื่อความบันเทิง โดยในงานวิจัยครั้งนี้ทีมพัฒนาได้เลือกใช้เทคนิค Heatmap Regression โดยใช้โมเดล MobileNetV2 เป็น Backbone และตามด้วยเลเยอร์ที่ช่วยอัปสเกลอีกหลายเลเยอร์ และมีการประยุกต์ใช้เทคนิคที่หลากหลายเพื่อเพิ่มประสิทธิภาพการทำงานและลดระยะเวลาในการตรวจจับ

ในการทดลอง ทีมพัฒนาได้ใช้ Face Landmark พื้นฐานจำนวน 5 จุด ซึ่งได้มาจากโปรแกรมตรวจจับใบหน้าที่เปิดใช้เป็นสาธารณะ โดยนำจุด landmark พื้นฐานดังกล่าวมาหมุนใบหน้าให้ตั้งตรงก่อน แทนการใช้ Bounding Box ทีมพัฒนาได้ทำการสุ่มหมุน ขยับ และปรับขนาดภาพใบหน้าระหว่างการเทรนโมเดล และได้พบว่าโมเดลไวต่อการวิเคราะห์ตำแหน่งของใบหน้ามากกว่าความโน้มเอียงของใบหน้า นอกจากนี้ทีมพัฒนายังสามารถลดความซับซ้อนของขั้นตอนในการอัปสเกลด้วยการผสมระหว่างเลเยอร์แบบ Deconvolution กับเลเยอร์แบบ Pixel Shuffle ซึ่งเป็นวิธีที่ช่วยลดเวลาการประมวลผลได้โดยไม่ลดประสิทธิภาพของการระบุตำแหน่ง รวมถึงได้นำเทคนิค Sub-Pixel Inference มาใช้เพื่อเพิ่มความแม่นยำของ Face Landmark

ด้วยเทคนิคเหล่านี้ ทำให้เราสามารถผลิตโมเดล Face Landmark Localization รูปแบบใหม่ที่มีความก้าวหน้าสูงได้สำเร็จ และได้นำโมเดลไปทดสอบร่วมกับโมเดล Face Recognition ที่เปิดเป็นสาธารณะ ซึ่งพบว่าสามารถช่วยเพิ่มความแม่นยำในการจำใบหน้าได้ดี

ในการแข่งขัน The 2nd Grand Challenge of 106-Point Facial Landmark Localization โมเดล Face Localization Landmark ได้รับการจัดอันดับไว้เป็นอันดับที่สองในส่วนของการทดสอบกับ Validation Set ซึ่งความสำเร็จนี้ก็เป็นอีกความภาคภูมิใจที่จะผลักดันให้ทีม Sertis ของเรา มุ่งมั่นพัฒนาเทคโนโลยีที่มีประโยชน์ และร่วมผลักดันวงการเทคโนโลยีด้านปัญญาประดิษฐ์ให้ก้าวหน้ายิ่งไปกว่าเดิม

อ่านบทความวิจัยอย่างละเอียดได้ที่: https://arxiv.org/abs/2103.03059

Commentaires


bottom of page