ในชุดบทความนี้ ผู้เขียนจะยกตัวอย่างศาสตร์ในแขนงต่างๆ ที่เริ่มนำเทคนิคปัญญาประดิษฐ์ (Artificial Intelligence) เข้ามาประยุกต์ใช้ในศาสตร์ปัจจุบัน ซึ่งบางหัวข้อที่อาจจะเห็นน้อยครั้งในบทความภาษาไทย โดยในบทความแรกเราจะพูดถึงศาสตร์ของการเคลื่อนไหว (Movement Science) และการเข้ามาของปัญญาประดิษฐ์ ท้ายที่สุดหลังจากอ่านบทความนี้ อยากจะให้ผู้อ่านได้เกร็ดความรู้และแนวคิดว่าการเติบโตของข้อมูลและปัญญาประดิษฐ์เข้ามามีบทบาทอย่างไรบ้างในศาสตร์ของการเคลื่อนไหว
ชีวิตคือการเคลื่อนไหว
อริสโตเติลนักปรัชญาในสมัยกรีกกล่าวไว้ว่า “ชีวิตคือการเคลื่อนไหว” มนุษย์และสัตว์ต่างวิวัฒนาการการเคลื่อนไหวเพื่อปรับให้ทำงานเหมาะสมกับสภาวะแวดล้อมที่ตนเองเติบโตขึ้นมา ยกตัวอย่างเช่น งู วิวัฒนาการให้สามารถเลื้อยเข้าไปในช่องที่แคบและมีความซับซ้อนได้ กบ วิวัฒนาการให้กระโดดได้ไกลเพื่อใช้หลบหนีภัยอันตรายที่อาจจะเกิดขึ้นใกล้ตัว หนู วิวัฒนาการกล้ามเนื้อบริเวณจมูกเพื่อควบคุมหนวดให้สำรวจและค้นหาสิ่งต่างๆ รอบตัว แม้แต่ มนุษย์ ก็วิวัฒนาการมือเพื่อใช้ในการจับและสร้างสิ่งของที่มีความซับซ้อนสูงได้
การเคลื่อนไหวถือเป็นสิ่งที่มีความสำคัญมากๆ สำหรับสิ่งมีชีวิตหลากหลายชนิดบนโลก
ในกรณีของมนุษย์ ตั้งแต่เราเกิดมาเป็นเด็กทารก การเคลื่อนไหวมีความสำคัญมากๆ ในวัยทารกเราเคลื่อนไหว ลองจับสิ่งต่างๆ รอบตัวเพื่อเรียนรู้ เราเริ่มเดิน หยิบจับสิ่งของ ฝึกพูดในภาษาต่างๆ นอกจากนั้นเรายังสามารถเรียนรู้ที่จะใช้อุปกรณ์ที่เจอในชีวิตประจำวันได้อีกด้วย แม้แต่กระทั่งผู้เขียนกำลังพิมพ์บทความอยู่ตอนนี้ก็ยังต้องใช้การเคลื่อนไหวของนิ้วมือ เวลากวาดนิ้วพิมพ์คำขึ้นมาหนึ่งคำ สมองของเราเรียนรู้ที่จะควบคุมกล้ามเนื้อเพื่อให้กดแป้นออกมาได้โดยอาจจะไม่ต้องนึกถึงแต่ละตัวอักษรเลยด้วยซ้ำ มนุษย์ใช้การเคลื่อนไหวมากจนนักประสาทวิทยาบางคนบอกว่าการเคลื่อนไหวเป็นปัจจัยสำคัญที่สุดของเรามนุษย์เราเลยทีเดียว
การจะควบคุมหุ่นยนต์ด้วยสมองต้องใช้ความรู้ในหลายด้าน เช่น ประสาทวิทยา หุ่นยนต์ และปัญญาประดิษฐ์เข้ามาใช้ร่วมกัน โดยศาสตร์หนึ่งที่ศึกษาและประยุกต์องค์ความรู้ข้างต้นมีชื่อว่าวิทยาศาสตร์การเคลื่อนไหว (Movement Science) ซึ่งรวมความรู้จากศาสตร์หลายแขนงเพื่อศึกษาการเคลื่อนที่ของมนุษย์และสัตว์ โดยวิทยาศาสตร์การเคลื่อนไหวประยุกต์ใช้ศาสตร์หลากหลายแขนงเข้ามารวมกัน ได้แก่
- ประสาทวิทยา การความสัมพันธ์ระหว่างสัญญาณสมองกับการเคลื่อนไหว
- หุ่นยนต์ ศึกษาการเคลื่อนไหวของสัตว์หรือคนเพื่อนำมาสร้างหุ่นยนต์ (bio-inspired) เช่นการใช้การเคลื่อนไหวของงูมาออกแบบหุ่นยนต์สำหรับสำรวจในการผ่าตัด
- กีฬา แน่นอนว่าการเคลื่อนไหวสำคัญกับกีฬามากๆ ตั้งแต่กีฬาทั่วไป จนถึงการออกกำลังกาย ซึ่งในอนาคตปัญญาประดิษฐ์อาจจะใช้บอกได้ว่าการเคลื่อนไหวแบบใดดีหรือไม่ดี โดยไม่ต้องพึ่งโค้ชอย่างเดียวก็ได้
- วิศวกรรมชีวการแพทย์ นำการเคลื่อนไหวมาช่วยออกแบบการทำแขนเทียมและขาเทียมเพื่อนำมาช่วยผู้พิการทางการเคลื่อนไหว
- ศึกษาโรคหรือความผิดปกติทางการเคลื่อนไหว นอกจากนี้เรายังสามารถศึกษาการเคลื่อนไหวเพื่อใช้เป็นข้อมูลสำหรับการบ่งชี้โรคที่เกี่ยวกับการเคลื่อนไหวได้ด้วย เช่น โรคเกี่ยวกับหลอดเลือดสมอง (stroke) หรือพาร์กินสัน
- อื่นๆ ยังมีโอกาสอีกมากมายที่เราสามารถศึกษาได้ เช่น ศิลปะนำมาศึกษาท่าทางการเต้น การเคลื่อนไหว หรือนำมาศึกษาพฤติกรรมของสัตว์และมนุษย์เช่นในพฤติกรรมศาสตร์ เป็นต้น
การเคลื่อนไหวสำคัญขนาดที่ว่าหลายๆบริษัทใหม่ที่เกิดขึ้นอย่างเช่น Neuralink ที่มหาเศรษฐีอีลอน มักส์ลงทุนสร้างเครื่องวัดสัญญาณสมองเพื่อที่จะใช้ทำนายการเคลื่อนไหวของผู้พิการทางแขนหรือขาด้วยสัญญาณสมองเพื่อให้สามารถควบคุมหุ่นยนต์สำหรับการเคลื่อนไหวแทนได้
ข้อจำกัดของศาสตร์ในปัจจุบัน
ในสมัยเริ่มต้นการศึกษาการเคลื่อนไหวต้องใช้เครื่องมือและต้องติดอุปกรณ์หรือมาร์กเกอร์มากมายเพื่อการวัดตำแหน่ง ความเร็ว แรง และสัญญาณต่างๆ ที่แม่นยำ ยกตัวอย่างเช่น ในกรณีของคน เราอาจจะต้องสร้างเครื่องมือเพื่อใช้วัดแรงและติดมาร์กเกอร์เพื่อให้รู้ตำแหน่งของการเคลื่อนที่ของส่วนต่างๆ ของร่างกาย ถ้าเราอยากศึกษาการเดิน อาจจะต้องใช้ลู่วิ่งและกล้องเพื่อจับตำแหน่งของการเดิน แน่นอนว่าเราจะได้การวัดผลที่แม่นยำ แต่ทำให้การขยายฐานข้อมูลอาจจะเป็นไปได้ยากเนื่องจากการเก็บข้อมูลเหล่านี้ใช้จำนวนคน อุปกรณ์ราคาแพง และระยะเวลาที่ยาวนานมาก นอกจากนั้นเราอาจจะเก็บข้อมูลไม่ได้ในทุกกรณีเพราะว่าอาจจะติดอุปกรณ์ตรวจจับไม่ได้หรือว่าไม่เอื้ออำนวย เช่นในกรณีของเด็กทารกหรือผู้ป่วย หรือในกรณีที่เราอยากจะศึกษาการเคลื่อนที่ของมนุษย์ในชีวิตจริง การใช้เครื่องมือและห้องแลปอาจจะไม่สามารถตอบได้ทุกคำถาม
ปัญญาประดิษฐ์เพื่อศึกษาการเคลื่อนไหวของสัตว์และมนุษย์
ข้อจำกัดที่มีอยู่ในศาสตร์ปัจจุบัน ทำให้นักวิทยาศาสตร์เริ่มคิดที่จะขยายการเก็บข้อมูล มองหาข้อมูลที่มีอยู่ และประยุกต์ใช้เทคนิคปัญญาประดิษฐ์เข้ามาช่วยสร้างฐานข้อมูลของการเคลื่อนไหวมากขึ้น ความเจ๋งคือข้อมูลที่มีในโลกอินเตอร์เน็ตอาจจะเพียงพอที่เราสามารถทำความเข้าใจการเคลื่อนไหวได้มากกว่าข้อมูลที่มีอยู่จากแลปอย่างเดียว ยกตัวอย่างเช่นใน Reddit มีกลุ่มชื่อ Formcheck ที่ใช้สำหรับการลงวีดีโอยกเวทโดยเฉพาะ ใน YouTube ก็มีช่องที่ถ่ายคนเดินบนถนนหลายหมื่นวีดีโอ หรือแม้กระทั่งถ่ายสัตว์เคลื่อนไหว ถ้ายิ่งเป็นการเต้น เรามีวีดีโอมากมายสำหรับการเต้นเกือบทุกแบบบนอินเตอร์เน็ต
ผนวกกับในหลายปีที่ผ่านมา เทคนิคคอมพิวเตอร์วิทัศน์ (Computer Vision) เติบโตอย่างก้าวกระโดด ทำให้เราสามารถเริ่มศึกษาการเดินของมนุษย์หรือสัตว์จากวีดีโอ (บางครั้งเรียกว่า Pose Tracking) โดยใช้เทคนิคคอมพิวเตอร์วิทัศน์ร่วมปัญญาประดิษฐ์ ในปัจจุบันมีไลบรารี่มากมายที่นำมาใช้ Openpose, DeepLabCutTM , Social LEAP, DeepPoseKit, Animal Part Tracker (APT) เข้ามามีบทบาทในการตรวจจับตำแหน่งการเคลื่อนไหวจากภาพหรือวีดีโอ เทคนิคคอมพิวเตอร์วิทัศน์ทำให้เราสามารถตรวจจับตำแหน่งของจุดต่างๆ ในสัตว์หรือมนุษย์โดยที่เราไม่ต้องติดมาร์กเกอร์เหมือนในอดีต
การทำงานของปัญญาประดิษฐ์นี้ใช้เทคนิค Deep Learning (ส่วนมากจะเป็น Convolutional Neural Network ร่วมกับ Recurrent Neural Network) เพื่อเข้ามาช่วยเพื่อวิเคราะห์ภาพหรือวีดีโอ โดยหลักการของเราก็คือการประมาณจุดต่างๆ ที่สนใจจากภาพด้วยโมเดลที่ชื่อว่า Convolutional Neural network เช่นในกรณีของมนุษย์อาจจะจะเป็นใบหน้า ไหล่ เข่า ข้อมือ หรือกรณีของสัตว์อาจจะเป็นกระดูกสันหลังและตำแหน่งของหัว เป็นต้น โดยตำแหน่งนี้จะนำมาใช้ในภาพหลายๆ เฟรม เพื่อประมาณว่าจุดนี้เป็นจุดของคนไหนในภาพและเคลื่อนไหวไปอย่างไรในเฟรมที่ติดกัน โดยชุดข้อมูลที่เข้ามามีบทบาทสำหรับการสร้างโมเดลมีมากมาย ยกตัวอย่างเช่น Common Objects in Context (COCO) human pose datasets ที่สร้างขึ้นจากความร่วมมือจากหลายบริษัท เช่น ไมโครซอฟต์และเฟสบุ๊ค ในปัจจุบัน COCO มีข้อมูลของภาพคนมากกว่าสองแสนคน โดยโมเดลปัญญาประดิษฐ์สามารถเรียนรู้จากภาพจำนวนมากนี้เพื่อที่จะเข้าใจบริบทจากภาพจำนวนมาก และนักวิจัยสามารถเอาโมเดลมาเรียนรู้ที่จะตรวจจับจุดต่างๆ ของคน สัตว์ หรือแมลงได้ด้วยภาพใหม่จำนวนไม่มากนัก
ยกตัวอย่างเช่น DeepLabCut และ OpenPose สร้างขึ้นมาให้ใช้งานได้ง่าย โดยนักวิจัยสามารถใส่ชุดข้อมูลจุดที่สนใจใหม่ของสัตว์หรือคนเพียงไม่มาก หลังจากนั้นอัลกอริธึมที่มีในปัจจุบันสามารถเรียนรู้จากภาพเพียงประมาณ 50 – 100 ภาพใหม่เพื่อสามารถเรียนรู้ที่จะตรวจจับจุดที่เราสนใจจากภาพใหม่ได้ ด้วยเทคนิคการโยนย้ายองค์ความรู้ (Transfer Learning) ซึ่งเป็นเทคนิคหนึ่งที่เราสามารถนำองค์ความรู้จากโมเดลที่สร้างจากชุดข้อมูลนึงไปใช้กับอีกชุดข้อมูลได้
ทำความเข้าใจข้อมูลการเคลื่อนไหว
หลังจากที่เราตรวจจับการเคลื่อนไหวได้แล้ว เราอาจจะต้องการเข้าใจหรือทำนายข้อมูลนี้ แน่นอนว่าชุดข้อมูลของเราบางทีมีความสั้น-ยาวไม่เท่ากัน เช่นท่าทางของการวิ่งของข้อมูลสองอันอาจมีลักษณะคล้ายกัน แต่คนนึงวิ่งเร็วกว่าอีกคน การจะเทียบชุดข้อมูลนี้เราอาจจะตรวจจับแพทเทิร์นของข้อมูล ร่วมกับใช้เทคนิค Dynamic time-warping ซึ่งเป็นเทคนิคหนึ่งที่สามารถจัดข้อมูล time series ให้อยู่ในตำแหน่งที่ใกล้เคียงกันตามเวลา เสร็จแล้วเราจึงสามารถจัดกลุ่มการเคลื่อนไหวด้วยเทคนิคเช่น K-mean เพื่อจัดกลุ่มข้อมูลเชิงเวลาได้ โดยถ้าใครสนใจเพิ่มเติมไลบรารี่ของภาษา Python ก็มีให้เลือกใช้เช่นกัน ได้แก่ tslearn หรือ scikit learn เป็นต้น
Dynamic Time Warping (DTW) เป็นเทคนิคหนึ่งสามารถใช้จัดเทียบสัญญาณ 2 สัญญาณที่มีความต่างทางเวลาเข้ามาในรูปแบบเดียวกัน ทำให้เราสามารถนำ 2 สัญญาณนี้มาเปรียบเทียบกันได้ เช่น การยกเวทของแต่ละคนอาจจะมีลักษณะการเคลื่อนไหวของแต่ละข้อต่อใกล้เคียงกันแต่ใช้เวลาไม่เท่ากัน หรือการก้าวเท้าอาจใช้เวลาไม่เท่ากันแต่ว่าลักษณะของการขยับใกล้เคียงกัน เราสามารถใช้ DTW เข้ามาจัดรูปสัญญาณก่อนเปรียบเทียบได้
หลังจากเราจับกลุ่มข้อมูลแล้วก็สามารถนำมาศึกษาต่อได้ว่าการเคลื่อนไหวของทั้งวีดีโอเป็นอย่างไร หรือเราเปลี่ยนการเคลื่อนไหวไปอย่างไรบ้าง นักวิจัยใช้เทคนิคเหล่านี้เพื่อจับกลุ่มดูพฤติกรรมของทั้งคนและสัตว์ในบริบทต่างๆ ไม่ว่าจะเป็นการเดินสลับกับการวิ่ง การโฟกัสหรือปฏิสัมพันธ์ของกลุ่มคนในที่ประชุม การกิน การเคลื่อนไหวที่ผิดปกติในเด็ก หรือแม้กระทั่งการตรวจจับโรคซึมเศร้า
โอกาสในอนาคตของการใช้ปัญญาประดิษฐ์
อนาคตของการนำปัญญาประดิษฐ์เข้ามาใช้ศึกษาการเคลื่อนไหวยังมีอีกมากมาย ยังมีงานวิจัยที่พยายามศึกษาการเคลื่อนไหวออกมาเรื่อยๆ ทั้งในไทยและต่างประเทศที่หนีไม่พ้นเลยน่าจะเป็นการนำปัญญาประดิษฐ์มาประยุกต์ใช้ทางการแพทย์ เช่นนำมาใช้สำหรับตรวจจับอาการความผิดปกติของการเคลื่อนไหวก่อนที่ผู้ป่วยจะเป็นพาร์กินสันร้ายแรง หรือตรวจจับความผิดปกติของการเคลื่อนไหวในเด็กแรกเกิดที่บางครั้งพ่อแม่อาจจะไม่ได้สังเกต แพทย์สามารถนำข้อมูลมาช่วยให้การวินิจฉัยโรคทำได้รวดเร็วขึ้น หรือในการออกกำลังกายก็ได้มีไอเดียการนำข้อมูลการยกเวทมาใช้ในการวิเคราะห์ความถูกต้องของการยกด้วยในท่าต่างๆ เช่น squad หรือ deadlift เพื่อที่จะตรวจสอบว่าการยกนี้ถูกต้องอย่างไรบ้างหรือใช้ในการดูพัฒนาการของการยกเวท หรือในมุมมองของฝั่งพฤติกรรมศาสตร์ เราก็สามารถใช้ข้อมูลของการเคลื่อนไหวเพื่อศึกษาพฤติกรรมของคนและสัตว์ด้วยซึ่งทำให้เราสามารถเก็บข้อมูลที่อาจจะไม่ได้จำกัดเพียงแค่ในห้องทดลอง เราสามารถดูพฤติกรรมการหาอาหารของหนู การเรียนรู้ที่จะแก้ปัญหาของลิง การเลือกซื้อผลิตภัณฑ์ของคนในซุปเปอร์มาร์เก็ต หรือการปฏิสัมพันธ์ในที่ประชุมก็ได้
แน่นอนว่ายังมีคำถามอีกมากมายที่นักวิจัยยังคงค้นหาคำตอบ การประยุกต์ใช้ปัญญาประดิษฐ์ทำให้เราสามารถนำข้อมูลขนาดใหญ่มาวิเคราะห์การเคลื่อนไหว และทำให้นักวิจัยและนักพัฒนาสามารถเก็บข้อมูลที่เก็บไม่ได้มาก่อนในอดีต นอกจากนั้นยังสามารถเก็บข้อมูลได้จากหลากหลายสถานที่และสิ่งแวดล้อม
ในอนาคตการพัฒนาของศาสตร์ปัญญาประดิษฐ์อาจเข้ามามีบทบาทในการศึกษาและเข้าใจการพฤติกรรมและการเคลื่อนไหวมากขึ้น แน่นอนว่าความเข้าใจนี้ทำให้เราสามารถนำองค์ความรู้ไปใช้ในศาสตร์หลากหลายแขนง เช่น การแพทย์ กีฬา พฤติกรรมศาสตร์ และอื่นๆอีกมากมาย เทคนิคปัญญาประดิษฐ์ที่เปิดโอกาสให้เราได้ตั้งคำถามและศึกษาองค์ความรู้ใหม่ที่งานวิจัยเดิมไม่สามารถตอบคำถามได้ทั้งหมด
อ้างอิง
- Kwok, Roberta. “Deep learning powers a motion-tracking revolution.” Nature 574, no. 7776 (2019): 137-139.
- Cao, Zhe, Gines Hidalgo, Tomas Simon, Shih-En Wei, and Yaser Sheikh. “OpenPose: realtime multi-person 2D pose estimation using Part Affinity Fields.” IEEE transactions on pattern analysis and machine intelligence 43, no. 1 (2019): 172-186.
- Seethapathi, Nidhi, Shaofei Wang, Rachit Saluja, Gunnar Blohm, and Konrad P. Kording. “Movement science needs different pose tracking algorithms.” arXiv preprint arXiv:1907.10226 (2019).
- Mathis, Mackenzie Weygandt, and Alexander Mathis. “Deep learning tools for the measurement of animal behavior in neuroscience.” Current opinion in neurobiology 60 (2020): 1-11.
- Chambers, Claire, Nidhi Seethapathi, Rachit Saluja, Helen Loeb, Samuel R. Pierce, Daniel K. Bogen, Laura Prosser, Michelle J. Johnson, and Konrad P. Kording. “Computer vision to automatically assess infant neuromotor risk.” IEEE Transactions on Neural Systems and Rehabilitation Engineering 28, no. 11 (2020): 2431-2442.