ผศ.ดร.ศราวุธ แรมจันทร์ ไขข้อสงสัย อะไรคือ Data Science?

dr-sarawut-ramjun-interview

ถ้าธุรกิจไม่นำวิทยาศาสตร์ข้อมูลมาปรับใช้ ก็จะกลายเป็นธุรกิจแบบดั้งเดิม ที่เจ้าสัวนั่งใช้กึ๋นตัวเองในการตัดสินใจครับ

อาจารย์นิว – ผศ. ดร.ศราวุธ แรมจันทร์

สิ่งหนึ่งที่แฝงอยู่ในกิจกรรมต่าง ๆ ในชีวิตประจำวันของเรา ไม่ว่าจะเป็น การกิน ดื่ม ท่องเที่ยว ช็อปปิ้ง เอนเตอร์เทนเมนต์ หรือแม้แต่กระทั่งการหาแฟน ก็คือการนำข้อมูล (Data) ที่มีอยู่มารวบรวม จัดสรร และวิเคราะห์ เพื่อใช้ประกอบการตัดสินใจที่มีประสิทธิภาพ

ฝั่งผู้ผลิตสินค้าและบริการก็เช่นกัน

ในยุคดิจิทัลที่คนส่วนใหญ่ดำเนินชีวิตด้วยการพึ่งพาเทคโนโลยีทั้งหลาย จึงเกิดข้อมูลขึ้นเป็นจำนวนมหาศาล ธุรกิจที่มีข้อมูลอยู่ในมือ จำเป็นต้องใช้เครื่องมือหรือศาสตร์มาช่วยวิเคราะห์ข้อมูล เพื่อนำมาพัฒนาสินค้าและบริการให้ตอบสนองความต้องการผู้บริโภคมากที่สุด เป็นการสร้างความได้เปรียบทางการแข่งขันในสนามธุรกิจที่เปลี่ยนแปลงไปทุกวัน

ซึ่งเครื่องมือดังกล่าวก็คือศาสตร์ Data Science หรือวิทยาศาสตร์ข้อมูลนั่นเอง

เพื่อให้เข้าใจคอนเซ็ปต์ของศาสตร์นี้มากขึ้น เราจึงชวน อาจารย์นิว – ผศ. ดร.ศราวุธ แรมจันทร์ ผู้อำนวยการหลักสูตรนวัตกรรมและการแปรรูปทางดิจิทัล ของวิทยาลัยนวัตกรรม มหาวิทยาลัยธรรมศาสตร์ และหนึ่งในคณาจารย์ผู้สอน TUXSA คอร์สปริญญาโทออนไลน์ของมหาวิทยาลัยธรรมศาสตร์และ SkillLane ในหลักสูตร Data Science for Digital Business Transformation  มาพูดคุยถึงแนวคิด ตัวอย่างการนำไปใช้ และมุมมองที่มีต่อด้านต่าง ๆ เกี่ยวกับ Data Science ในปัจจุบัน 

อาจารย์นิวเล่าให้ฟังแบบง่าย ๆ ได้ไหมว่า Data Science คืออะไร

มันเป็นกระบวนการในการวิเคราะห์ข้อมูลครับ ความโดดเด่นที่สำคัญคือใช้ Machine Learning ในการเรียนรู้ลักษณะข้อมูล เรามีแพตเทิร์นของ Data Mining (การทำเหมืองข้อมูล) หลายแบบในการ Formulate (สร้าง) ข้อมูลออกมา ตัวอย่างเช่น ถ้าเราเป็นเจ้าของซูเปอร์สโตร์ แล้วเราอยากรู้ว่าเวลาลูกค้าเดินเข้ามาแล้วเนี่ย เราควรจะออกแบบเลย์เอาต์ร้านอย่างไร ควรเอาของอะไรมาวางคู่กันเพื่อที่เขาจะซื้อสินค้า เมื่อเราวางไอเท็มแรกแล้ว เราควรจะวางอะไรถัดไป เพื่อที่เขาจะซื้อไอเท็มถัดไปอีก ตรงนี้แหละครับ ที่ Data Science จะเข้ามาซัพพอร์ตการดีไซน์เลย์เอาต์ของซูเปอร์สโตร์

ความจริงแล้ว Data Science ไม่ได้เป็นเรื่องใหม่หรอก อย่างสมัยก่อน ถ้าต้องการวิเคราะห์ข้อมูลสักอย่าง เรามักจะค่อย ๆ คิดโจทย์เป็นครั้ง ๆ ไป แล้วเจ้าหน้าที่ที่ทำหน้าที่วิเคราะห์ข้อมูลก็จะต้องไปหาเอาเองว่าข้อมูลอันไหนที่เอามาวิเคราะห์ได้ โดยใช้ Classic Statistics (สถิติดั้งเดิม) ซึ่งมันก็จะมีข้อจำกัดอยู่บ้าง เพราะข้อมูลที่เอามาเองก็จะต้องเป๊ะ จะต้องอยู่ในรูปแบบที่วิเคราะห์ได้

พอมันมีปัญหาหลายอย่างขึ้นมา Data Science ก็เลยพยายามที่จะทำให้คนที่เป็นเจ้าของข้อมูล สามารถวิเคราะห์ข้อมูลด้วยตัวเองเป็น ใช้เทคนิคที่มีความซับซ้อนขึ้น ด้วยเครื่องมือที่ใช้ง่ายขึ้นตามไปด้วย เช่น Python และภาษา R ที่จะเอาไปใช้วิเคราะห์ข้อมูลปริมาณมาก ที่มีความซับซ้อน ให้ออกมาเป็นข้อมูลใหม่ ๆ ได้ครับ

Data Science, Machine Learning และ AI มีความแตกต่างกันอย่างไร แล้วสามสิ่งนี้เกี่ยวข้องกันมากน้อยขนาดไหน

หลักการสำคัญของ Data Science คือเราข้ามผ่านยุค Database Relationships (ระบบฐานข้อมูลเชิงสัมพันธ์) มาแล้ว เราไม่สนใจว่าข้อมูลเนี่ย มีโครงสร้างเป็นยังไง แต่ว่า Data Science มีกระบวนการเปลี่ยนรูปข้อมูลเหล่านั้น ให้กลับมาอยู่ในรูปแบบที่ Formulate ได้

ส่วน Machine Learning มันเป็นเครื่องจักรที่ใช้ในการเรียนรู้ลักษณะของข้อมูล แปลว่าเราสามารถสอนให้เครื่องจักรแยกน้องหมาแต่ละสายพันธุ์ออกจากกันได้ แต่เราต้องไปสอนให้เครื่องจักรเรียนก่อน พอมันเรียนรู้แล้ว ก็จะแยกออกได้ว่าอันไหนคืออะไร และนี่ก็เป็นความแตกต่างที่สำคัญที่สุดแล้วครับ

ต่อมา AI คืออะไร เป็นคำถามที่คนถามเยอะมาก (ยิ้ม) มันเป็นเครื่องจักรที่มี Sensitivity (ตอบสนองไวต่อสิ่งเร้า) สูงครับ ยกตัวอย่างเช่น Voice Recognition (ระบบจดจำเสียง) การที่แยกได้ว่านี่เป็นเสียงเรา นี่เป็นเสียงคนอื่น หรือ Face Recognition (ระบบจดจำใบหน้า) ที่แยกได้ว่าหน้านี้เป็นใคร แปลว่าตัวมันมีความสามารถในการแยกแยะสูง ถ้าเราถอยกลับไปในยุคที่ AI ยังเป็นเบบี้อยู่ อย่างเครื่องซักผ้า เวลาโยนผ้าเข้าไป เครื่องก็กะปริมาณน้ำได้ โดยคำนวณจากปัจจัยหลาย ๆ อย่างพร้อมกัน สิ่งนี้แหละคือ AI เพราะฉะนั้นถ้าถามว่า Machine Learning เป็น AI ไหม…เป็นครับ

ฉะนั้นเรียกว่า AI ใหญ่สุดแล้วกัน ที่เหลือเราไปยืมคุณสมบัติที่ AI มีมาประยุกต์ใช้ครับ

ศาสตร์นี้อยู่ตรงไหนในชีวิตประจำวันของเรา

ในวิทยาลัยนวัตกรรมที่ธรรมศาสตร์เอง เรามีวิชา Mining Algorithm ครับ นักศึกษาก็จะได้เรียนว่าเราควรจะเดทกับใคร เรียงลำดับคนที่หนึ่งถึงสี่ (ยิ้ม) ซึ่งเป็นเทคนิคที่เราพยายามจะฝึกให้คนคิดอย่างเป็นระบบ

ซึ่งถ้าเป็นคนทำงานยังไงก็จะได้ใช้ครับ เพราะว่าโจทย์แต่ละอันก็ค่อนข้างใกล้ตัวคนทำงาน เช่น ถ้าอยากรู้ว่า ลูกค้าอาชีพนี้ ชอบซื้อสินค้าประเภทนี้หรือเปล่า ด้วยเซนส์เรา ก็มักจะตัดสินไปก่อนว่าคนแบบนี้ ชอบอย่างนี้ แต่ถ้าเอาข้อมูลมาวิเคราะห์จริง ๆ มันอาจจะไม่ใช่ก็ได้

Data Science มีความสำคัญอย่างไร

มันเพิ่มประสิทธิภาพในการแข่งขันทางธุรกิจครับ คือตอนนี้ทุกธุรกิจมีข้อมูลอยู่ในมือเยอะแยะเต็มไปหมดเลย แต่ไม่รู้ว่าจริง ๆ แล้ว ข้อมูลที่มีมันมีคุณค่าต่อองค์กรหรือเปล่า มากไปกว่านั้นเนี่ย ถึงแม้จะรู้ว่าข้อมูลมีคุณค่านะ แต่ก็ไม่รู้จะวิเคราะห์ยังไง 

มีหลายธุรกิจมาก ๆ ครับ ที่ดีไซน์เซอร์วิสออกมา เป็น Customize เช่น ธุรกิจประกันภัย ธุรกิจบริการอย่างสายการบิน ซึ่ง Data Science ก็จะเข้าไปช่วย ในการออกแบบสินค้าหรือบริการให้เหมาะสมกับลูกค้าแต่ละคน

แล้วถ้าธุรกิจไม่นำศาสตร์นี้มาปรับใช้เลย จะส่งผลอย่างไร

ก็จะกลายเป็นธุรกิจแบบดั้งเดิม ที่เจ้าสัวนั่งใช้กึ๋นตัวเองในการตัดสินใจครับ ธุรกิจจะอยู่รอดหรือเปล่าจะขึ้นอยู่กับพลังส่วนบุคคลล้วน ๆ ไม่มีอะไรมาซัพพอร์ตครับ (ยิ้ม) 

dr-sarawut-ramjun-interview-data-science
อาจารย์นิว – ผศ. ดร.ศราวุธ แรมจันทร์

Clive Humby เป็นผู้คิดค้นวลี “Data is the new oil” จากนั้น Jack Ma ก็ได้ยกวลีนี้มากล่าวอยู่บ่อยครั้ง อาจารย์นิวคิดว่าคำพูดนี้ยังเป็นจริงไหมในปัจจุบัน

ข้อมูลมันยังเป็นแหล่งสินทรัพย์ขนาดใหญ่อยู่ครับ แต่จริง ๆ เคลื่อนตัวค่อนข้างช้านะ เพราะคนยังไม่ค่อยใช้กัน ซึ่งมันเกี่ยวกับความเก่งไม่เก่งของ Data Scientist ในแต่ละที่ด้วย เนื่องจากมันรวมองค์ความรู้หลายอย่างเข้าด้วยกันครับ อย่างคนที่เขียนโปรแกรมเป็น ก็อาจจะไม่เข้าใจกระบวนการทางธุริจ ก็เลยทำให้เลือกใช้ข้อมูลที่ไม่มีประสิทภาพตามไปด้วย

มันเป็นมหาสมุทรที่คนไม่รู้ว่ามีอะไรอยู่ข้างในจริง ๆ ครับ

อุตสาหกรรมหรือธุรกิจใดในประเทศไทย ที่เรียกได้ว่าเป็นแถวหน้าของการใช้ข้อมูล (Data Driven Business) บ้าง

พวกอสังหาริมทรัพย์ หรือยานยนต์ก็ใช้เยอะ อย่างเช่น เวลาเราซื้อรถ รถรุ่นเดียวกันก็จะมีราคาหลายระดับ ถ้าคิดแบบกำปั้นทุบดินเลย สมมุติแบ่งเป็น 1.2 ล้าน 1.35 ล้าน แล้วขึ้นราคาเป็น 1.7 ล้าน พอเราเอาข้อมูลมาคิดด้วย Cluster Analysis (การวิเคราะห์จัดกลุ่มข้อมูล) แล้วจะพบว่า ตรงกลางมันผิดนะ เลขมันควรจะเซ็ตที่ 1.6 ล้าน แล้วคุณจะขายได้ 

อะไรคือสิ่งสำคัญที่สุดและควรระวังมากที่สุดในการใช้ข้อมูลขับเคลื่อนองค์กรและธุรกิจ

คนใช้ข้อมูลควรจะรู้ก่อนครับว่าอยากใช้อะไร นี่เป็นปัญหาใหญ่มาก ๆ คือ Data Scientist จะได้โจทย์มาว่า ‘ไม่รู้เหมือนกันว่าต้องการอะไร แต่ไปทำมาก่อน’ ซึ่งทำให้เราไปหา Data Source (แหล่งข้อมูลต้นทาง) ไม่ถูก ว่าจะเอาอะไรมาใช้ดี

มีคนถามบ่อยมากว่าใครเหมาะที่จะเรียน Data Science ผมคิดว่าคือเจ้าของข้อมูลครับ จงสงสัยเองและวิเคราะห์เอง มันก็จะสามารถทำได้ด้วยตัวเอง ได้ผลลัพธ์เร็ว โดยไม่ต้องไปสื่อสารอะไรกับใคร

อาจารย์นิวคิดว่าเทรนด์ใดในด้าน Data & Analytics ที่กำลังมาแรงบ้าง

น่าจะเป็นเรื่องที่เราทำให้มันใกล้ความเป็น AI มากขึ้นครับ เพราะตอนนี้กำลังเริ่มแยกพวกเทคโนโลยี Recognition (ระบบการจดจำ) ทั้งหลายออกจาก Data Science ไม่ค่อยออกละ 

เช่น Autonomous Car (รถยนต์ขับเคลื่อนอัตโนมัติ) มันมีลักษณะเป็น Big Data (การวิเคราะห์ข้อมูลปริมาณมหาศาล) เพราะใช้เซ็นเซอร์ในการสื่อสารกับรถข้าง ๆ ซึ่งข้อมูลที่ถูก Accumulate (สะสม) ก็จะใหญ่มาก แต่เราก็ยังแยกไม่ออกว่า Autonomous Car เป็น AI แน่ ๆ หรือเปล่า เพราะมันมี Sensitivity สูงมาก แถมนำทางด้วยตัวเองได้ด้วย ซึ่งในขณะเดียวกัน AI ก็ใช้ข้อมูลขนาดใหญ่ตลอดเวลาเช่นกัน

หากคนทั่วไปคิดจะเริ่มศึกษา Data Science อาจารย์คิดว่าเรื่องใดที่ควรให้ความสำคัญหรือเรียนรู้เป็นอันดับต้น ๆ 

ถ้าเป็นคนที่ไม่เคยเรียนด้านนี้เลย เรื่อง Programming (การเขียนโปรแกรม) ครับ เพราะระบบการคิดเชิงตรรกะเป็นเรื่องที่สำคัญที่สุด ถ้าเราไม่คิดอะไรเป็นก้อน ๆ ต่อกันเนี่ย จะไปต่อลำบาก เพราะทุกอย่างเป็นขั้นเป็นตอนที่มีความชัดเจน ซึ่งเราต้องดีไซน์ขั้นตอนเหล่านั้นอยู่ตลอดเวลาครับ

ให้อาจารย์ฝากถึงคนที่อยากเข้ามาเรียนเรื่อง Data Science สักเล็กน้อย ว่าควรเตรียมตัวหรือมีลักษณะอย่างไร เพื่อที่จะเอื้อให้สามารถใช้ข้อมูลได้ดียิ่งขึ้น

อยากให้คนที่เป็นเจ้าของข้อมูลเห็นคุณค่าของข้อมูลตัวเอง ว่ามันเอาไปใช้วิเคราะห์ได้ เช่น เราจะเห็น Data Scientist ในโรงพยาบาลมาก เพราะเขามีปริมาณข้อมูลมหาศาลและต้องใช้ทุกวัน ถ้าหากโรงพยาบาลอยาก Formulate ข้อมูลให้ได้มากกว่านี้ ศาสตร์ Data Science คือคำตอบครับ


Fact Box: