บ่อยครั้งที่เรามักจะได้ยินคำว่า “Digital Transformation” แทรกซึมอยู่แทบทุกกิจกรรม องค์กร ธุรกิจ โดยเฉพาะอย่างยิ่งในยุคที่มีการแข่งขันสูงอย่างปัจจุบัน Digital Transformation คือส่วนสำคัญในการสร้างศักยภาพด้านการแข่งขันให้สามารถพัฒนาเป็นไปตามความคาดหวังของกลุ่มเป้าหมาย ส่งผลให้การดำเนินงานหรือธุรกิจต่างๆ ประสบความสำเร็จ
Digital Transformation จึงเกี่ยวข้องกับการใช้เทคโนโลยีดิจิทัลเป็นการสร้างกระบวนการใหม่ให้มีประสิทธิภาพและประสิทธิผลมากขึ้น ไม่เพียงแต่เป็นการนำเทคโนโลยีเข้าทำซ้ำบริการที่มีอยู่ในรูปแบบดิจิทัลเท่านั้น แต่เป็นการใช้เทคโนโลยีเพื่อเปลี่ยนแปลงบริการดังกล่าวจาก “สิ่งที่มีอยู่ ให้เป็น สิ่งที่ดีกว่าเดิม” แต่เทคโนโลยีก็สามารถเปลี่ยนแปลงได้ตลอดเวลา โดยหัวข้อที่ส่วนใหญ่มักจะพูดถึงมากที่สุดในตอนนี้คงหนีไม่พ้นเรื่องการนำปัญญาประดิษฐ์ AI เข้ามาช่วยการ Digital Transformation
บทบาทของเนคเทคในการพัฒนา AI …ทำอะไรบ้าง
เนคเทคได้รวบรวมผลงานพร้อมใช้ที่พัฒนาอยู่บนเทคโนโลยี AI มาให้บริการเพื่อให้คนไทยได้เข้าถึงในชื่อของ AI Service Platform มาช่วยเพิ่มประสิทธิภาพในการดำเนินงาน (Operation) ให้ดีขึ้น (Save Cost) ประหยัดมากขึ้น ทรัพยากรที่ใช้ในการผลิตและบริการ (Resource) ต้องใช้น้อยลง โดยแนวคิดที่มีร้อยเรียงกันทั้ง 3 ส่วน คือ
- IoT: Data Collection Through IoT เป็นพื้นฐานโครงสร้าง (Infrastructure) ทำหน้าที่เก็บข้อมูลมาเยอะๆ จากเซนเซอร์ของสิ่งต่างๆ ที่เราใช้งาน เช่น หลอดไฟ อุณหภูมิ ฝุ่น เป็นต้น
- Big Data: Capture, Storage, and Analysis of Data-IoT: Data Collection Through IoT จากแหล่งเก็บข้อมูลเดิมๆ ซึ่งเก็บข้อมูลจำนวนมหาศาลไม่พอ ก็จะมีเทคโนโลยีใหม่เข้ามาช่วยเก็บ และวิเคราะห์ข้อมูลด้วย แต่เราจะไม่หยุดเพียงเท่านี้ไม่อย่างนั้นความฉลาดจะไม่เกิดขึ้น
- AI: Data-Based Learning พวก Deep Learning มาช่วยให้เกิดข้อมูล ข้อมูลดิบจากการจัดเก็บ ถูกกรอง และจัดแบ่ง
ให้เป็นระเบียบในเบื้องต้นได้ด้วย AI แล้วจึงให้คนมาปรับแต่งและตรวจสอบก่อนส่งต่อเข้ากระบวนการเรียนรู้เพื่อสร้างเครื่องมือมาให้บริการ
Concept การให้บริการของซอฟต์แวร์
เดิมการให้บริการของซอฟต์แวร์แทนที่จะต้องลงแผ่น เช่น Microsoft Word, Adobe ในเครื่องคอมพิวเตอร์ ซึ่งมีข้อด้อยอยู่มาก ทำให้บริษัทผลิตซอฟต์แวร์ต่างๆ หันมาให้บริการในรูปแบบ Software as a Service (SaaS) หรือเรียกว่า On Demand Software คือรูปแบบการให้บริการซอฟต์แวร์ผ่านทางอินเทอร์เน็ต Web Server คล้ายกับการเช่าใช้ เพียงแค่ผู้ซื้อจ่ายค่าซอฟต์แวร์ตามลักษณะการใช้งานที่ต้องการ (Pay-as-you-go) เช่น ตามจำนวนผู้ใช้และตามระยะเวลาที่ต้องการใช้ เพียงเท่านี้ ผู้ซื้อก็สามารถเข้าใช้งานได้ ปัจจุบันได้เปลี่ยนรูปแบบการให้บริการในลักษณะ Micro Service ซึ่งย่อยลงไปอีก เทรนด์ที่กำลังเข้ามาคือ การให้บริการในรูปแบบ AIaaS (Artificial Intelligence as a Service) หรือเรียกว่า การให้บริการซอฟต์แวร์ด้วย Cloud AI
การส่ง Input ด้วยภาษาหนึ่งแล้ว Output ออกมาเป็นอีกภาษาหนึ่ง เช่น การส่ง Input เป็นข้อความภาษาไทยแล้วแสดงผล Output เป็นภาษาอังกฤษ หรือการส่งรูปภาพเข้าสู่บริการ Micro Service ที่เป็นการนับใบหน้า ระบบก็จะนับใบหน้าว่าในห้องนี้นั่งกันอยู่กี่คน ซึ่งการใหบ้ ริการแบบ Micro Service นี้กำลังเป็นเทรนด์ที่ให้บริการกันอยู่
ยักษ์ใหญ่ในตลาด Cloud & AI
มี 4 บริษัทยักษ์ใหญ่ระดับโลกที่ให้บริการเกี่ยวกับ AI ได้แก่ Google Cloud, Microsoft Azure, Amazon, IBM Cloud ซึ่งเมื่อมีตรงนี้แล้วบริษัทต่างๆ ก็สามารถเข้าไปใช้งานได้ แต่ก็ไม่สามารถ Plug and Play ได้เช่นกัน เช่น กรณีมีข้อมูลแล้วอยากให้ทำ AI ก็ไม่สามารถทำได้ เพราะยังขาดความรู้เชิงลึกในสาย Computer Science คือมีบริการให้ใช้ แต่ถ้า Apply ผิด ก็ประยุกต์ใช้ได้ไม่ถูก ซึ่งบุคคลที่ทำหน้าที่เหล่านี้คือ Data Scientist บุคคลเหล่านี้จะต้องมีทักษะรอบด้าน Programming Database, Communication, Visualization Skill และความรู้แบบเฉพาะทาง เช่น Financial ความรู้ในทางที่ต้องการจะนำไปประยุกต์ใช้งานในด้านอื่นๆ
โดยเมื่อเร็วๆ นี้ มีข่าวด้านไอทีว่ามีการสำรวจบริษัทต่างๆ ในยุโรปกว่า 2,830 บริษัท พบว่ากว่า 40% ที่เป็นบริษัทด้าน AI ไม่ได้ใช้ AI at All หมายความว่าไม่ได้ใช้ AI เลย แต่บริษัทเหล่านั้น ก็ยังเคลมว่ามี AI ในบริษัท สาเหตุที่เป็นแบบนั้น เพราะเมื่อเคลมสถานะบริษัทว่าเป็น Startup ด้าน AI จะได้รับเงิน Funding เฉลี่ยแล้วกว่า 15% มากกว่าบริษัทที่ไม่มี AI สรุปแล้วเท่และได้เงินด้วย
จะเห็นว่า AI ในโซนยุโรป อเมริกา มีการพัฒนาไปได้ไกลมาก แต่ในความจริงแล้วไม่สามารถ Apply ได้เยอะขนาดนั้นเพราะสิ่งที่ยังขาดคือทักษะและบุคลากร ซึ่งการ Apply นั้นก็ต้องดูด้วยว่าเหมาะสมหรือเปล่า
The Valley of Death
จากงานวิจัยในห้องแลปพัฒนาสู่ต้นแบบ ฝ่าฟันจนมี Business Model เพื่อให้เกิดการซื้อจากคนที่ยอมจ่ายเงินการ Commercialization คือส่วนที่ต้องใช้เวลา เนื่องจากเทคโนโลยีต้องสามารถตอบโจทย์ (Pain Point) ว่าเข้าไปช่วยให้ชีวิตดีขึ้นยังไงบ้าง เช่น ทำงานให้ง่ายและเร็วขึ้น เนคเทคในฐานะที่มีความเชี่ยวชาญด้านการวิจัยและพัฒนา R&D จึงตั้งบทบาทเป็น Service และพัฒนา Module AI ให้ดีที่สุด เพื่อให้ผู้ใช้ได้มีโอกาสนำไปพัฒนาต่อยอดให้ทั่วถึงทั้งระดับ SME หน่วยงานภาครัฐ เอกชน รวมถึง Startup และเปิดโอกาสให้องค์กรณ์ต่างๆ ได้เป็นผู้ดำเนินการแทน เพราะว่าพวกตัวแทนจากบริษัทจะรู้ดีว่า Pain Point ของบริษัทตัวเองอยู่ตรงไหน ตรงนี้สามารถตอบโจทย์อะไรได้บ้าง
จากกราฟนี้จะเป็นสิ่งที่จะบอกได้ว่า AI Service Platform ที่เนคเทคพัฒนาจะตอบโจทย์ได้จนถึงส่วนของ Technology Transfer โดยจะพัฒนาให้ดีที่สุดแล้วปล่อยให้หน่วยงานต่างๆ นำไปใช้งาน
AINRG (Artificial Intelligence Research Group)
AI ในเนคเทคมีหน่วยงานที่มีประสบการณ์กว่า 20 ปี ปัจจุบันมีชื่อว่าหน่วยวิจัยปัญญาประดิษฐ์ AINRG (Artificial Intelligence Research Group) วิจัยและพัฒนาเทคโนโลยีแพลตฟอร์มทางด้านปัญญาประดิษฐ์และการประมวลผลภาษาไทย เพื่อสนับสนุนการใช้งานและต่อยอดในภาคอุตสาหกรรมบริการภายในประเทศ
Mission การทำ R&D ทางด้าน AI and NLP เนคเทคมีความเชี่ยวชาญพอสมควรจากประสบการณ์ 20 ปี เพื่อให้เกิดการใช้งาน AI ภายในประเทศไทย หน้าตาของ AI Service Platform มี 3 ส่วน
1. การประมวลผลภาษา
เนคเทคมีความเชี่ยวชาญในภาษาไทย ไม่ว่าจะเป็นการตัดคำการวิเคราะห์ไวยากรณ์ (Grammar) การรู้จำชื่อบุคคล ชื่อสถานที่การวิเคราะห์คำเฉพาะการแปลภาษา การวิเคราะห์ขั้วอารมณ์ของข้อความ โดยจะรวบรวมประยุกต์สิ่งเหล่านี้ให้อยู่ในรูปแบบบริการที่มีการจัดการ Input ที่ส่งเข้ามา และตอบกลับเป็น Output ที่เป็นรูปแบบเดียวกัน
2. Vision คือการประมวลผลพวกรูปภาพและวิดีโอ
ด้านการประมวลผลรูปภาพของเนคเทค ทีมวิจัยและพัฒนามีความเชี่ยวชาญในด้านต่างๆ ดังต่อไปนี้
- CR ในมิติที่เฉพาะลงไป เช่น สามารถ Customize กับป้ายจราจร ซึ่งเนคเทคจะพยายามทำในมุมที่ลึกลงไป
- Object Recognition มีการใช้งานจำนวนมาก โดยทางเนคเทคมีทีมนักวิจัยที่มีประสบการณ์ทางด้านนี้ เช่น การถ่ายภาพใบข้าว แล้ว Identify ว่ามีโรคอะไรเกิดขึ้นบ้างในใบข้าว และสามารถที่จะ Apply ความรู้ตรงนี้ได้เพื่อต่อยอดต่อไป
- Face Analytics เป็นสิ่งหนึ่งที่จำเป็นต้องทำเนื่องจากมี Data Privacy แม้ว่าปัจจุบันหลายๆ บริษัทไม่ว่าจะ 4 บริษัทยักษ์ใหญ่ที่ให้บริการด้าน Cloud และ AI ต่างก็มี หรือแม้กระทั่งบริษัทมือถือเจ้าใหญ่ในประเทศจีนก็มีใช้ แต่ถ้าประเทศไทยเราไม่มีสิ่งนี้ ก็จำต้องนำเข้าองค์ความรู้นี้จากต่างประเทศ ดังนั้นใบหน้าของเราแทนที่จะอยู่ในหน้าหน่วยงานเรา ก็จะไปแสดงผลอยู่ใน Cloud ส่วนไหนของโลกก็ไม่รู้ นี่คือเหตุผลว่าทำไมประเทศไทยถึงจำเป็นต้องมีและทำขึ้นมาก ซึ่งถ้าลองย้อนกลับไปดูเนคเทคมี Open Source ที่ค่อนข้างใช้งานได้ดีอยู่แล้ว เราเพียงวิจัยพัฒนาต่อยอดให้ดีขึ้นไปอีกด้วยคอนเซ็ปต์ที่ว่า “นำสิ่งที่มีอยู่แล้ว มาต่อยอดให้ดีขึ้น”
- Person & Active Analytics คือ การ Detect Activity เช่น การยกมือถือ วางของทิ้งไว้ หรือมีแอปพลิเคชันเชิงถ่ายวิดีโอ แล้วดูพฤติกรรมการใส่หมวกกันน็อก ใช้ในการ Detect เพื่อความปลอดภัยได้
3. Conversation (การสนทนา) ซึ่งได้รับความนิยม
เนคเทคยังมีความชำนาญด้าน Speech to Text และ Text to Speech ซึ่งเป็นเทคโนโลยีที่พัฒนามาอย่างต่อเนื่อง โดยเน้นความเชี่ยวชาญในการรู้จำและสร้างสัญญาณเสียงภาษาไทย แล้วแปลเป็นข้อความผ่าน Chatbot ให้เข้าใจว่าเป็น Intent Sentiment แล้วตอบโต้ออกมาเป็นเสียง
Strength & Differentiation
- ความเชี่ยวชาญด้านการประมวลผลภาษาไทย
- พร้อมแนะนำและให้คำปรึกษา
- สร้างโมเดลที่แตกต่างจากทั่วไป โดยสร้างการจำลองโมเดลที่บ่งบอกถึงลักษณะเฉพาะที่ เช่น ส่งภาพเข้าไปแล้วสามารถแสดงผลว่านี่คือ ส้มตำ ผัดไท รวมทั้งด้านวัฒนธรรม เช่น วัดวาอาราม สามารถถ่ายรูปพระแล้วบอกได้ว่านี่คือศาสนาพุทธ
Virtual Assistant: JibJib
ภายใน ‘JibJib’ ประกอบด้วยเทคโนโลยี 3 ตัวหลักของเทคโนโลยีหมวด Conversation อันได้แก่ Speech to Text (Partii), Chatbot (Abdul) และ Text to Speech (Vaja) ที่มีความสามารถในการฟังคำพูด/คำสั่งภาษาไทย ประมวลผลคำตอบและพูดตอบด้วยภาษาไทย
JibJib ถูกนำเสนอด้วยลักษณะของ 3D Avatar ที่เลียนแบบลักษณะคน โดยใส่ Character ความเป็นไทย โดยสามารถนำไปประยุกต์ใช้เป็น Digital Reception ตามร้านต่างๆ หรืองาน Expo สำหรับรองรับคำถามคำตอบที่ผู้ร่วมงานสงสัยได้ในเบื้องต้น
Technology Roadmap
เราจะพัฒนา Feature จากทุกแง่มุมเพื่อวางงานวิจัยไปข้างหน้า โดยเก็บข้อมูลความต้องการของผู้ใช้งานเพื่อนมาปรับปรุงว่าสามารถเชื่อมโยงกับงานวิจัยของเนคเทคได้มากน้อยแค่ไหน เป้าหมายเพื่อตอบโจทย์อุตสาหกรรมได้
อนาคตเป็นสิ่งที่น่าจับตามองว่าวันนี้เนคเทคได้ดำเนินการกับหลายภาคส่วน การสร้างพันธมิตร บ่มเพาะก่อเกิดเป็น Community ด้าน AI รวมทั้งคาดหวังว่าหากประเทศไทยมี AI Service Platform ที่สามารถนำไปประยุกต์ใช้ทั้ง AI ด้านภาษา ด้านการมองเห็น ด้านการสนทนา แล้วเนคเทคพร้อมขยายผลและส่งเสริมการใช้งานอย่างแน่นอน
แผนการพัฒนา AI Service Platform มีในระยะเวลา 3 ปี ให้ติดตามและเท่าทันต่อเทคโนโลยีด้าน AI ที่กำลังถูกพัฒนา และเปลี่ยนแปลงไปอย่างรวดเร็ว โดยปีที่ 1 (พ.ศ. 2563) โครงการจะเริ่มพัฒนาแพลตฟอร์มด้วยการนำเทคโนโลยีด้านปัญญาประดิษฐ์ที่มีอยู่ในปัจจุบันของเนคเทคมาเริ่มให้บริการในรูปแบบ Web Service API ซึ่งจะทำให้ระบบสามารถให้บริการใช้งาน Engine ต่างๆ ได้ตามคุณสมบัติดังต่อไปนี้ Sentiment Analysis (S-Sense): สามารถจัดข้อความภาษาไทยลงกลุ่ม Sentiment ที่กำหนดไว้ได้โดยใช้ Deep Learning, Machine Translation (Parsit): สามารถแปลข้อความภาษาไทยในโดเมนการท่องเที่ยวให้เป็นภาษาอังกฤษได้ Face Analytics: สามารถระบุใบหน้าคนในภาพได้ถูกต้องจากการฝึกฝนจากใบหน้าคนไทยเพิ่มขึ้น Person & Activity Analytics: สามารถตรวจจับและวิเคราะห์ส่วนของร่างกายคนได้ Thai OCR (ArnThai): สามารถวิเคราะห์ตัวอักษรและโครงสร้างของเอกสารที่ได้จากภาพสแกนได้ Object Detection: สามารถตรวจจับยานยนต์จากภาพได้ Speech-to-Text (Partii): สามารถรู้และจำคำพูดภาษาไทยได้โดยใช้ LSTM-Based Neural Networks, Text-to-Speech (Vaja): สามารถสร้างเสียงพูดภาษาไทยได้โดยใช้ Deep Neural Network และ Chatbot (ABDUL): สามารถโต้ตอบกับผู้ใช้ตาม Pattern ที่กำหนดไว้ได้
ในระหว่างการให้บริการ แพลตฟอร์มจำเป็นต้องพัฒนาโครงสร้างอย่างต่อเนื่องเพื่อให้เท่าทันเครื่องมือและเทคโนโลยีที่ห้องปฏิบัติการวิจัยต่างๆ จำเป็นต้องใช้ รวมถึงรองรับการปรับแต่งเครื่องมือต่างๆ ให้สามารถทำงานตาม Application Program Interface (API) ที่อาจเปลี่ยนแปลงไปตามเทคโนโลยีได้ โดยในปีที่ 2 และ 3 (พ.ศ. 2564-2565) AI Engine ต่างๆ จะมีความสามารถเพิ่มขึ้น และพร้อมให้บริการตามแผนวิจัยและพัฒนาดังนี้
- S-Sense: ในปีที่ 2 สามารถวิเคราะห์ Intent ในข้อความภาษาไทยได้ ส่วนในปีที่ 3 สามารถวิเคราะห์ Emotion ของข้อความภาษาไทยได้
- Parsit: ในปีที่ 2 สามารถแปลงข้อความภาษาไทยในโดเมนการท่องเที่ยวเป็นภาษาจีนได้ ส่วนในปีที่ 3 สามารถแปลงข้อความภาษาไทยในโดเมนการท่องเที่ยวเป็นภาษาอาเซียนได้
- Face Analytics: ในปีที่ 2 สามารถวิเคราะห์อารมณ์ของคนจากภาพได้ ส่วนในปีที่ 3 สามารถรู้และจำหน้าของคนไทยได้แม่นยำยิ่งขึ้น
- Person & Activity Analytics: ในปีที่ 2 สามารถวิเคราะห์องค์ประกอบของภาพได้ดียิ่งขึ้น และสามารถแยกเพศของคนได้ ส่วนในปีที่ 3 สามารถบ่งบอกประเภทของกิจกรรมของบุคคลในภาพได้
- ArnThai: ในปีที่ 2 สามารถวิเคราะห์ตัวอักษรที่ใช้ Font ต่างๆ และวิเคราะห์ตารางจากเอกสารที่ได้จากภาพสแกนได้ ส่วนในปีที่ 3 สามารถวิเคราะห์ตัวอักษรจากเอกสารที่ได้จากกล้องดิจิทัลได้
- Object Detection: ในปีที่ 2 สามารถใช้ Deep Learning มาวิเคราะห์วัตถุในภาพทางการเกษตรได้ ส่วนในปีที่ 3 สามารถเรียกใช้เครื่องมือบน Embedded System ได้โดยเน้นการวิเคราะห์ภาพอาหารไทย และโดเมนการท่องเที่ยว
- Partii: ในปีที่ 2 สามารถรู้และจำเสียงพูดแม้มีเสียงรบกวนได้ส่วนในปีที่ 3 สามารถแปลงสัญญาณเสียงพูดเป็นอักขระภาษาไทยได้โดยตรง
- Vaja: ในปีที่ 2 สามารถให้บริการสร้างเสียงพูดภาษาไทยตามน้ำเสียงที่กำหนดได้ส่วนในปีที่ 3 สามารถให้บริการสร้างเสียงพูดภาษาไทยตามสำเนียงท้องถิ่นที่กำหนดได้
- Chatbot: ในปีที่ 2 สามารถโต้ตอบได้ตามบทสนทนาที่กำหนด ส่วนในปีที่ 3 สามารถตอบโต้บทสนทนาได้โดยอัตโนมัติ
Source: นิตยสาร Electricity & Industry Magazine ปีที่ 26 ฉบับที่ 5 กันยายน-ตุลาคม 2562 คอลัมน์ Articleโดย NECTEC