เก็บตก Microsoft Underground Tour – พบปะทีมวิจัยของ Microsoft

มาถึง Redmond ก็ต้องถ่ายกับป้ายนี่ดิ
วันแรก (จริงๆ) ของการมา Microsoft Underground Tour ถึงถิ่น Redmond เลยก็แบ่งออกเป็นสองช่วงครับ ช่วงเช้าได้มาฟังวิสัยทัศน์ และเป้าหมายอันทะเยอทะยานของ Microsoft ก่อน แล้วตามมาด้วยการพบปะกับทีมวิจัยของ Microsoft ที่นำโครงการต่างๆ ทั้งที่มีให้ใช้ให้ดาวน์โหลดแล้ว กับที่ยังอยู่ในระหว่างการทดลองมาเดโมหรือมาเล่าให้ดูกัน น่าสนใจมาก เลยอยากเล่าสู่กันอ่านซักหน่อย

จริงๆ เขาแบ่งเดโมให้ดูเป็นหลายกลุ่มมากๆ แต่หลายๆ อัน มันเป็นเรื่องเดียวกัน (แต่คนละโปรเจ็ค) ผมเลยขอเอามาเล่าแบบจัดกลุ่มซะใหม่นะครับ

 

Microsoft Intelligent API ต่างๆ

หลายๆ คนเรียกว่าเป็นกลยุทธ … จะเรียกยังงั้นก็ได้ แต่ทิศทางของ Microsoft ภายใต้การนำของ Satya Nadella นั้นคือ Mobile-first และ Cloud-fist ซึ่งผมคิดว่า Microsoft API นี่ก็เป็นหนึ่งในกลยุทธของ Microsoft ในด้านนี้ เพราะมันคือการเปิดให้นักพัฒนาได้มาใช้ศักยภาพด้าน Cloud processing ต่างๆ ของ Microsoft ซึ่งก็มีทั้งแบบฟรี (จำกัดจำนวน Transaction) และแบบเสียเงิน

 

Microsoft API ที่ให้บริการ ทางนั้นเรียก Intelligent API

 

บริการ Intelligent API หรือ Cognitive Services ที่ Microsoft มีให้ แบ่งออกเป็น 5 หมวดหมู่หลักๆ ครับ คือ

  • Vision จะเน้นไปที่โปรแกรมตรวจจับใบหน้าและรูปภาพ เช่น การสร้างคำบรรยายภาพอัตโนมัติ การแยกแยะอารมณ์จากใบหน้า หรือการวิเคราะห์วิดีโอเพื่อลดการสั่นของภาพ เป็นต้น
  • Speech ก็จะเป็นเรื่องการจดจำเสียง เพื่อแปลงคำพูดเป็นตัวอักษร หรือ จดจำเสียงเพื่อใช้ในการระบุตัวตน เป็นต้น
  • Language อันนี้จะเป็นเรื่องการแปลภาษา การตรวจสอบตัวสะกด การสั่งงานด้วยเสียง หรือแม้แต่การสร้างแชทบอท เพื่อใช้ในการโต้ตอบอัตโนมัติ
  • Knowledge ก็จะเป็นเรื่องการสร้างความสัมพันธ์ระหว่างงานบทความ งานวารสาร กับผู้แต่ง การสร้างระบบวิเคราะห์ข้อมูลแล้วแนะนำสินค้าให้ลูกค้า เป็นต้น
  • Search ก็จะเป็น API สำหรับการใช้ Bing Search ไม่ว่าจะค้นหาเว็บ รูปภาพ วิดีโอ ข่าว รวมถึงการแนะนำคำสำหรับใช้ในการค้นหาด้วย

รายละเอียดเพิ่มเติม สำหรับนักพัฒนาสามารถไปอ่านได้ที่เว็บไซต์ https://www.microsoft.com/cognitive-services/en-us/apis

แน่นอนว่าสื่ออย่างพวกเราที่ไม่ใช่นักพัฒนาโปรแกรม ก็อาจจะยังไม่เห็นภาพชัดนักว่ามันเอาไปทำอะไร ประยุกต์ใช้ยังไงได้ ก็มีเดโมอื่นๆ ไว้ให้พวกเราได้ดูกันครับ เช่น Bot Framework ที่ Dan Driscoll, Senior Research Software Development Engineer โชว์ให้เราดูครับ (รายละเอียดสำหรับนักพัฒนา ไปที่ https://dev.botframework.com/)

 

กำลังฟังเขาอธิบายเรื่องแชทบอทเลย

Photo credit: Microsoft [Used with permission from Microsoft]

 

Bot Framework เป็นตัวช่วยนักพัฒนาให้สามารถพัฒนาแชทบอทได้ง่ายขึ้น โดยสอนให้มันเรียนรู้คำพูดของผู้ใช้งาน และให้สามารถโต้ตอบได้เหมือนกับผู้ใช้งานคุยอยู่กับคนจริงๆ และไม่เพียงแต่สามารถโต้ตอบการสนทนาทั่วไปได้เท่านั้น แต่ด้วย API ในการแปลภาษา ทำให้นักพัฒนาสามารถสร้างแชทบอทที่โต้ตอบกับผู้ใช้งานเป็นภาษาต่างๆ ได้ โดยไม่ต้องมีความรู้ภาษานั้นๆ เลย (แต่แน่นอนว่ามันยังแปลไม่สมบูรณ์ 100% นัก)

 

สามารถแชทกับบอทและคุยเป็นภาษาต่างๆ ได้ ผ่าน API แปลภาษา

 

เช่น ในกรณีศึกษาที่เดโมให้ดู เป็นแชทบอทของโรงแรม ที่เราสามารถขอข้อมูลต่างๆ จากบอทได้ และเมื่อเราอยากได้เป็นภาษาไทย เราก็สามารถบอกกับบอทได้ว่าเราอยากคุยเป็นภาษาไทย จากนั้นทุกประโยคที่บอทโต้ตอบ ก็จะถูก API ในการแปลภาษา แปลภาษาออกมาเป็นภาษาไทยได้ แน่นอนว่าเราก็สามารถพิมพ์ไทยโต้ตอบได้เช่นกัน (แต่ในเครื่องเดโมไม่มีคีย์บอร์ดภาษาไทยจ้า)

อย่างไรก็ดี การแปลภาษาด้วยเครื่องก็ยังมีข้อจำกัดอยู่ และ Bot Framework ในปัจจุบัน ยังจำเป็นต้องมีนักพัฒนามาเขียนโค้ดเพื่อสร้างบอทอยู่ แต่ในอนาคต เป้าหมายของ Microsoft คือการสร้างเครื่องมือในการสร้างแชทบอทแบบที่ไม่จำเป็นต้องเขียนโค้ดใดๆ เลย

 

Skype Translator แปลภาษาสดๆ ระหว่างการคุย Skype

 

ในส่วนของ API ด้านการแปลภาษา เราได้เห็นการนำบริการ Microsoft Translator ไปต่อยอดหรือประยุกต์ใช้ที่น่าสนใจมาก เช่น ตัวโปรแกรม Skype ของ Microsoft เอง ก็สามารถแปลภาษาได้ 8 ภาษา แบบสดๆ ระหว่างการสนทนาผ่าน Skype เลยครับ โดยผมได้ลองคุยกับทีมงานของ Microsoft ที่พูดอารบิก ในขณะที่ผมพูดภาษาอังกฤษ มันขึ้น Subtitle ให้สดๆ เลย แจ่มมากๆ

นอกจากนี้ยังมีการสาธิตการแปลภาษาสดๆ โดยมีการผนวก API เข้ากับระบบโทรศัพท์ ทำให้ผมสนทนากับอีกฝ่ายที่พูดภาษาฝรั่งเศสผ่านทางโทรศัพท์ได้ โดยระบบจะแปลเป็นภาษาอังกฤษให้ผมอีกครั้ง (และเป็นเป็นภาษาฝรั่งเศสให้คู่สนทนา) ซึ่งอันนี้ใช้โทรศัพท์ธรรมดาๆ โทรกันเลยอ่ะ

 

ใช้ API แปลภาษาของ Microsoft ในการแปลเป็นภาษามือก็ได้

 

การต่อยอดอีกแบบที่น่าสนใจคือ การเพิ่ม “ภาษามือ” ของประเทศต่างๆ เข้ามา โดยใช้ API ในการตรวจจับคำพูด จากนั้นแปลเป็นภาษามือ ซึ่งตรงนี้น่าจะช่วยแก้ปัญหาในการสนทนากับผู้พิการได้ ซึ่งผมว่ามันยอดมาก … แน่นอน API เรื่องการแปลภาษามันยังแปลได้ไม่สมบูรณ์นัก แต่ความถูกต้องก็อยู่ในระดับพอสมควร (อย่าใส่แสลงให้มากก็โอเคอยู่) และยังมีข้อจำกัดในเรื่องภาษาที่รองรับ การนำไปใช้จริงในเชิงพาณิชย์จึงยังต้องระวัง แต่ความเจ๋งของระบบของ Microsoft อีกอย่างคือ มันแยกแยะคำที่พูดตามความเคยชินของมนุษย์ เช่น การเว้น อ่า เอิ่ม หรือการพูดคำเดิมซ้ำๆ อย่าง I .. I .. I think อะไรแบบนี้ เพราะธรรมชาติของมนุษย์เวลาพูด มักจะมีการอ่า เอิ่ม หรือการพูดคำซ้ำบางอย่าง เพื่อซื้อเวลาในการคิดก่อนพูดอยู่

 

Microsoft CaptionBot เป็นอีกตัวอย่างของ Intelligent API ของ Microsoft

 

CaptionBot ของ Microsoft ก็เป็นอีกตัวอย่างนึงของ Intelligent API ที่น่าสนใจครับ คือ มันสามารถวิเคราะห์รูปภาพ และใส่คำบรรยายภาพได้โดยอัตโนมัติ นอกจากนี้ยังมีฐานข้อมูลใบหน้าคนดังด้วย ผมลองสแกนรูปราฟาเอล นาดาล มันก็รู้จัก (แต่สแกนภาพโอบามาแล้วไม่รู้จัก … ฮา) โดยมันจะตอบว่ามันมองว่ารูปนี้เป็นรูปอะไร ใครทำอะไร อย่างไร และมีอารมณ์ความรู้สึกเป็นยังไง … ใครอยากลองเล่น แวะไปที่ https://www.captionbot.ai/ โลด

 

Image recognition API ช่วยวิเคราะห์รูปได้

 

ความสามารถในการวิเคราะห์รูปนี่สำคัญนะครับ และในอนาคตจะยิ่งสำคัญมากขึ้น เพราะมันมีบริการอัพโหลดภาพต่างๆ มากมาย ทั้งบนโลกโซเชียลเน็ตเวิร์ก และอื่นๆ ซึ่งบางครั้งเราต้องการความสามารถนี้มาอำนวยความสะดวกบางอย่าง เช่น Facebook สามารถตรวจจับใบหน้าและแท็กชื่อของคนในภาพให้ได้โดยอัตโนมัติ หรือการใช้ Intelligent API ในการวิเคราะห์ภาพ และประเมินว่าภาพมีลักษณะลามกอนาจารหรือไม่ โดยเกณฑ์คะแนนสองอัน คือ Adult ซึ่งชี้ว่าเป็นภาพที่เหมาะสำหรับผู้ใหญ่หรือเด็ก (ยิ่งใกล้ศูนย์แสดงว่าเด็กดูได้ แต่ยิ่งใกล้ 1 แสดงว่าเป็นเนื้อหาสำหรับผู้ใหญ่) กับ Racy คือ ระดับการเปิดเผยเนื้อหนัง โดย 0 หมายถึงไม่เปิดเผยให้เห็นผิวพรรณเลย ในขณะที่ 1 นี่ก็คืออล่างฉ่างล่ะ)

 

Project Natick เมื่อ Data Center ต้อง Green

โครงการ Natick คือแนวคิดการนำ Data Center ของ Microsoft ไปไว้ใต้มหาสมุทร ซึ่งจะทำให้ได้ประโยชน์หลายอย่าง เช่น ระบบระบายความร้อนดีขึ้น เนื่องจากได้ความเย็นของมหาสมุทรมาช่วย และสามารถเคลื่อนย้าย Data Center ได้สะดวก เพราะแค่ย้ายตัวโมดูลเท่านั้น ซึ่งผิดกับ Data Center แบบเดิมๆ ที่เป็นสิ่งปลูกสร้าง ทำให้ยุ่งยากในการขยับขยายหรือโยกย้าย ในขณะที่ Data Center ใต้ทะเล หากต้องการเพิ่มหรือลดจำนวน ก็แค่ไปหย่อนเพิ่มหรือเอาออก หรือจะย้ายไปที่อื่นก็ทำได้ง่ายๆ … นอกจากนี้ การนำ Data Center ใต้น้ำก็ยังช่วยให้รอดพ้นจากภัยพิบัติบนพื้นดินหลายๆ อย่างได้ และทำให้ Microsoft สามารถวาง Data Center ไว้ใกล้ๆ กับลูกค้าได้ด้วย

 

 

ปัจจุบันยังเป็นการทดลองอยู่ โดยลองเอาไปไว้ใต้น้ำระยะลึกประมาณ 12 เมตร ครับ ซึ่งลองไป 90 วัน ก็ประสบผลสำเร็จดี ที่เหลือผมเข้าใจว่าก็จะเป็นเรื่องของการอัพสเกลของตัว Data Center, การทดลองใช้พลังงานจำพวก Renewable มาให้พลังงานไฟฟ้ากับ Data Center แทนที่จะต้องเดินสายไฟแทน (ส่วนสายเคเบิ้ลสำหรับดาต้ายังจำเป็นอยู่ แต่ใต้มหาสมุทรเราก็มีสายพวกนี้เดินยั้วเยี้ยครับ โดยเฉพาะในสหรัฐอเมริกา)

สำหรับคนที่เป็นห่วงเรื่องสภาพแวดล้อม ทางทีมนักวิจัยแจ้งว่า ได้มีการคำนวณดูแล้วว่าความร้อนที่เกิดขึ้นจากตัว Data Center จะส่งผลต่ออุณหภูมิของน้ำทะเลรอบๆ ไหม ก็พบว่าจากการคำนวณแล้ว มันไม่ส่งผลกระทบอย่างมีนัยสำคัญ (อารมณ์ประมาณว่า น้ำมันกระจายความร้อนได้เร็วกว่าอากาศ และน้ำในมหาสมุทรก็มีเยอะมาก จนความร้อนมันกระจายไปเร็ว จนไม่กระจุกตัว อะไรประมาณนี้)

อย่างไรก็ดี แนวทางในการวาง Data Center แบบนี้ ก็น่าจะเป็นแบบการขอสัมปทานจากภาครัฐของประเทศเจ้าของน่านน้ำน่ะครับ คล้ายๆ การขุดเจาะน้ำมันหรือก๊าซธรรมชาติ เพราะคงไม่สามารถอยู่ๆ เอาเรือออกไปแล้วเอา Data Center ไปหย่อนได้หรอก

 

Data visualization แปลงข้อมูลเป็นภาพให้เข้าใจได้ง่าย และรวดเร็ว

เดโมนี้มันคือการเอาสิ่งที่เราเรียนตั้งกะตอนเด็กๆ มาผสมผสานกับความเป็นไซไฟเอามากๆ ครับ มันคือการเอาข้อมูลจาก Microsoft Excel เช่น ข้อมูลประวัติการเกิดพายุทอนาโดในอเมริกากว่าสี่หมื่นครั้งมาป้อนเข้าไปในโปรแกรม Data visualization ที่ทีมวิจัยพัฒนาขึ้นมา แล้วมาแสดงบน Surface Hub (จอสัมผัสจอยักษ์เบ้งของ Microsoft) จากนั้น โปรแกรมจะทำการแปลงข้อมูลดังกล่าว ให้กลายเป็นกราฟสามมิติแสดงบนหน้าจอ

 

แสดงข้อมูลการเกิดพายุทอนาโดเป็นฮิสโตแกรมบนแผนที่แบบสามมิติ

 

แล้วเราก็สามารถโยกกราฟ หมุนกราฟ เปลี่ยนมุมมอง เพิ่มมิติในการแสดงผลข้อมูล (เช่น ความแรงของพายุ ปีที่เกิด รัฐที่เกิดพายุ และเวลาที่เกิดพายุ) ซึ่งจากที่ Dave Brown, Senior Research Software Development Engineer แสดงให้พวกเราได้ดู การแปลงข้อมูลแบบนี้ ทำให้เราสังเกตเหตุรูปแบบบางอย่างของการเกิดพายุทอนาโดได้ เช่น รัฐใดบ้างที่เจอพายุบ่อยๆ พายุเกิดบ่อยในช่วงเดือนไหน และเวลาไหนของวัน อะไรแบบนี้ ซึ่งจะช่วยให้ผู้เกี่ยวข้องสามารถวางแผน เตรียมการรับมือได้

 

แสดงข้อมูลการเกิดแผ่นดินไหวบนลูกโลกจำลอง สามมิติ

 

ตัวโปรแกรมไม่เพียงแค่เชื่อมโยงข้อมูลกับแผนที่เท่านั้น แต่รูปแบบในการนำเสนอก็มีความยืดหยุ่น เราสามารถนำเสนอข้อมูลในแบบลูกโลกแบบนี้ก็ได้ การปรับเปลี่ยนมุมมองก็ไม่ยาก และเมื่อใช้ร่วมกับ Surface Pen (สำหรับ Surface Hub มันจะด้ามใหญ่หน่อย) ก็จะสามารถ Highlight ข้อมูลที่ต้องการติดตาม แล้วเมื่อเปลี่ยนมุมมอง เราก็ยังจะเห็นข้อมูลดังกล่าวถูก Highlight อยู่ หรือจะแตะค้างเพื่อดูรายละเอียดของข้อมูลก็ได้ … ซึ่งหลังจากได้ลองด้วยตัวเองแล้ว ขอบอกว่า เมื่อมันมาใช่ร่วมกับ Surface Hub ทำให้การโยกหรือหมุนกราฟิกทำได้ด้วยการแตะแล้วลาก มันทำให้รู้สึกว่าอยู่ในหนังไซไฟจริงๆ ครับ นี่ถ้ามันแสดงเป็นภาพโฮโลแกรมได้นี่คงแบบ ไฮโซมากๆ

ณ ตอนนี้ โปรแกรม Data Visualizer ตัวนี้ยังเป็นตัวทดลอง ไม่มีให้ดาวน์โหลดไปใช้งานนะครับ แอบเสียดาย ถ้าดาวน์โหลดไปลองได้เนี่ย ผมเอามาเล่นกะ Surface Pro 3 เพลินเลยล่ะ แต่ในอนาคต Microsoft ก็คงเปิดให้เราๆ ท่านๆ หรืออย่างน้อยๆ ก็ระดับองค์กรธุรกิจได้นำไปใช้เพื่อวิเคราะห์ข้อมูลที่นับว่าก็เป็นระดับ Big Data มากขึ้นเรื่อยๆ ล่ะ

 

Microsoft Hyperlapse

เป็นโปรแกรมที่ Microsoft ปล่อยมาตั้งกะปีที่แล้ว และมีหลายๆ คนเขียนถึงไปแล้วในประเทศไทย แต่ก็อาจจะยังมีอีกหลายๆ คนที่ไม่รู้ว่ามี ซึ่งแนวคิดของ Microsoft คือ อยากให้คนทั่วไปสามารถสร้างวิดีโอแบบ Timelapse (วิดีโอที่มันวิ่งเร็วกว่าปกติ ซึ่งเหมาะสำหรับการแสดงให้เห็นถึงการเคลื่อนไหวแบบเร็วๆ หรือการเปลี่ยนแปลงของเวลาแบบเร็วๆ) แบบมืออาชีพได้ฟรีๆ ครับ

 

Microsoft Hyperlapse สร้าง Timelapse video ง่ายๆ เจ๋งๆ และฟรีๆ

 

โปรแกรม Hyperlapse ไม่ใช่แค่โปรแกรมเร่งความเร็วในการเล่นไฟล์วิดีโอเฉยๆ แต่มันมีความสามารถในการวิเคราะห์ข้อมูลของวิดีโอ แล้วทำการลดการสั่นของวิดีโอได้ด้วย เช่น ถ้าเราถ่ายวิดีโอตอนระหว่างเดิน ปกติมันก็จะสั่น เอียงไปมานิดหน่อย ตามจังหวะการเดิน ซึ่งปกติถ้าเราอยากได้ภาพนิ่งๆ ก็ต้องหาอุปกรณ์เสริมมาเพื่อให้ตัวสมาร์ทโฟนมันอยู่นิ่งๆ แต่ด้วย Hyperlapse แล้ว โปรแกรมมันจะคำนวณข้อมูลในแต่ละเฟรม (ก่อนและหลัง) เพื่อนำมาใช้ในการชดเชยและลดอาการสั่นของภาพลงอย่างเห็นได้ชัดเจนมากเลยครับ

 

 

ลองดูวิดีโอด้านบนได้ ผมลองถ่ายตอนเดินจากห้องเดโมไปที่คาเฟ่แห่งนึงใน Microsoft Campus ตอนแรกๆ ก็เดินเรื่อยๆ ภาพจะสั่นระดับนึง แต่ตอนท้ายๆ ผมลองเดินเร็วๆ จนเกือบวิ่ง แต่เมื่อนำมาประมวลผลเป็น Timelapse ด้วย Microsoft Hyperlapse แล้ว ภาพที่ได้นี่นิ้งเลยทีเดียว

ถ้าสนใจดาวน์โหลด ก็ไปดาวน์โหลด Microsoft Hyperlapse ได้ทั้งแบบบนสมาร์ทโฟนหรือบนพีซีและแมคเลยครับ

ทั้งหมดยังไม่ใช่ที่ได้ไปสัมผัสและรับชมรับฟังมาในวันแรกนี้นะครับ แต่แค่เขียนถึงทีมวิจัยก็อย่างยาวแล้ว … ไว้จะเขียนถึงเรื่องอื่นๆ ต่อตอนหน้าครับ ติดตามอ่านประสบการณ์มา Microsoft Underground Tour 2016 ตอนอื่นๆ ได้ที่ http://www.kafaak.com/tag/microsoft-underground-tour-2016/ ครับผม

@kafaak

ในอดีตเมื่อครั้งยังไม่ต๊อกต๋อย เคยเป็นผู้บริหารฝ่ายผลิตของโรงงานอุตสาหกรรม แต่ภายหลังเลือกงานที่ให้เวลากับชีวิต เพื่อมาอัพเดตเทรนด์เทคโนโลยีมากกว่า ปัจจุบันเป็นทั้งไอทีต๊อกต๋อยในสถานศึกษา เป็นบล็อกเกอร์ต๊อกต๋อยที่เขียนไปเรื่อยทั้งเรื่องเทคโนโลยี โซเชียลมีเดีย การตลาดดิจิตอล และจิตวิทยา เป็นที่ปรึกษาด้านการตลาดดิจิตอลให้กับธุรกิจ SMEs หลายแห่ง และเป็นวิทยากรรับเชิญด้านเทคโนโลยี การตลาดดิจิตอล และโซเชียลมีเดีย เป็นบางครา

You may also like...

Leave a Reply

%d bloggers like this: