AI กำลังเรียนรู้จากข้อมูลสังเคราะห์ ไม่ต้องละเมิดความเป็นส่วนตัวคนจริง ข้อมูลจำลองทำให้ปัญญาประดิษฐ์ฉลาดเร็วขึ้น

AI หรือ ปัญญาประดิษฐ์ จะทำงานได้อย่างมีประสิทธิภาพ มันต้องการข้อมูลมากๆ เพื่อให้มันฉลาดขึ้น

AI วินิจฉัยมะเร็งเต้านมจากภาพเอ็กเรย์ มันต้องแยกความแตกต่างระหว่างเต้านมปกติและเต้านมที่เป็นมะเร็ง ดูจากภาพแล้วบอกได้ว่า ระยะเริ่มแรกของคนเป็นมะเร็งเป็นอย่างไร ถ้าต้องการให้ AI วินิจฉัยได้ถูกต้องแม่นยำ อาจต้องให้มันเรียรรู้จากภาพเต้านมนับล้านภาพ และมีข้อมูลที่ติดฉลากบอกมันว่า ภาพไหนเป็นเอ็กเรย์จากเต้านมที่เป็นมะเร็ง

บริษัททางด้านการเงิน ใช้ AI ช่วยวิเคราะห์คนที่มาขอกู้เงินว่ามีเครดิตดีหรือแย่ มันต้องได้รับการเรียนรู้จากข้อมูลสินเชื่อจำนวนมาก สามารถหาความเชื่อมโยงที่ถูกต้องว่า ปัจจัยอะไรมีผลต่อการชำระคืนเงินของผู้กู้

รถไร้คนขับ มี AI เป็นเทคโนโลยีที่อยู่เบื้องหลัง การทดลองวิ่งบนถนนจริงทั่วโลกของรถไร้คนขับหลายบริษัท มีจุดประสงค์เพื่อต้องการให้เจ้าปัญญาประดิษฐ์ได้เรียนรู้เหตุการณ์จากสถานการณ์จริง มีความถูกต้องแม่นยำในการแยกแยะ รับมือกับเหตุการณ์ต่างๆบนท้องถนนได้ถูกต้อง

หุ่นยนต์ผู้ช่วยในบ้าน มี AI เป็นสมอง มันต้องเรียนรู้วิธีการทำงาน การตอบสนองต่อมนุษย์ และเหตุการณ์ในชีวิตประจำวันที่เกิดขึ้นในบ้าน ไปหยิบของในที่ต่างๆได้อย่างไร เปิดตู้เย็นเอาอาหารออกไปเสิร์ฟให้นายยังไง กว่าหุ่นยนต์ AI จะทำงานได้อย่างมีประสิทธิภาพ มันต้องฝึกฝนเรียนรู้อยู่นาน

ข้อมูลเป็นปัจจัยสำคัญที่ช่วยทำให้ AI หรือ Deep Learning ทำงานได้อย่างมีประสิทธิภาพ แต่ข้อมูลในโลกจริงหายากมากขึ้น มีข้อมูลจำนวนมากที่ไม่มีคุณภาพ ทำให้เสียเวลาเรียนรู้นาน และหากเป็นข้อมูลที่มีความเกี่ยวข้องกับการละเมิดความเป็นส่วนตัว จะยิ่งเป็นปัญหาในการได้มาของข้อมูลเพิ่มขึ้นไปอีก กลายเป็นอุปสรรคทำให้ AI เรียนรู้ช้า!!!

เพื่อทำให้ AI มีข้อมูลเพื่อเรียนรู้มากขึ้น เร็วขึ้น วันนี้จึงมีสตาร์ทอัพเกิดใหม่จำนวนมากที่กำลังให้บริการ Synthetic Data หรือ ข้อมูลสังเคราะห์ ซึ่งเป็นการสร้างข้อมูลเพื่อให้อัลกอริทึมได้เรียนรู้ แทนที่มันจะเรียนรู้จากข้อมูลในโลกจริงเท่านั้น มันสามารถเรียนรู้จากข้อมูลสังเคราะห์ที่มีการจำลองตรงกับความเป็นจริง

ภาพประกอบที่แสดงให้เห็นอยู่นี้ ไม่ใช่ตัวอวตาร์ ที่ใช้ในเกมส์หรือภาพยนตร์ แต่เป็นข้อมูลสังเคราะห์ที่สร้างจากตัวอย่างของคนจริง เพศ อายุ ผิว รูปร่าง ที่แตกต่างกัน สามารถทำเป็นข้อมูลสังเคราะห์ไปจำลองอยู่ในสถานการณ์ที่แตกต่างกันภายในบ้านได้

อวตาร์แต่ละตัวมีโครงสร้างเหมือนคนจริง มีจุดเริ่มต้นมาจาการสแกนแบบสามมิติจากคนจริง เฟอร์นิเจอร์และของใช้ต่างๆในบ้านมีสัดส่วนตามความเป็นจริง

ข้อมูลสังเคราะห์ สามารถประยุกต์เป็นข้อมูลจำลองที่หลากหลาย

หากหุ่นยนต์ AI ที่เป็นผู้ช่วยในบ้าน ได้เห็นข้อมูลจำลองต่างๆสารพัดแบบ จะช่วยทำให้มันเรียนรู้ได้เร็วขึ้น ลดขั้นตอนการเรียนรู้และลดระยะเวลาฝึกฝนทำงานกับสถานการณ์จริงไปได้มาก

Synthetic Data กลายเป็นธุรกิจที่กำลังเป็นที่ต้องการอย่างมากในยุคที่อุตสาหกรรมทุกอย่างหันมาใช้ AI

ย้อนกลับไป 4-5 ปี ไม่มีใครมองออกว่า มันจะเป็นธุรกิจได้!!!

ในปัจจุบัน Synthetic Data มีการแยกแขนงออกเป็น Structured Data และ Unstructured Data

บริษัทที่กำลังทำ Synthetic Data แบบ Structured Data เช่น Datamize, Diveplane, Facteus, Generatrix, Hazy, Instill AI, Kymera Labs, Mostly AI, Oscillate.ai, Replica Analytics, Sarus Technologies, Sogeti, Statice, Syndata AB, Synthesized, Syntheticus, Syntho, Tonic, Ydata, Kerus Cloud, MD Clone, Pionic, Syntegra, Veil.ai, BizDatax’s Synthetic Data Generator, Test Data Manager, Chatterbox’s Synthetic Data Generator, Curiosity software synthetic test data, ExactData, GenRocket, iData, Informatica, Synth, Gretel synthetic, Smart noixe, Twinify, Synner, Synthea, Synthetig

สำหรับบริษัทที่กำลังทำ Synthetic Data แบบ Unstructured Data เช่น AI Reverie, Anyverse, Autonoma IA, Bifrost, CVEDIA, Cognata, Datagen, Deep Vision Data, EdgeCase, Lexset, Mindtech, Neurolabs, Neuromation, OneView, Parallel domain, Reinvent Systems, Rendered AI, Simerse, Synthesis AI, Synthetaic, Synthetic Data Pty Ltd, Synthetik, uSearch, Vy.pno, Yuva.ai, Zumo labs

Startup จำนวนมากที่กำลังทำข้อมูลสังเคราะห์อยู่ในปัจจุบัน ยืนยันให้เห็นว่า ธุรกิจนี้กำลังเป็นธุรกิจใหม่ที่กำลังเป็นที่ต้องการ และดูเหมือนว่าในอนาคตอันใกล้จะมีบริษัทที่ทำข้อมูลสังเคราะห์เกิดใหม่อีกมาก

มองในแง่มุมของธุรกิจในโลกใหม่ ทำให้เห็นว่ายังมีโอกาสใหม่ๆเกิดขึ้นในยุค AI อีกมาก

แต่มองอีกด้านก็อดกังวลไม่ได้ ข้อมูลสังเคราะห์ที่สร้างให้ AI อีกแพลตฟอร์มเรียนรู้ มันก็ใช้ AI อีกตัวมาช่วยสร้าง

ถ้าต่อไปในอนาคต การเชื่อมโยงเรียนรู้ AI มันส่งต่อกับ AI ได้เอง แล้วมนุษย์จะอยู่ตรงไหน???????

https://elise-deux.medium.com/the-list-of-synthetic-data-companies-2021-5aa246265b42

https://www.datagen.tech/technology/

https://www.technologyreview.com/2021/06/11/1026135/ai-synthetic-data/

Leave a Reply