อะไรกันงงไปหมด Machine Learning vs Deep Learning vs Artificial Intelligence (AI)

facebooktwittergoogle_plusredditpinterestlinkedinmail

TL;TR

ได้เข้าไปหลาย Fan Page หรือ Blog เกี่ยวกับ Data หลาย Jargon Terms (คำ ที่เป็น Technical จ๋า) พรั่งพรู จน Admin ก็ยังงงวยว่าแต่ละอย่างมันคืออะไร แล้วจะเรียกอะไรดี วันนี้เลยได้โอกาสเข้าไปอ่านบทความของคุณ Jeff Hawkins ที่เว็บไซต์ Community ชื่อดังเกี่ยวกับเรื่อง Data นั้นก็คือ (kdnuggets.com) — เวลาสัมภาษณ์คนเข้าทำงาน คำถามหนึ่งคิดว่าใช้ได้ดี  จะถามว่าปกติไปอ่านหรือไป Contribute/หาความรู้ อะไรที่ไหน คำตอบก็พอจะทราบได้ว่าเค้ามีประสปการณ์หรือขวยขวายขนาดไหน (คำตอบส่วนใหญ่ก็บอกว่า “Google ครับ” 555)  — ความคิดส่วนตัว Admin เชื่อในการ Specialize บางอย่าง มากว่า know it all เพราะการ specialize something / mastering something ก่อให้เกิด impact มากมายกับวงการ (อยากขอบคุณ Pure Researches มากมาย แม้ไม่ได้ทำให้เห็นเป็น Applications แต่มันทำให้เราเข้าใจบางอย่างลึกซึ้ง) เพราะมันต้องใช้พลังอย่างสูงในการได้มาซึ่งความรู้มา  มากกว่าการ Scratching the surface(ผิวเผิน) เลยอยากแนะนำ Data nerds ทั้งหลายไป Kdnuggets.com มีอะไรน่าอ่านเยอะ

ว่าไปนั้น วันนี้เลยมาแยกแยะ และจะได้จับใจความสำคัญต่อได้ มาด้วยเรื่อง Fundamental กันเลยว่าแยกแยะ Machine Learning, Deep Learning หรือ AI อย่างไร (หลายครั้งที่ Adminเองก็ใช้ผิดใช้ถูกผสมปนเปกัน ตามความเข้าใจ แบบ Scratching the surface)

เอา Definition จาก Wiki ก่อนเป็นอันดับแรก

Machine learning is a subfield of computer science[1] that evolved from the study of pattern recognition and computational learning theory in artificial intelligence.[1] In 1959, Arthur Samuel defined machine learning as a “Field of study that gives computers the ability to learn without being explicitly programmed”.[2] Machine learning explores the study and construction of algorithms that can learn from and make predictions on data.[3] Such algorithms operate by building a model from example inputs in order to make data-driven predictions or decisions,[4]:2 rather than following strictly static program instructions.

Machine learning is closely related to and often overlaps with computational statistics; a discipline which also focuses in prediction-making through the use of computers. It has strong ties to mathematical optimization, which delivers methods, theory and application domains to the field. Machine learning is employed in a range of computing tasks where designing and programming explicit algorithms is infeasible. Example applications include spam filtering, optical character recognition (OCR),[5] search engines and computer vision. Machine learning is sometimes conflated with data mining,[6] where the latter sub-field focuses more on exploratory data analysis and is known as unsupervised learning.[4]:vii[7]

แปลไทยจาก Wiki อีกรอบ (คนแปลไทยขี้เกียจไปหน่อยเลยสั้นไปเยอะเลย)

การเรียนรู้ของเครื่อง (อังกฤษ: machine learning) เป็นสาขาหนึ่งของปัญญาประดิษฐ์ที่พัฒนามาจากการศึกษาการรู้จำแบบ เกี่ยวข้องกับการศึกษาและการสร้างอัลกอริทึมที่สามารถเรียนรู้ข้อมูลและทำนายข้อมูลได้ อัลกอริทึมนั้นจะทำงานโดยอาศัยโมเดลที่สร้างมาจากชุดข้อมูลตัวอย่างขาเข้าเพื่อการทำนายหรือตัดสินใจในภายหลัง แทนที่จะทำงานตามลำดับของคำสั่งโปรแกรมคอมพิวเตอร์

การเรียนรู้ของเครื่องมีเกี่ยวข้องอย่างมากกับสถิติศาสตร์ เนื่องจากทั้งสองสาขาศึกษาการวิเคราะห์ข้อมูลเพื่อการทำนายเช่นกัน นอกจากนี้ยังมีความสัมพันธ์กับสาขาการหาค่าเหมาะที่สุดในทางคณิตศาสตร์ที่แงของวิธีการ ทฤษฎี และการประยุกต์ใช้ การเรียนรู้ของเครื่องสามารถนำไปประยุกต์ใช้งานได้หลากหมาย ไม่ว่าจะเป็นการกรองอีเมล์ขยะ การรู้จำตัวอักษร เครื่องมือค้นหา และคอมพิวเตอร์วิทัศน์

และวิธีการของ Machine Learning มี

ตามด้วย Definition ของ AI มั้ง

Artificial intelligence (AI) is the intelligence exhibited by machines or software. It is also the name of the academic field of study which studies how to create computers and computer software that are capable of intelligent behavior. Major AI researchers and textbooks define this field as “the study and design of intelligent agents”,[1] in which an intelligent agent is a system that perceives its environment and takes actions that maximize its chances of success.[2] John McCarthy, who coined the term in 1955,[3] defines it as “the science and engineering of making intelligent machines”.[4]

AI research is highly technical and specialized, and is deeply divided into subfields that often fail to communicate with each other.[5] Some of the division is due to social and cultural factors: subfields have grown up around particular institutions and the work of individual researchers. AI research is also divided by several technical issues. Some subfields focus on the solution of specific problems. Others focus on one of several possible approaches or on the use of a particular tool or towards the accomplishment of particular applications.

The central problems (or goals) of AI research include reasoning, knowledge, planning, learning, natural language processing (communication), perception and the ability to move and manipulate objects.[6] General intelligence is still among the field’s long-term goals.[7] Currently popular approaches include statistical methods, computational intelligence and traditional symbolic AI. There are a large number of tools used in AI, including versions of search and mathematical optimization, logic, methods based on probability and economics, and many others. The AI field is interdisciplinary, in which a number of sciences and professions converge, including computer science, mathematics, psychology, linguistics, philosophy and neuroscience, as well as other specialized fields such as artificial psychology.

The field was founded on the claim that a central property of humans, human intelligence—the sapience of Homo sapiens sapiens—”can be so precisely described that a machine can be made to simulate it.”[8] This raises philosophical issues about the nature of the mind and the ethics of creating artificial beings endowed with human-like intelligence, issues which have been addressed by myth, fiction and philosophy since antiquity.[9] Artificial intelligence has been the subject of tremendous optimism[10] but has also suffered stunning setbacks.[11] Today it has become an essential part of the technology industry, providing the heavy lifting for many of the most challenging problems in computer science.[12]

มาถึงวิธีการของ AI

Wiki แปลไทยกันมั้ง อ่านไป อ่านมา มันกลายไป ชนกับ  – *ANN  กับ **Decision  Tree  ของ Machine Learning

ปัญญาประดิษฐ์ (Artificial Intelligence) หรือ เอไอ (AI) หมายถึงความฉลาดเทียมที่สร้างขึ้นให้กับสิ่งที่ไม่มีชีวิต ปัญญาประดิษฐ์เป็นสาขาหนึ่งในด้านวิทยาการคอมพิวเตอร์ และวิศวกรรมเป็นหลัก แต่ยังรวมถึงศาสตร์ในด้านอื่นๆอย่างจิตวิทยา ปรัชญา หรือชีววิทยา ซึ่งสาขาปัญญาประดิษฐ์เป็นการเรียนรู้เกี่ยวกับกระบวนการการคิด การกระทำ การให้เหตุผล การปรับตัว หรือการอนุมาน และการทำงานของสมอง แม้ว่าดังเดิมนั้นเป็นสาขาหลักในวิทยาการคอมพิวเตอร์ แต่แนวคิดหลายๆ อย่างในศาสตร์นี้ได้มาจากการปรับปรุงเพิ่มเติมจากศาสตร์อื่นๆ เช่น

การเรียนรู้ของเครื่อง นั้นมีเทคนิคการเรียนรู้ที่เรียกว่า การเรียนรู้ *ต้นไม้ตัดสินใจ ซึ่งประยุกต์เอาเทคนิคการอุปนัยของ จอห์น สจวร์ต มิลล์ นักปรัชญาชื่อดังของอังกฤษ มาใช้
**เครือข่ายประสาทเทียม ก็นำเอาแนวคิดของการทำงานของสมองของมนุษย์ มาใช้ในการแก้ปัญหาการแบ่งประเภทของข้อมูล และแก้ปัญหาอื่นๆ ทางสถิติ เช่น การวิเคราะห์ความถดถอยหรือ การปรับเส้นโค้ง
อย่างไรก็ตาม เนื่องจากปัจจุบันวงการปัญญาประดิษฐ์ มีการพัฒนาส่วนใหญ่โดยนักวิทยาศาสตร์คอมพิวเตอร์ อีกทั้งวิชาปัญญาประดิษฐ์ ก็ต้องเรียนที่ภาควิชาคอมพิวเตอร์ของคณะวิทยาศาสตร์หรือคณะวิศวกรรมศาสตร์ เราจึงถือเอาง่าย ๆ ว่า ศาสตร์นี้เป็นสาขาของวิทยาการคอมพิวเตอร์นั่นเอง

ต่อกันด้วย Deep Learning

Deep learning (deep structured learning, hierarchical learning or deep machine learning) is a branch of machine learning based on a set of algorithms that attempt to model high-level abstractions in data by using multiple processing layers with complex structures, or otherwise composed of multiple non-linear transformations.[1][2][3][4][5][6]

Deep learning is part of a broader family of machine learning methods based on learning representations of data. An observation (e.g., an image) can be represented in many ways such as a vector of intensity values per pixel, or in a more abstract way as a set of edges, regions of particular shape, etc. Some representations make it easier to learn tasks (e.g., face recognition or facial expression recognition[7]) from examples. One of the promises of deep learning is replacing handcrafted features with efficient algorithms for unsupervised or semi-supervised feature learning and hierarchical feature extraction.[8]

Research in this area attempts to make better representations and create models to learn these representations from large-scale unlabeled data. Some of the representations are inspired by advances in neuroscience and are loosely based on interpretation of information processing and communication patterns in a nervous system, such as neural coding which attempts to define a relationship between various stimuli and associated neuronal responses in the brain.[9]

Various deep learning architectures such as deep neural networks, convolutional deep neural networks, deep belief networks and recurrent neural networks have been applied to fields like computer vision, automatic speech recognition, natural language processing, audio recognition and bioinformatics where they have been shown to produce state-of-the-art results on various tasks.

Alternatively, deep learning has been characterized as a buzzword, or a rebranding of neural networks.[10][11]

ส่วนภาษาไทยยังไม่มีคนแปล – ผมขอเชิญชวน อาจาร์ย์หรือผู้ประสาทวิชาลึกซึ้ง ไปแปลด้วยนะครับ (ข้างบนด้วยนะครับ 555 ขอเยอะ) ดังนั้นผมขออนุญาติแปลเองอย่างย่อก่อนเลยแล้วกัน

สามารถเรียกได้ 3 อย่าง deep structured learning, hierarchical learning หรือ deep machine learning ถ้าใครพูด key words เหล่านี้ให้เข้าใจว่าเรื่องเดียวกัน — เป็นแขนงหนึ่งของ Machine Learning

Admin ขอจบแปลแค่นี้เพราะเรามาเรื่อง Terminology ไม่ลงลึกถึงทฤษฎีใดอนุมานได้ว่า Deep Learning เป็น Sub-set ของ Machine Learning

ส่วนวิธีการของ Deep Learning

งงกับ Text อันมากมายที่ว่ามาเราก็น่าจะจับใจความออกมาเป็นรูปได้ว่า

introduction-to-deep-learning-11-638 (2)
ที่มารูป Massimiliano Ruocco, Research Scientist จาก Slideshare

ในภาพเราก็เห็นทั้งหมดทั้งมวลว่า AI ใหญ่ที่สุดแล้วก็ Machine Learning ตามมา ด้วย Representation Learning (ไว้ค่อยว่ากันบทความต่อไป) และเล็กสุดคือ Deep Learning

มาต่อด้วยนาย  Jeff Hawkins และ Donna Dubinsky   จาก Blog ของ KDnuggets ที่กล่าวถึงตั้งแต่ตอนแรก เค้าจะแยกแยะตามวิธีการ (Approach) โดยแบ่งดังนี้
Classical AI, Simple Neural Networks และ ฺBiological Neural Networks  โดยที่เค้าแยกให้เห็นและยกตัวอย่างตามตารางก็เป็นวิธีแบ่งที่ทีดีอีกอัน (งงขึ้นไปอีก 555)
classic-ai-neural-nets-summary (1)

การแบ่งแบบนี้ก็ เข้าใจอีกแบบ เห็นภาพขึ้นแล้วยังงอกคําศัพท์ใหม่มาอีก (Machine Intelligence)
โดยที่ เจ้าศัพท์ Machine Intelligence คือคำที่จะมาสยบ(รึเป่าไม่รู้)ความงงงวย ของการใช้ AI, ML หรือ Deep Learning  แม้แต่ฝรั่งก็ยังไม่ฟันธงกันเถียงกันไปมา
เรียกเหมารวมเลยแล้วกันว่า Machine Intelligence

1-yGYPJRXWGubT6npH-LLvrA
1-A9exqeQ69XjjSJgMyDEo6Q (1)

 

ครั้งหน้าเวลาอยู่ในวงสนทนาเรื่องพวกนี้ ดู Context แล้วยังไม่มั่นใจ ให้พูดออกไปว่า Machine Intelligence จบ :)

ที่มา  Jeff Hawkins & Donna Dubinsky – http://www.kdnuggets.com/2016/01/what-is-machine-intelligence-ml-deep-learning-ai.html
ที่มา Midium https://medium.com/machine-intelligence-report/the-current-state-of-machine-intelligence-2-0-a9e0bab95511#.yriuy1hq1
ที่มา Wikipedia  https://en.wikipedia.org/wiki/Main_Page
ที่มา Massimiliano Ruocco

download (20)

facebooktwittergoogle_plusredditpinterestlinkedinmail
The following two tabs change content below.

Be the first to comment

Leave a Reply

Your email address will not be published.


*