Sự Khác Nhau Giữa AI (Artificial Intelligence) Machine Learning và Deep Learning

Artificial Intelligence (Trí tuệ nhân tạo) được ví như là công nghệ tương lai. Nó len lỏi vào trong mọi mặt đời sống của con người. Nhận định trên có lẽ đúng nhưng phải tùy thuộc vào lĩnh vực mà AI đang hướng đến.

Ví dụ, chương trình AlphaGo của Google DeepMind đã đánh bại cao thủ Lee Se-dol đến từ Hàn Quốc về bộ môn cờ vây vào đầu năm nay. Người ta sử dụng thuật ngữ AI, Machine learning (ML) và Deep Learning (DL) để mô tả vì sao mà Alpha Go của DeepMind chiếm ưu thế. Tuy nhiên, ba lĩnh vực đó không hề giống nhau.

Cách dễ nhất để nói về mối quan hệ giữa ba lĩnh vực này đó là hình dung nó như là một đường tròn đồng tâm. AI là lĩnh vực được phát triển đầu tiên, chiếm diện tích nhiều nhất. Tiếp đến là ML, công nghệ nở rộ sau đó và cuối cùng là sự bùng nổ DL.

Từ khởi đầu đến bùng nổ

Người ta từ lâu đã hình thành suy nghĩ AI là công nghệ giả tưởng và nung nấu ý định nghiên cứu nó từ các phòng thí nghiệm kể từ khi một nhóm nhà khoa học máy tính tập xung xoay quanh một thuật ngữ tại hội nghị Dartmouth diễn ra năm 1956 và khai sinh ra lĩnh vực AI. Những thập kỷ sau đó, AI đột nhiên được hy vọng sẽ mang lại tương lai tươi sáng cho nhân loại. Cho đến năm 2012, thành thực mà nói, AI cũng đã có những đột phá nhất định.

AI đã bùng nổ những năm trước đây đặc biệt kể từ năm 2015. Đầu tiên là khả năng vận hành tính toán GPU của nó có thể thực hiện các quy trình song song nhanh hơn, rẻ hơn và hữu hiệu hơn. Tiếp đến là khả năng thực hiện đồng thời việc lưu trữ thực tế vô hạn cũng như xử lý hàng tấn dữ liệu từ nhiều nguồn khác nhau như hình ảnh, văn bản, giao dịch, dữ liệu bản đồ hoặc bất cứ thứ gì bạn đặt tên cho nó.

Tiếp theo ta sẽ tìm hiểu xem làm thế nào mà các nhà khoa học máy tính nghiên cứu phát triển công nghệ này từ bước khởi đầu cho đến khi nó bùng nổ vào năm 2012 cũng như sự ra đời của nhiều ứng dụng AI mà hàng triệu người hiện nay đang sử dụng.

Trí tuệ nhân tạo hay Trí tuệ của con người được thể hiện qua máy móc

Trở lại hội nghĩ Dartmouth năm 1956, khi ấy dự định của các nhà tiên phong về AI là nhằm xây dựng một hệ thống máy móc phức tạp có những đặc tính tương đương với trí tuệ con người. Người ta gọi khái niệm này là “General AI”, một hệ thống máy móc khổng lồ có cảm xúc, có tri giác và lí lẽ như con người. Khái niệm này đã được đưa vào trong nhiều bộ phim như là đồng minh của con người – trong C-3PO hay kẻ thù – trong The Terminator. Hệ thống General AI nãy cũng đã xuất hiện qua nhiều bộ phim hay tiểu thuyết khoa học giả tưởng.

Còn về khái niệm “Narrow AI” thì sao? “Narrow AI” là công nghệ có khả năng thực hiện các công việc chi tiết thậm chí là tốt hơn cả con người. Các ví dụ Narrow AI điển hình đó là các dịch vụ phân loại hình ảnh như Pinterest hay nhận nhiện gương mặt trên Facebook.

Các ví dụ kể trên đã thể hiện được nhiều khía cạnh ở trí thông minh con người. Nhưng trí tuệ đó xuất phát từ đâu và bằng cách nào? Chúng ta sẽ tìm hiểu nó ở mục kế tiếp, Machine Learning.

Machine Learning, bước tiến chinh phục Artificial Intelligence

Machine Learning (Máy học hay học máy) là một lĩnh vực sử dụng thuật toán để phân tích cú pháp dữ liệu và “học” nó. Sau đó nó sẽ đưa ra những nhận định cũng như tiên đoán về sự vật trên thế giới. Do vậy khác với các việc lập trình các phần mềm viết tay để thực hiện một công việc cụ thể, các máy này sẽ được “huấn luyện” bằng việc sử dụng một lượng lớn dữ liệu và thuật toán mang lại cho nó có khả năng học được cách thực hiện các công việc.

Thuật ngữ machine learning đã trực tiếp hiện diện trong suy nghĩ của các nhà nghiên cứu về AI cũng như phương pháp tiếp cận thuật toán qua nhiều năm bao gồm decision tree learning, lập trình logic quy nạp (ILP), tổ hợp, học tăng cường (reinforcement learning) và mạng Bayes. Theo ta được biết, sẽ không ai có thể đạt được mục đích cuối cùng của General AI và thậm chí là Narrow AI cũng sẽ khó mà với tới các phương pháp tiếp cận machine learning.

Nhưng hóa ra, một trong các lĩnh vực ứng dụng tốt nhất mà machine learning đang thực hiện qua nhiều năm nay đó là computer vision (thị giác máy tính) dù nó đòi hỏi cần phải có việc lập trình bằng tay để hoàn thành công việc, Người ta thường thích viết các chương trình hand-coded classifiers như là edge detection filters mà qua đó chương trình này sẽ biết được đâu là điểm bắt đầu hay kết thúc của một vật thể hay là nhận diện hình dáng cũng như là nhận diện kí tự. Từ các chương trình hand – coded classifiers đó, lập trình viên sẽ phát triển các thuật toán nhằm mang lại các đặc tính cho hình ảnh cũng như để cho các máy này “học” được đâu là điểm bắt đầu cũng như kết thúc của hình ảnh đó.

Mặc dù rất tốt nhưng machine learning chưa hẳn là hoàn hảo. Đặc biệt là các điểm nhận diện bị sẽ khó có thể nhìn rõ trong các ngày sương mù hay bị cây che khuất. Đây là lý do vì sao mà computer vision và công nghệ nhận diện hình ảnh vẫn chưa đủ khả năng đem ra so sánh với con người cho đến những năm gần đây. Nó rất dễ mắc lỗi trong quá trình nhận diện.

Tuy nhiên thời gian cũng như các thuật toán đã mang đến sự khác biệt.

Deep Learning – Kỹ thuật tăng cường Machine Learning

Nhận diện và bóc tách hình ảnh con Mèo từ video trên Youtube là minh chứng đột phá đầu tiên về deep learning

Một thuật toán, một khái niệm mới đã ra đời. Artificial Neural Networks (Mạng Nơ-ron Nhân tạo) đã xuất hiện và trải qua nhiều thập kỷ. Mạng nơ-ron lấy cảm hứng từ cấu trúc sinh học bên trong bộ não con người, nơi mà có sự liên kết giữa các nơ-ron với nhau. Nói giống cũng không phải khi ở não người, bất cứ nơ-ron nào cũng có thể liên kết với nơ-ron khác trong cùng một mạng lưới nhưng ở mạng nơ-ron nhân tạo sẽ có các lớp, sự liên kết cũng như hướng truyền dữ liệu riêng lẽ và rời rạc.

Ví dụ ta chọn đại hình ảnh nào đó, tách nó thành các phần nhỏ hơn rồi sau đó đưa vào lớp đầu tiên trong mạng nơ-ron. Các nơ-ron riêng lẻ ở lớp đầu tiên này sẽ truyền dữ liệu sang lớp thứ hai. Nơ-ron ở lớp thứ hai sẽ thực hiện nhiệm vụ của nó và cứ như vậy cho đến khi lớp cuối cùng xuất ra kết quả mong muốn.

so sánh giữa mô hình Machine learning truyền thống và Deep learning

Mỗi nơ-ron sẽ được gán một trọng số vào input của nó. Qua đó sẽ cho biết được mối liên hệ giữa kết quả đúng hoặc không đúng với tác vụ đang được thực hiện như thế nào. Kết quả output cuối cùng sau đó sẽ được xét trên tổng trọng số. Ta sẽ lấy biển báo dừng (stop sign) làm ví dụ. Các thuộc tính trong hình ảnh biển báo sẽ được tách nhỏ ra rồi sau đó sẽ được nơ-ron “kiểm tra”. Biển báo này gồm tám cạnh, màu đỏ tươi, có các ký tự để phân biệt, kích cỡ bảng ký hiệu, chuyển động hay không chuyển động. Nhiệm vụ của mạng nơ-ron này là kết luận xem đây có phải là biển báo dừng hay không. Nó cũng sẽ đi kèm với một “vét tơ xác suất” cùng với những tiên đoán dựa trên trọng số. Hình ảnh do hệ thống xuất ra 86% sẽ là biển báo dừng, 7% là biển báo tốc độ và 5% là hình ảnh con diều mắc trên cây và cứ như thế. Sau cùng, kiến trúc mạng bên trong sẽ cho truyền dữ liệu lên mạng nơ-ron để cho biết kết quả cho ra có đúng hay không.

Dù kết quả từ ví dụ trên khá ấn tượng nhưng gần đây cộng đồng nghiên cứu về AI vẫn chưa đón nhận mạng nơ-ron. Cộng đồng này đã tập trung nghiên cứu phát triển từ những ngày đầu hình thành AI và cũng đã cho ra một định nghĩa nào đó về “trí thông minh”. Vấn đề ở đây là thậm chí mạng nơ-ron cơ bản nhất đều là các phép tính chuyên sâu chứ không phải là tiếp cận thực tế. Do đó đội ngũ nghiên cứu lập dị do nhà khoa học máy tính Geoffey Hinton tại đại học Toronto dẫn đầu đã bắt tay vào nghiên cứu vấn đề trên và cuối cùng song song hóa các thuật toán vận hành cho siêu máy tính và đã minh chứng cho khái niệm này nhưng vẫn chưa đâu vào đâu cho đến khi người ta nỗ lực triển khai các phép tính GPU và mở ra nhiều hứa hẹn.

Trở lại ví dụ về biển báo, xác suất kết quả cho ra rất ấn tượng khi mạng nơ-ron được điều chỉnh cũng như là cho nó xem qua nhiều kết quả sai. Cái mà mạng lưới này cần đó là training. Nó cần phải được xem qua hàng nghìn, thậm chí hàng triệu hình ảnh cho đến khi trọng số của nơ-ron input được điều chỉnh chính xác sao cho kết quả cho ra đúng như mong đợi chẳng hạn như phân biệt hình ảnh có sương mù hay không, trời mưa hay nắng. Đây chính là điểm mà mạng nơ-ron sẽ tự “dạy” cho nó xem xem biển báo dừng trông như thế nào, hay gương mặt ai đó trên Facebook trông ra sao hoặc bóc tách hình ảnh con mèo từ Youtube do giáo sư Andrew Ng thực hiện năm 2012 tại Google.

Đột phá của giáo sư Ng là nhằm xây dựng mạng nơ-ron này to lớn hơn bằng cách tăng thêm nhiều lớp và nơ-ron. Sau đó một lượng dữ liệu khổng lồ sẽ được nạp vào để training hệ thống. Trong trường hợp của Ng là ông đã nạp vào lượng lớn hình ảnh từ 10 triệu video trên Youtube. Ông Ng đã đặt từ “deep” vào “deep learning” để mô tả cho tổng số các lớp trong mạng nơ-ron.

Ngày nay, việc nhận diện hình ảnh bằng máy móc được training qua deep learning sẽ nhận diện tốt hơn so với con người và mở rộng từ nhận diện con mèo cho đến nhận diện chỉ số ung thư trong máu và khối u qua máy scan MRI. Chương trình AlphaGo của Google sẽ học cách chơi cờ và tự nó sẽ chơi với chính bản thân mình lần này qua lần khác.

Tương lai tươi sáng của AI nhờ vào Deep learning

Deep learning đã giúp cho các ứng dụng Machine learning đi vào thực tiễn cũng như mở rộng sự ảnh hưởng của AI trên các lĩnh vực. Deep learning ngày nay đã được ứng dụng trong khâu nhận diện hình ảnh, tích hợp vào xe tự lái, chuẩn đoán y tế và thậm chí là gợi ý các bộ phim hay. Công nghệ AI không chỉ phát triển ở hiện tại mà còn trong tương lai. Với sự hỗ trợ từ deep learning, công nghệ AI mà chúng ta thấy trong các bộ phim viễn tưởng sẽ không còn quá xa vời.

Theo blogs.nvidia.com

Post Author: Tu Vo