Deep Learning Thay Đổi Cuộc Sống Ra Sao?

Deep Learning Thay Đổi Cuộc Sống Ra Sao? (phần 1)

Các phát minh khám phá của thập kỷ trước hiện nay đang truyền nhiệt cho cả ngành công nghiệp máy tính và sẽ sớm có sự thay đổi ở các doanh nghiệp tại Mỹ.

Trong bốn năm qua, người đọc chắc chắn sẽ không còn nghi ngờ gì nữa khi nhận ra được quantum leaps (bước nhảy lượng tử) trong chất lượng về các công nghệ ngày nay. Thật ra mà nói, tính năng nhận diện giọng nói trên smartphone ngày hoạt động hữu hiệu hơn xưa chẳng hạn khi ta ra lệnh bằng giọng nói để gọi cho ai đó thì ngay lập tức máy sẽ nhận tín hiệu và thực hiện cuộc gọi ngay.

Thực tế chúng ta hiện nay tương tác với máy tính nhiều hơn chỉ qua việc “nói chuyện” với nó. Dù là các trợ lý ảo như Alexa của Amazon, cô nàng Siri của Apple, Cortana của Microsoft hay nhiều tính năng phản hồi giọng nói khác của Google. Một ông lớn về lĩnh vực tìm kiếm như công ty Baidu ở Trung Quốc cũng cho hay lượng khách sử dụng tính năng tương tác bằng giọng nói của hãng đã tăng gấp 3 lần trong vòng 18 tháng qua.

Những bộ phim của Hollywood thường xuyên ứng dụng về kết quả của Deep Learning như AI Javis trong phim Iron Man, có khả năng nói, hội thoại, nhận biết, tự xử lý vấn đề, trao đổi và đưa ra phương án, giải mã thông tin mà con người cần

https://youtu.be/Wx7RCJvoCMc

Các thiết bị tự động dịch thuật và các dạng xử lý ngôn ngữ khác cũng đã trở nên thuyết phục hơn với Google, Microsoft, Facebook và Baidu khi tự động ra mắt nhiều thủ thuật mới hàng tháng. Công cụ Google Translate hiện tại cũng đã có thể render văn bản bằng trọng nói từ ngôn ngữ này sang 32 ngôn ngữ khác trong khi ngôn ngữ khi dịch văn bản tự động cũng tăng lên đến 103 ngôn ngữ bao gồm cả tiếng Cebuano, Igbo và Zulu. Ứng dụng Inbox của Google cũng đã có thể đề xuất ba phương án trả lời email tự động.

Video của Nvidia nói về cách mạng hóa bởi AI trong đó sử dụng Deep Learning để phân tích, nhận diện, thể hiện, được dạy như một đứa trẻ và dần dần tiến hóa

Tiếp đến là những bước tiến ở khâu nhận diện hình ảnh. Cả bốn công ty đã nói ở trên đều có những tính năng của riêng họ cho phép bạn có thể tìm hoặc tự động sắp xếp cả ngàn tấm hình không có tag nào rõ ràng. Bạn có thể ra lệnh tìm kiếm chẳng hạn như con chó, hay tuyết hoặc thậm chí là thứ gì đó khá trừu tượng như là cái ôm. Các công ty này đều có các giao thức cho phép chuyển dòng lệnh thành giọng nói này để tìm kiếm hình ảnh trong tích tắc.

Nghĩ thử xem. Để tìm được các tấm hình có con chó, ứng dụng sẽ phải nhận diện từ giống chó Chihuahua cho đến Bạc giê Đức và cả khi con chó bị lộn ngược hoặc che khuất một phần hay ở bên trái hoặc bên phải khung hình, trong tuyết hoặc sương mù, mặt trời hay bóng râm.
Cùng lúc đó giao thức cũng phải nhận diện và loại trừ các con sói hay mèo. Mà sao nó lại làm được như vậy?

Quá trình mô tả các bước nhận diện con chó trong hình ảnh từ việc training bước đầu
và xử lý qua các lớp từ giống loài, hình dáng và các đặc trưng riêng.

Những tiến bộ trong lĩnh vực nhận diện hình ảnh đã tiến xa đến các ứng dụng xã hội. Các tổ chức y tế cũng đã tuyên bố họ sẽ nhanh chóng sử dụng máy tính để đọc các kết quả X-rays, MRIs và CT scan nhanh hơn và chính xác hơn các bác sĩ chụp X-quang nhằm chuẩn đoán các căn bệnh ung thư sớm hơn và hạn chế di căn. Hơn thế nó cũng giúp đẩy nhanh việc tìm kiếm các dược phẩm chữa trị các căn bệnh hiểm nghèo. Thuật toán nhận diện hình ảnh tốt hơn rất quan trọng cho việc mở rộng sự phát triển ở lĩnh vực khoa học robot, máy bay không người lái và đương nhiên là hệ thống xe chạy tự động- một bước tiến quan trọng mà chúng ta đã làm được trong cover story đăng tải trên trang fortune.com vào tháng 6. Với sự tăng trưởng của các hãng xe Ford F là 0.26% và Tesla TSLA là 0.96%, các công ty như Uber, Baidu và công ty mẹ Alphabet của Google cũng đều đang thử nghiệm các giao thức cho phép hệ thống xe tự lái có thể chạy trên các tuyến đường công cộng.

Viễn cảnh với sản phẩm đột phá sử dụng AI để xe tự hành, một dự án của Google

Nhưng điều mà mọi người vẫn chưa nhận ra đó là về bản chất thì tất cả những đột phá này vẫn dậm chân tại chỗ. Đây đều là những sản phẩm của công nghệ về trí thông minh nhân tạo (AI) đã có từ trước được biết đến như là deep learning mà theo như phần lớn các nhà khoa học lại thích gọi công nghệ này theo thuật ngữ chuyên ngành gốc là: Mạng nơ-ron sâu.

Sơ đồ mạng nơ-ron sâu

Một điều đáng chú ý về mạng nơ-ron này đó là không ai sẽ lập trình máy tính thực hiện những tác vụ như được mô tả ở trên. Thực ra là không ai có thể mà là các lập trình viên đã cho máy tính “ăn” các thuật toán với hàng terabytes dữ liệu, hàng trăm ngàn hình ảnh hoặc các dòng lệnh bằng lời nói để train nó và sau đó cho phép máy tính này có thể tự nó tìm ra được làm thế nào để nhận diện các vật thể, từ ngữ hay câu chữ mong muốn.

[quote]Nói ngắn gọn là những cỗ máy này đã có thể tự “dạy” cho chính nó. Theo CEO đứng đầu về xử lý đồ họa tại Nvidia, Jen-Hsun Huang cho hay: “Bạn nên để cho phần mềm tự nó viết ra phần mềm”.[/quote]

Google cùng Nasa kết hợp tạo ra máy tính ứng dụng AI ở mức lượng tử

Mạng nơ-ron không phải là gì mới mẻ. Những ý tưởng về vấn đề này đã được đặt ra vào những năm 1950 của thế kỷ trước và những bước đột phá về những thuật toán chủ chốt đã diễn ra vào những năm 1980 và 1990. Những gì đã thay đổi ngày nay đó là các nhà khoa học máy tính cuối cũng đã khai thác được nguồn sức mạnh to lớn mà máy tính đem lại và vô số nguồn chứa các dữ liệu hình ảnh, video, âm thanh và văn bản rải rác trên Internet. Và hóa ra thì đây là cách cần thiết để vận hành tốt các mạng nơ-ron. Theo Frank Chen, đối tác tại công ty đầu tư Andreessen Horowitz cho biết deep learning quả là “cuộc bùng nổ của Kỷ Cambri”- ám chỉ đến thời địa chất về sự bùng nổ về các loài động thực vật trên thế giới.

Cách hiểu dễ nhất về kiểu vận hành đơn giản nhất của Neuron Network, cốt lõi cơ bản nhất của Deep Learning

Tiến bộ đáng kể này đã gây ra một loạt các hoạt động. Theo công ty nghiên cứu CB Insights, vốn cổ phần đổ vào khởi động nghiên cứu công nghệ AI đã đạt đến mức cao nhất tại quý trước với hơn 1 tỷ đô la Mỹ. Công ty cũng cho biết có khoảng 121 quỹ như vậy vào quý 2 năm 2016 khi so với 21 quỹ ở quý tương tự năm 2011. Tổng đầu tư hơn 7.5 tỷ đô la Mỹ đã được thành lập cho nghiên cứu này với hơn 6 tỷ đô đa Mỹ từ năm 2014. Cuối tháng 9 này, 5 tập đoàn dẫn đầu về công nghệ AI đó là Amazon, Facebook, Google, IBM và Microsoft đã lập nên một tổ chức phi lợi nhuận Partnership on AI nhằm nâng cao nhận thức của công chúng đối với lĩnh vực này trên cơ sở đạo đức và thực tiễn nhất.