Sự Phát Triển Vượt Bật về Công Nghệ AI tại Trung Quốc

Các lãnh đạo cấp cao của Trung Quốc gần đây cho biết họ sẽ đẩy mạnh đầu tư phát triển trí tuệ nhân tạo (AI) nhằm đảm bảo cho các công ty, chính quyền hay quân đội của họ có thể chiếm ưu thế trong các lĩnh vực vào năm 2030. Sau đây là những bằng chứng rõ ràng nhất cho thấy Trung Quốc sẽ sớm áp bắt đầu đế chế AI (trí tuệ nhân tạo)

Có lẽ đúng khi nói rằng không nơi tốt hơn để nhận ra được sự phát triển về công nghệ AI của Trung Quốc tại cuộc thi ImageNet năm nay, một cuộc thi có uy tín về lĩnh vực AI và là nơi mà các đội tuyển từ khắp nơi trên thế giới hội tụ lại cùng tranh tài với nhau để tìm ra thuật toán nào có thể nhận dạng được hình ảnh tốt nhất.

Trong số 27 đội tuyển tham gia thi đấu, quá nữa trong số đó là những màn trình diễn đỉnh cao của các đội tuyển từ các trường đại học và các công ty tại Trung Quốc. Kết quả chung cuộc dường như là tương tự so với năm ngoái khi mà các nhà khoa học Trung Quốc đều chiếm ưu thế hơn 84 đội tuyển đến từ khắp nơi trên thế giới. Để chắc chắn, công ty dẫn đầu về công nghệ AI đã chiến thắng trong cuộc thi vào năm 2014 như Google vẫn không thể tham dự trận chung kết ImageNets. Nhưng qua ưu thế của Trung Quốc trong lĩnh vực này hai năm qua đã phần nào khẳng định được sự phát triển vượt bậc về công nghệ AI tại quốc gia này.

Tại cuộc thi năm nay, kết quả dẫn đầu bởi đội WMW cho thử thách phân loại ảnh được giám sát chặt chẽ khi tỷ suất lỗi chỉ 2.25%, một bước tiến nhỏ hơn so với năm ngoái khi tỷ suất lỗi là 2.99%. Đội WMW bao gồm hai nhà khoa học Jie Hu và Gang Sun đến từ tập đoàn sản xuất xe tự động Momenta tại Bắc Kinh. Trong email gửi cho tạp chí Forbes, hai nhà khoa học đến từ Trung Quốc này cho biết họ đã sử dụng một kỹ thuật gọi là “ép và kích thích” nhằm tăng cường cải thiện những tính năng kém và triệt tiêu những tính năng không hữu dụng lắm của mạng nơ-ron tích chập

Một cú hích lớn so với năm ngoái đã diễn ra trong phần thi phát hiện chủ thể dựa vào khả năng của máy tính nhằm nhận biết được những vật thể và xác định nó bằng hình ảnh. Ví dụ như có ba quả táo và một con mèo trong bức ảnh. Chiến thắng năm nay thuộc về đội DBAT với điểm số chính xác đạt được là 73.1% so với năm ngoái là 66.3%. Đội DBAT gồm 8 nhà khoa học đến từ trường Đại học Nanjing của Trung Quốc và 2 người từ trường Cao đẳng Impertial tại London.

Từ khi hình thành vào năm 2010, ImageNet (cuộc thi quy mô lớn về nhận dạng hình ảnh) đã nổi lên như một sự kiện có ảnh hưởng lớn đến cộng đồng các nhà nghiên cứu về AI nhằm tìm ra những cải tiến mới nhất trong hệ thống nhận diện hình ảnh. Năm 2012 được xem như là bước ngoặc về công nghệ AI và deep learning khi mà đội tuyển từ trường đại học Toronto đã tạo nên một kì tích trong lĩnh vực nhận dạng chính xác hình ảnh. Dẫn đầu bởi tiến sĩ Alex Krizhevsky, đội tuyển này đã sử dụng một mạng nơ-tron sâu để dựng nên một mô hình và đạt được tỷ suất phân loại ảnh sai chỉ 15%- một bước nhảy vọt lớn so với năm ngoái khi tỷ suất lỗi lên đến khoảng 25%. Mẫu thử của đội tuyển này được gọi là AlexNet và đã chứng minh được tính khả thi của hệ thống deep learning đã từng được nhắc đến vào khoảng những năm 1950 nhưng đến nay vẫn chưa được chú trọng lắm. Cả Krizhevsky cùng cộng sự của mình, người tiên phong về công nghệ AI Geoffey Hinton, đều đang công tác tại phòng thí nghiệm về công nghệ AI của Google.

Giáo sư về khoa học máy tính tại trường đại học Princeton, Olga Russakovsky, cho biết: “Năm 2012 quả thực là năm xuất hiện những kì tích về độ chính xác của công nghệ AI, và nó cũng là bằng chứng cho những giả thuyết về những hình mẫu deep learning xuất hiện trong vài thập kỷ nay”. “Đây là lần đầu tiên những hình mẫu này được đưa vào thực hiện trong lĩnh vực liên quan quan đến những vấn đề nhận dạng hình ảnh quy mô lớn”.

Kĩ thuật deep learning đã bắt bùng cháy như một ngọn lửa hoang dại trong cộng đồng nghiên cứu về công nghệ AI cũng như tại mọi công ty kỹ thuật liên quan. Hệ thống AI này gần như tương đồng với chức năng của não bộ khi mà nhiều mạng lưới nơ-ron liên kết với các khớp thần kinh. Hệ thống này được truyền tải một lượng dữ liệu khổng lồ và có khả năng truy xuất ra những dự liệu đó.

Theo như cuộc tranh luận vào năm 2012, những tập đoàn công nghệ lớn như Google và Microsoft đã bắt đầu tham gia vào dự án ImageNet nhằm trình làng những thành tựu tân tiến nhất của họ về deep learning trong hệ thống nhận diện hình ảnh. Năm 2014, Google đã tham gia vào cuộc thi với đội tuyển có tên gọi là GoogLeNet và đã tạo ra tiếng vang lớn ở lĩnh vực nhận diện vật thể với độ chính xác là 43.9% so với kết quả năm ngoái là 22.6%. ImageNet đã có một chiến dịch marketing khôn khéo khi trong năm 2013, nhà nghiên cứu công nghệ AI Matt Zeiler đã trình làng thành quả công nghệ AI của mình có tên gọi là Clarifai. Đồng thời cũng đạt được thành tích cao nhất tại cuộc thi ImageNet ở lĩnh vực phân loại hình ảnh bằng một bước tiến lớn về tỷ suất lỗi chỉ 12% so với kết quả 15% của Krizhevsky vào năm ngoái.

ImageNet muốn dừng thử thách về phân loại ảnh vào năm 2014 để dồn toàn lực vào lĩnh vực nhận diện và xác định vị trí vật thể cũng như về video nhưng ngành công nghiệp kỹ thuật vẫn chưa có dấu hiệu ngừng tiếp tục theo đuổi lĩnh vực phân loại ảnh trong suốt các năm qua.

Alex Berg, giáo sư khoa học máy tính tại trường đại học North Carolina tại Chapel Hill khiêm nhà sáng lập ImageNet, cho biết: “Hiện nay ImageNet đang bị bão hòa trong những cuộc thi như về phân loại hình ảnh cũng như rất ít những thành tích cao”.

Ông Russakovsky cũng cho hay: “Tôi nghĩ ImageNet vẫn đang thực hiện những bước cải tiến lớn hơn cho cộng đồng nghiên cứu khi dồn lực tập trung vào các nhiệm vụ, thử thách cũng như về bộ dữ liệu.”

Cộng đồng nghiên cứu về AI cũng đang lo ngại những thử thách về nghiên cứu công nghệ AI nào sẽ có thể thay thế vị trí của ImageNet. Một ứng cử viên sáng giá mà Russakovsky chỉ ra đó là cuộc thi COCO (Common Objects in Context). Berg cũng đang kết hợp thử thách về nhận dạng hình ảnh dựa trên dữ liệu thế giới thực bằng việc sử dụng camera từ smartphone. Một cuộc thi khác có tên gọi là WebVision yêu cầu các đội tham gia phải dựng lên được hình mẫu của mình dựa vào hình ảnh chọn lọc từ Internet chẳng hạn như bộ dữ liệu của ImageNet.

Những kết quả từ cuộc thi WebVision gần đây đã được công bố và người thắng cuộc là công ty công nghệ Malong tại tỉnh Thâm Quyến đã tạo ra những công cụ phát triển công nghệ AI về nhận diện hình ảnh và tỷ suất chính xác đạt được là 94.78% ở phần phân loại hình ảnh từ các trang web. Malong là một doanh nghiệp tư nhân nhưng đã tham gia vào nghiên cứu công nghệ AI cùng với trường đại học Tsinghua với chi phí tài trợ là một triệu đô la cho bất kì nghiên cứu nào về AI từ chính quyền tỉnh Thâm Quyến.

Matt Scott, đồng sáng lập khiêm giám đốc công nghệ tại Malong, cho biết: “Công nghệ AI hiện nay đang cạnh tranh rất khốc liệt, bạn cần phải có những lợi thế mạnh để có thể tham gia vào nghiên cứu và thật là tuyệt khi chính quyền cũng bày tỏ sự quan tâm của họ về vấn đề này tại Trung Quốc”.