Trí tuệ nhân tạo

Google giới thiệu mô hình trí tuệ nhân tạo tiên tiến Gemini mới

Google đã giới thiệu mô hình trí tuệ nhân tạo tiên tiến Gemini của họ, có khả năng xử lý video, âm thanh và văn bản. Đây là một bước đột phá trong công nghệ AI.

Google hôm 6.12 đã giới thiệu mô hình trí tuệ nhân tạo tiên tiến nhất của mình, một mô hình có khả năng xử lý các dạng thông tin khác nhau như video, âm thanh và văn bản.

Trí tuệ nhân tạo mới của Google đã được ra mắt. Ảnh: Chụp màn hình

Alphabet, công ty mẹ của Google cho biết, mô hình AI được gọi là Gemini mới của công ty đã rất được mong đợi trong thời gian gần đây với khả năng suy luận và hiểu thông tin phức tạp. Đồng thời, nó có thể trả lời bằng nhiều sắc thái hơn so với công nghệ trước đây của Google.

Sundar Pichai – CEO của Alphabet – viết trong một bài đăng trên blog: “Mô hình mới này đại diện cho một trong những nỗ lực khoa học và kỹ thuật lớn nhất mà chúng tôi đã thực hiện với tư cách là một công ty”.

Kể từ khi ChatGPT của OpenAI ra mắt khoảng một năm trước, Google đã nỗ lực chạy đua để sản xuất một mô hình AI cạnh tranh với nó.

Google đã bổ sung một phần công nghệ của mô hình Gemini mới vào trợ lý AI Bard và cho biết, họ có kế hoạch phát hành phiên bản Gemini tiên tiến nhất thông qua Bard vào đầu năm tới.

Alphabet cũng thông tin thêm rằng, họ đang tạo ra ba phiên bản Gemini khác nhau, mỗi phiên bản được thiết kế để sử dụng một lượng sức mạnh xử lý khác nhau.

Theo đó, phiên bản mạnh nhất được thiết kế để chạy trong các trung tâm dữ liệu và phiên bản nhỏ nhất sẽ chạy hiệu quả trên thiết bị di động.

Gemini là mô hình AI lớn nhất mà đơn vị DeepMind AI của Google từng tạo ra, nhưng chi phí vận hành của nó lại rẻ hơn đáng kể so với các mô hình trước đây của công ty, Phó Chủ tịch DeepMind Eli Collins cho biết.

“Nó không chỉ có khả năng cao hơn mà còn hoạt động hiệu quả hơn nhiều” – ông Collins nói.

Alphabet cũng đã công bố thế hệ chip AI mới của mình. Chip Cloud TPU v5p được thiết kế để đào tạo các mô hình AI lớn và được ghép lại với nhau thành các nhóm gồm 8.960 chip nhỏ.

Tìm hiểu về Deep Learning: Ứng dụng, thuật toán và kỹ thuật phổ biến

Deep Learning là một chức năng của trí tuệ nhân tạo (AI) tạo ra các mẫu từ dữ liệu và đưa ra quyết định. Bài viết này giải thích về Deep Learning và các thuật toán phổ biến trong lĩnh vực này.

Deep Learning là một chức năng của trí tuệ nhân tạo (AI), bắt chước cách bộ não con người hoạt động để xử lí dữ liệu, tạo ra các mẫu để sử dụng cho việc đưa ra quyết định. Vậy Deep Learning là gì? Bài viết này sẽ cung cấp những kiến thức cơ bản nhất về Deep Learning, ứng dụng của nó cũng như một số thuật toán và kỹ thuật phổ biến trong lĩnh vực này.

Deep Learning là gì?

Deep Learning (học sâu) có thể được xem là một lĩnh vực con của Machine Learning (học máy) – ở đó các máy tính sẽ học và cải thiện chính nó thông qua các thuật toán. Deep Learning được xây dựng dựa trên các khái niệm phức tạp hơn rất nhiều, chủ yếu hoạt động với các mạng nơ-ron nhân tạo để bắt chước khả năng tư duy và suy nghĩ của bộ não con người.
Thật ra các khái niệm liên quan đến mạng nơ-ron nhân tạo và Deep Learning đã xuất hiện từ khoảng những năm 1960, tuy nhiên nó lại bị giới hạn bởi khả năng tính toán và số lượng dữ liệu lúc bấy giờ. Trong những năm gần đây, những tiến bộ trong phân tích dữ liệu lớn (Big Data) đã cho phép ta tận dụng được tối đa khả năng của mạng nơ-ron nhân tạo.

Mạng nơ-ron nhân tạo chính là động lực chính để phát triển Deep Learning. Các mạng nơ-ron sâu (DNN) bao gồm nhiều lớp nơ-ron khác nhau, có khả năng thực hiện các tính toán có độ phức tạp rất cao. Deep Learning hiện đang phát triển rất nhanh và được xem là một trong những bước đột phá lớn nhất trong Machine Learning. Trong phần dưới đây, Vietnix sẽ làm rõ khái niệm Deep Learning là gì thông qua cơ chế hoạt động, ưu và nhược điểm của nó.

Deep Learning là một phương pháp của Machine Learning. Mạng nơ-ron nhân tạo trong Deep Learning được xây dựng để mô phỏng khả năng tư duy của bộ não con người.

Một mạng nơ-ron bao gồm nhiều lớp (layer) khác nhau, số lượng layer càng nhiều thì mạng sẽ càng “sâu”. Trong mỗi layer là các nút mạng (node) và được liên kết với những lớp liền kề khác. Mỗi kết nối giữa các node sẽ có một trọng số tương ứng, trọng số càng cao thì ảnh hưởng của kết nối này đến mạng nơ-ron càng lớn.

Mỗi nơ-ron sẽ có một hàm kích hoạt, về cơ bản thì có nhiệm vụ “chuẩn hoá” đầu ra từ nơ-ron này. Dữ liệu được người dùng đưa vào mạng nơ-ron sẽ đi qua tất cả layer và trả về kết quả ở layer cuối cùng, gọi là output layer.
Trong quá trình huấn luyện mô hình mạng nơ-ron, các trọng số sẽ được thay đổi và nhiệm vụ của mô hình là tìm ra bộ giá trị của trọng số sao cho phán đoán là tốt nhất.

Các hệ thống Deep Learning yêu cầu phần cứng phải rất mạnh để có thể xử lý được lượng dữ liệu lớn và thực hiện các phép tính phức tạp. Nhiều mô hình Deep Learning có thể mất nhiều tuần, thậm chí nhiều tháng để triển khai trên những phần cứng tiên tiến nhất hiện nay.

Ưu nhược điểm của Deep Learning

Dưới đây là một số ưu và nhược điểm của Deep Learning:

Ưu điểm

Deep Learning là một bước ngoặt to lớn trong lĩnh vực trí tuệ nhân tạo, cho phép khác nhà khoa học dữ liệu xây dựng nhiều mô hình có độ chính xác rất cao trong lĩnh vực nhận dạng ảnh, xử lý ngôn ngữ tự nhiên, xử lý giọng nói,… Một số ưu điểm vượt trội của Deep Learning gồm có:

Kiến trúc mạng nơ-ron linh hoạt, có thể dễ dàng thay đổi để phù hợp với nhiều vấn đề khác nhau.
Có khả năng giải quyết nhiều bài toán phức tạp với độ chính xác rất cao.
Tính tự động hoá cao, có khả năng tự điều chỉnh và tự tối ưu.
Có khả năng thực hiện tính toán song song, hiệu năng tốt, xử lý được lượng dữ liệu lớn.

Nhược điểm

Bên cạnh những ưu điểm, mặt khác, hiện nay Deep Learning vẫn còn nhiều khó khăn và hạn chế, chẳng hạn như:

Cần có khối lượng dữ liệu rất lớn để tận dụng tối đa khả năng của Deep Learning.
Chi phí tính toán cao vì phải xử lý nhiều mô hình phức tạp.
Chưa có nền tảng lý thuyết mạnh mẽ để lựa chọn các công cụ tối ưu cho Deep Learning.

Deep Learning giải quyết những vấn đề gì?

Kiến trúc mạng nơ-ron trong Deep Learning được ứng dụng trong các công việc yêu cầu sức mạnh tính toán cao, xử lý nhiều dữ liệu và độ phức tạp lớn. Trong phần này, ta sẽ cùng tìm hiểu 5 ứng dụng thân thuộc nhất của Deep Learning trong đời sống hàng ngày:

Xe tự lái

Một trong những công nghệ mới và hấp dẫn nhất hiện nay là xe tự động lái, nó được xây dựng dựa trên các mạng nơ-ron cấp cao. Nói một cách đơn giản, các mô hình Deep Learning sẽ nhận diện các đối tượng ở môi trường xung quanh xe, tính toán khoảng cách giữa xe và các phương tiện khác, xác định vị trí làn đường, tín hiệu giao thông,… từ đó đưa ra được các quyết định tối ưu và nhanh chóng nhất. Một trong những hãng xe tiên phong trong việc sản xuất xe tự lái hiện nay là Tesla

Phân tích cảm xúc

Đây là lĩnh vực phân tích cảm xúc của con người thông qua việc xử lý ngôn ngữ tự nhiên, phân tích văn bản và thống kê. Các công ty có thể ứng dụng Deep Learning để hiểu và phán đoán cảm xúc của khách hàng dựa trên những đánh giá, bình luận, tweet,… từ đó đưa ra những chiến lược kinh doanh và marketing phù hợp với từng nhóm đối tượng.

Trợ lý ảo

Trợ lý ảo đang được ứng dụng rất nhiều trong đời sống hàng ngày, trong đó phổ biến gồm có chatbot, giảng viên online, Google Assistant, Siri, Cortana,… Các trợ lý ảo được xây dựng dựa trên Deep Learning với các thuật toán nhận diện văn bản, xử lý ngôn ngữ tự nhiên, nhận dạng giọng nói.

Mạng xã hội

Một số nền tảng mạng xã hội lớn như Twitter cũng ứng dụng các thuật toán Deep Learning để cải thiện các dịch vụ của mình. Cụ thể, những trang này sẽ phân tích một lượng lớn dữ liệu thông qua mạng nơ-ron nhân tạo để tìm hiểu về các tuỳ chọn của người dùng. Ngoài ra, Instagram cũng sử dụng Deep Learning để tránh các hành vi bạo lực trên không gian mạng, chặn các bình luận vi phạm, không phù hợp,…

Facebook cũng không nằm ngoài danh sách các mạng xã hội ứng dụng Deep Learning vào sản phẩm của mình. Các thuật toán mạng nơ-ron sâu được sử dụng để gợi ý trang, bạn bè, dịch vụ, nhân diện khuôn mặt,…

Chăm sóc sức khoẻ

Deep Learning cũng có đóng góp không nhỏ vào lĩnh vực y tế, trong đó phổ biến gồm có các mô hình dự đoán tình trạng bệnh, chẩn đoán ung thư, phân tích kết quả MRI, X-ray,…

Khi nào nên sử dụng Deep Learning?

Tiến sĩ Scott Clark, đồng sáng lập và CEO của SigOpt, cho rằng Deep Learning hiệu quả nhất đối với các dữ liệu không tuân theo một cấu trúc cụ thể. Một số ví dụ phổ biến gồm có văn bản, video, hình ảnh hay dữ liệu dạng thời gian. Các thuật toán Deep Learning có khả năng tự động xây dựng và khai thác các mẫu có trong dữ liệu để đưa ra được quyết định tối ưu. Tuy nhiên, việc này cần rất nhiều dữ liệu và tài nguyên tính toán để có được độ chính xác tốt nhất.
Mỗi mô hình mạng nơ-ron nhân tạo có thể bao gồm hàng trăm, thậm chí hàng triệu tham số khác nhau. Vì vậy việc tối ưu các tham số này đòi hỏi người xây dựng mô hình phải có kiến thức chuyên sâu và nhiều kinh nghiệm. Bên cạnh đó, các mạng nơ-ron nhân tạo sử dụng nhiều hàm phi tuyến có độ phức tạp cao nên việc hiểu và diễn giải các kết quả từ mô hình cũng là một thách thức lớn với các chuyên gia. Vì vậy, với những dự án yêu cầu nhiều tương tác và phản hồi từ con người thì Deep Learning không hẳn là một lựa chọn lý tưởng.

Có nên sử dụng Deep Learning thay cho Machine Learning?

Mặc dù có hiệu năng và độ chính xác vượt trội nhờ vào nhiều mô hình phức tạp và nguồn dữ liệu khổng lồ, Deep Learning không hẳn là lựa chọn duy nhất cho các bài toán trong lĩnh vực trí tuệ nhân tạo và học máy. Việc quyết định có nên ứng dụng Deep Learning hay không phụ thuộc phần lớn vào mục tiêu và chiến lược kinh doanh cụ thể, số lượng dữ liệu, tài nguyên,… Vậy những yếu tố nên cân nhắc trước khi quyết định sử dụng các mô hình Deep Learning là gì? Hãy cùng tìm hiểu tiếp ở trong phần dưới đây.

Độ phức tạp và mục tiêu của dự án

Một trong những lợi thế lớn nhất của Deep Learning chính là khả năng giải quyết các vấn đề phức tạp, phân tích và học được những mỗi quan hệ ẩn trong dữ liệu. Deep Learning đặc biệt hữu ích nếu dự án cần xử lý nhiều dữ liệu ở dạng phi cấu trúc, chẳng hạn như phân loại hình ảnh, xử lý ngôn ngữ tự nhiên, nhận diện giọng nói,…

Mặt khác, đối với những vấn đề có độ phức tạp vừa phải, không yêu cầu nặng về mặt tính toán, ít tài nguyên và dữ liệu,… thì các thuật toán Machine Learning sẽ là một lựa chọn hợp lý hơn.

Tài nguyên

Bùng nổ dữ liệu lớn trong những năm gần đây đã giúp việc xây dựng các mô hình Deep Learning trở nên dễ dàng hơn. Tuy nhiên, đây vẫn là một lĩnh vực vô cùng phức tạp và tốn kém. Vì phải xử lý lượng dữ liệu vô cùng lớn nên các mô hình Deep Learning thường rất nặng về mặt tài nguyên tính toán và GPU để có được hiệu năng tốt nhất.

Mặt khác, những thuật toán Machine Learning cổ điển chỉ cần một CPU và phần cứng vừa phải, tốc độ nhanh hơn và có thể dễ dàng thử nghiệm nhiều kỹ thuật, mô hình khác nhau mà không cần lo ngại về tài nguyên và thời gian tính toán.

Số lượng dữ liệu

Thuật toán Deep Learning có thể tìm ra được các mối quan hệ ẩn sâu trong những bộ dữ liệu. Tuy nhiên việc này cũng đồng nghĩa với lượng dữ liệu đầu vào (dữ liệu đã được gán nhãn) phải lớn hơn nhiều so với các thuật toán Machine Learning. Việc gán nhãn dữ liệu cũng yêu cầu nguồn lực và thời gian lớn, đặc biệt là trong lĩnh vực y tế phải yêu cầu chuyên môn cao mới có khả năng gán nhãn dữ liệu chính xác. Trong những trường hợp này, ta có thể nghĩ đến việc sử dụng các thuật toán Machine Learning cổ điển thay vì Deep Learning.

Các kỹ thuật Deep Learning

Có rất nhiều kỹ thuật và thuật toán Deep Learning khác nhau, từ đơn giản đến vô cùng phức tạp, có thể ứng dụng vào hầu hết các bài toán trong lĩnh vực trí tuệ nhân tạo hiện nay. Ở phần cuối của bài viết, ta sẽ tìm hiểu một số kỹ thuật Deep Learning phổ biến nhất hiện nay.

Mạng nơ-ron cổ điển

Kiến trúc cổ điển của mạng nơ-ron là mạng kết nối đầy đủ, thường được xác định bằng các perceptron đa lớp. (Perceptron là một thuật toán đơn giản, cho phép tìm một ranh giới siêu phẳng cho các bài toán phân lớp nhị phân). Mạng nơ-ron cổ điển được thiết kế bởi Fran Rosenblatt vào năm 1958, chủ yếu được sử dụng cho các bài toán phân lớp nhị phân. Có ba loại hàm thường được sử dụng trong mô hình này là:

Hàm tuyến tính.
Hàm phi tuyến: gồm có hàm sigmoid, hàm tanh và hàm ReLU (Rectified Linear Unit).

Kiến trúc mạng nơ-ron cổ điển tương đối đơn giản, phù hợp nhất với các bộ dữ liệu có dạng bảng hoặc những bài toán phân loại, hồi quy có đầu vào là giá trị thực.

Mạng nơ-ron tích chập (CNN)

Mạng nơ-ron tích chập (Convolutional Neural Network – CNN) là một kiến trúc Neural Network nhân tạo nâng cao, được xây dựng để giải quyết các bài toán phức tạp, đặc biệt là liên quan đến xử lý hình ảnh.

Tích chập là một khái niệm trong xử lý tín hiệu số nhằm biến đổi thông tin đầu vào qua một phép tích chập với bộ lọc, nhằm trả về đầu ra là một tín hiệu mới. Tín hiệu này sẽ giảm bớt những đặc trưng mà bộ lọc không quan tâm, giữ lại những đặc trưng chính và quan trọng nhất.

Bên cạnh input layer và output layer, mô hình CNN còn có thêm một sampling layer để giới hạn số lượng nơ-ron tham gia vào các layer tương ứng. Việc xây dựng mô hình trải qua ba giai đoạn chính:

Quá trình tích chập (convolution): Thông qua các tích chập giữa ma trận đầu vào với bộ lọc để tạo thành các đơn vị trong một tầng mới. Quá trình này có thể diễn ra liên tục ở phần đầu của mạng và thường sử dụng kèm với hàm kích hoạt ReLU. Mục tiêu của tầng này là trích suất đặc trưng hai chiều.
Quá trình tổng hợp (max pooling): Giảm kích thước khối ma trận đầu vào thông qua việc tìm ra 1 giá trị đại diện cho mỗi một vùng không gian mà bộ lọc đi qua sẽ không làm thay đổi các đường nét chính của bức ảnh nhưng lại giảm được kích thước của ảnh.
Quá trình kết nối hoàn toàn (fully connected): Sau khi đã giảm kích thước đến một mức độ hợp lý, ma trận cần được trải phẳng (flatten) thành một vector và sử dụng các kết nối hoàn toàn giữa các tầng. Tầng kết nối hoàn toàn cuối cùng (fully connected layer) sẽ có số lượng đơn vị bằng với số lớp.

Dựa vào những đặc điểm của mình, các ứng dụng phổ biến nhất của mạng CNN gồm có: Nhận diện, phân tích và phân khúc hình ảnh, phân tích video, xử lý ngôn ngữ tự nhiên,…

Mạng nơ-ron hồi quy (RNN)

Recurrent Neural Network (RNN) là một thuật toán nổi tiếng trong lĩnh vực xử lý ngôn ngữ tự nhiên. Trong các mô hình mạng nơ-ron truyền thống, đầu vào và đầu ra độc lập với nhau, tuy nhiên RNN thực hiện cùng một tác vụ cho tất cả phần tử của một chuỗi với đầu ra phụ thuộc vào cả các phép tính trước đó. Vì vậy mạng RNN có khả năng nhớ các thông tin được tính toán trước đó.

Có hai thiết kế chính của RNN:

LSTM (Long Short-Term Memory): Được dùng để dự đoán dữ liệu dạng chuỗi thời gian, có khả năng bỏ đi hoặc thêm các thông tin cần thiết, được điều chỉnh bởi các nhóm được gọi là cổng (gate): Input, Output và Forget.
Gated RNN: Cũng là một thiết kế phổ biến trong lĩnh vực dự đoán dữ liệu của chuỗi thời gian, có hai cổng là Update và Reset.

Các dạng bài toán RNN:

One to one: Chỉ có một input kết nối với một output duy nhất, chẳng hạn như các bài toán phân loại hình ảnh.
One to many: Một input liên kết với nhiều chuỗi output, phổ biến là các bài toán đặt caption cho ảnh.
Many to One: Nhiều input nhưng chỉ có output, ví dụ phổ biến là bài toán phân loại cảm xúc.
Many to many: Nhiều input và nhiều output, chẳng hạn như phân loại video.

Mạng sinh đối nghịch (GAN)

Generative Adversarial Networks (GAN) là lớp mô hình có mục tiêu tạo ra dữ liệu giả giống với thật, tên của mạng được dựa trên kiến trúc gồm hai mạng có mục tiêu đối nghịch nhau: Generator và Discriminator. Trong đó Generator học cách sinh dữ liệu giả để lừa mô hình Discriminator, còn Discriminator lại học cách phân biệt giữa dữ liệu giả và dữ liệu thật. Thông qua quá trình huấn luyện thì cả hai mô hình này đều cùng cải thiện được khả năng của mình.

Một số ứng dụng phổ biến của GAN là: Tạo khuôn mặt người, thay đổi độ tuổi khuôn mặt, sinh ảnh vật thể, tạo nhân vật hoạt hình,…

Boltzmann machine

Đây là một mô hình mạng không có hướng xác định, vì vậy các node của mạng này được liên kết với nhau thành một hình tròn. Dựa vào kiến trúc này, máy Boltzmann (Boltzmann machine) thường được sử dụng để tạo ra các tham số cho mô hình. Các ứng dụng phổ biến nhất của mô hình là: giám sát hệ thống, xây dựng hệ thống khuyến nghị nhị phân,…

Học tăng cường sâu

Deep Reinforcement Learning là quá trình mà các tác tử (agent) tương tác với môi trường để thay đổi trạng thái của chính nó. Các tác tử có thể quan sát và thực hiện những hành động phù hợp, từ đó giúp mạng đạt được mục tiêu.

Mô hình mạng này gồm một input layer, output layer và nhiều hidden layer khác, trong đó trạng thái của môi trường chính là input layer. Mô hình sẽ huấn luyện liên tục để dự đoán điểm đạt được sau mỗi hành động được thực hiện trong từng trạng thái nhất định.

Mô hình học tăng cường sâu được ứng dụng chủ yếu trong các game cờ vua, poker, xe tự lái, robot,…

Autoencoder

Autoencoder là một trong những kỹ thuật Deep Learning phổ biến nhất hiện nay, có khả năng học các biểu diễn của dữ liệu đầu vào mà không cần nhãn, hay nói cách khác thì mạng này có khả năng học không giám sát (unsupervised learning).

Một số loại autoencoder chính gồm có:

Sparse (thưa): Số lượng hidden layer lớn hơn số lượng input layer nhằm hạn chế hiện tượng quá khớp (overfitting). Phương pháp này giới hạn hàm mất mát và ngăn không cho autoencoder lạm dụng tất cả các node có trong mạng.
Denoising (lọc nhiễu): Một phiên bản input được chuyển thành 0 ngẫu nhiên.
Contractive: Bổ sung hệ số phạt vào hàm mất mát để hạn chế overfitting trong trường hợp số lượng hidden layer lớn hơn input layer.
Stacked: Xếp chồng nhiều hidden layer lên nhau để tạo thành một mạng autoencoder.

Các ứng dụng phổ biến: Phát hiện đặc trưng, xây dựng hệ thống khuyến nghị, bổ sung đặc trưng cho tập dữ liệu,…

Backpropagation

Lan truyền ngược (backpropagation) là một trong những kỹ thuật quan trọng nhất của mạng nơ-ron. Về cơ bản thì đây là phương pháp giúp tính gradient ngược từ layer cuối cùng đến layer đầu tiên của mạng. Trước hết, mạng sẽ phân tích các tham số rồi điều chỉnh thông qua hàm mất mát. Tiếp theo, giá trị lỗi được tính toán sẽ lan truyền ngược lại để điều chỉnh các tham số cho phù hợp.

Gradient Descent

Trong Deep Learning và tối ưu hoá, ta thường phải tìm giá trị nhỏ nhất (hoặc lớn nhất) của một hàm số nào đó. Tuy nhiên việc tìm các điểm tối ưu toàn cục của hàm mất mát thường rất phức tạp, đôi khi là bất khả thi. Do đó ta có thể cố gắng tìm những điểm cực tiểu địa phương và có thể xem là nghiệm cần tìm của bài toán.

Các điểm cực tiểu địa phương về mặt toán học là nghiệm học phương trình đạo hàm bằng 0, tuy nhiên việc giải phương trình đạo hàm bằng 0 gần như là không thể trong Machine Learning hay Deep Learning. Một cách tiếp cận phổ biến là xuất phát từ một điểm mà ta coi là gần với nghiệm của bài toán, sau đó dùng một phép lặp để tiến dần đến điểm cần tìm. Phương pháp này được gọi là hạ gradient và được sử dụng vô cùng phổ biến trong tối ưu.

Với các mạng nơ-ron hiện đại, nhờ vào thuật toán lan truyền ngược mà gradient descent có thể nhanh hơn hàng triệu lần so với cách truyền thống.

Câu hỏi thường gặp

Deep Learning và AI có giống nhau không?

Trí tuệ nhân tạo là khái niệm tạo ra những cỗ máy thông minh. Mặt khác, Deep Learning là một tập hợp con của trí tuệ nhân tạo giúp bạn xây dựng các ứng dụng dựa trên AI.
Deep Learning là một tập hợp con của Machine Learning sử dụng khối lượng lớn dữ liệu và các thuật toán phức tạp để phát triển một mô hình.

Deep Learning được sử dụng như thế nào trong thế giới thực?

Ngày nay, phương pháp Deep Learning cũng đang được sử dụng trong
các chương trình dịch tự động, chuyển đổi văn bản từ ngôn ngữ này sang ngôn ngữ khác mà không yêu cầu người dùng nhập các từ hoặc cụm từ đã dịch trước đó theo cách thủ công.

Lời kết

Trong bài viết này ta đã tìm hiểu Deep Learning là gì, các ứng dụng phổ biến và những trường hợp nên sử dụng Deep Learning. Phần cuối của bài viết cũng đã khái quát một số kỹ thuật phổ biến và đặc biệt quan trọng trong Deep Learning. Đây không hẳn là một lĩnh vực quá mới mẻ, nhưng sự bùng nổ dữ liệu trong nhiều năm gần đây đã giúp các nhà khoa học tận dụng được tối đa khả năng của các mô hình mạng nơ-ron nhân tạo, tạo tiền đề cho việc giải quyết nhiều bài toán tưởng chừng như là bất khả thi trong nhiều năm về trước. Hy vọng bài viết trên đã cung cấp cho bạn những kiến thức hữu ích. Nếu còn điều gì thắc mắc hay đóng góp ý kiến, bạn hãy bình luận bên dưới nhé.

Các bước cơ bản để học trí tuệ nhân tạo

Trí tuệ nhân tạo hay trí thông minh nhân tạo (Artificial intelligence hay Machine intelligence – AI) là một ngành thuộc lĩnh vực khoa học máy tính (Computer science). AI là trí tuệ do con người lập trình với mục tiêu giúp máy tính có thể tự động hóa các hành vi thông minh như con người. Hãy cùng tìm hiểu 6 bước sau đây để bắt đầu học về trí tuệ nhân tạo nhé!

Bước 1: Tìm hiểu về Python và SQL

Điều cốt yếu mà bạn phải làm là phải học một ngôn ngữ lập trình. Mặc dù trong thực tế có rất nhiều ngôn ngữ mà bạn có thể bắt đầu, nhưng Python là sự lựa chọn tốt nhất vì các thư viện của nó phù hợp hơn với Machine Learning.

Bạn có thể tham khảo các liên kết dưới đây:

Machine Learning with Text in scikit-learn (PyCon 2016)
Machine learning in Python with scikit-learn
Machine learning with Python
Machine Learning Part 1 | SciPy 2016 Tutorial

Bước 2: Học trí tuệ nhân tạo từ một số khóa học dưới đây

Artificial Intelligence: Principles and Techniques from Stanford – Một chương trình giáo dục xuất sắc cho những học giả, những người được truyền cảm hứng bằng cách làm quen nhiều hơn về AI. Khóa học tập trung vào các tiêu chuẩn cơ bản của AI.

CS405: ARTIFICIAL INTELLIGENCE: Giới thiệu lĩnh vực trí tuệ nhân tạo (AI). Các tài liệu về lập trình AI, logic, tìm kiếm, chơi trò chơi, nghiên cứu máy móc, hiểu ngôn ngữ tự nhiên và robot giới thiệu với sinh viên về phương pháp AI, công cụ và kỹ thuật, ứng dụng đối với các vấn đề tính toán và vai trò của AI.

edx.org course on AI: Khóa học này cung cấp các nguyên tắc cơ bản của Artificial Intelligence (AI) và cách áp dụng chúng. Thiết kế các intelligent agent để giải quyết các vấn đề trong thế giới thực bao gồm tìm kiếm, trò chơi, nghiên cứu máy móc, logic và sự hạn chế trong các vấn đề.

MIT’s course on AI: Khóa học này giới thiệu cho sinh viên kiến thức cơ bản, giải quyết vấn đề và phương pháp học tập của trí tuệ nhân tạo. Sau khi hoàn thành khóa học này, sinh viên sẽ có thể phát triển các hệ thống thông minh bằng cách ứng dụng các giải pháp cho các vấn đề tính toán cụ thể; hiểu vai trò của lập trình tri thức, giải quyết vấn đề và học tập trong hệ thống kỹ thuật thông minh. Khóa học đánh giá cao vai trò của việc giải quyết vấn đề, tầm nhìn và ngôn ngữ trong việc hiểu trí tuệ thông minh của con người từ góc độ tính toán.

Learn the Fundamentals of AI – Khóa học trực tuyến này, được chia thành 10 bài học, giúp sinh viên hiểu rõ hơn về vũ trụ AI. Để hiểu nó, hãy đảm bảo bạn có một số thông tin cần thiết về toán học dựa trên biến trực tiếp và giả thuyết khả năng. Bạn nên học cách ghi nhớ mục tiêu cuối cùng để chuẩn bị trước.

Berkeley Video Lecturers: Khóa học bao gồm các bài giảng bằng video.

Trên đây là 6 khóa học về trí tuệ nhân tạo hàng đầu cho người mới bắt đầu và nâng cao. Hy vọng chúng sẽ hữu ích cho bạn.

Bước 3: Tìm hiểu kiến thức cơ bản về lý thuyết xác suất, thống kê và Toán học

Bạn có thể tham khảo các liên kết dưới đây:

Đại số tuyến tính – Linear Algebra – MIT 18.06 Đại số tuyến tính của Gilbert Strang (Link tham khảo: https://www.youtube.com/watch?list=PLE7DDD91010BC51F8&v=ZK3O402wf1c)
Lý thuyết xác suất và thống kê – Probability and Statistics – MIT 6.041 Phân tích hệ số xác suất và xác suất ứng dụng của John Tsitsiklis (Link tham khảo: https://www.youtube.com/watch?list=PLUl4u3cNGP61MdtwGTqZA0MreSaDybji8&v=j9WZyLZCBzs)
Calculus (Link tham khảo: http://kisonecat.com/teaching/2013/calculus-one/)
Multivariate Calculus (Link tham khảo: http://kisonecat.com/teaching/2014/m2o2c2/)
Graph theory (Link tham khảo: https://class.coursera.org/pgm-003)
Optimization methods (Link tham khảo: https://online.stanford.edu/courses)

Bước 4: Đọc sách

http://aima.cs.berkeley.edu/
Artificial Intelligence: A Modern Approach, của Stuart J. Russell và Peter Norvig
http://wps.aw.com/wps/media/objects/5771/5909832/PDF/Luger_0136070477_1.pdf
The Quest for Artificial Intelligence của Nils J. Nilsson (Link tham khảo: http://ai.stanford.edu/~nilsson/QAI/qai.pdf)
Practical Artificial Intelligence: Programming in Java của Mark Watson (Link tham khảo: https://www.saylor.org/site/wp-content/uploads/2011/11/CS405-1.1-WATSON.pdf)
https://grey.colorado.edu/CompCogNeuro/index.php/CCNBook/Main
Simply Logical: Intelligent Reasoning by Example của Peter Flach (Link tham khảo: https://www.cs.bris.ac.uk/~flach/SL/SL.pdf)
The AI Revolution: Road to Superintelligence (Link tham khảo: https://waitbutwhy.com/2015/01/artificial-intelligence-revolution-1.html)
http://psych.colorado.edu/~oreilly/comp_ex_cog_neuro.html

Bước 5: Thực hành

Khi bạn có một sự hiểu biết đầy đủ về ngôn ngữ lập trình ưa thích của mình và thực hành đủ với các yếu tố cần thiết, bạn nên bắt đầu tìm hiểu thêm về Machine Learning. Trong Python, bắt đầu học các thư viện Scikit-learning, NLTK, SciPy, PyBrain và Numpy sẽ có giá trị trong khi soạn các thuật toán Machine Learning.

Thực hành vài bài tập về Scikit từ trang web:

http://scikit-learn.org/ và https://www.edx.org/course/artificial-intelligence-ai-columbiax-csmm-101x-0 (dành cho các bài tập thực hành bằng Python).

Ngoài ra ở đây là một bản tóm tắt các tài liệu để để tìm hiểu và trau dồi Machine Learning:

Bước 6: Thực hành – Học – Thực hành …

Với trình tự này, từng bước một, bạn sẽ từ từ trở thành một lập trình viên AI.

Một khi tất cả 6 bước được thực hiện, bạn đã có thể tự tin để bắt đầu với AI/ML rồi. Chúc bạn thành công!

Học gì để học lập trình trí tuệ nhân tạo

Trí tuệ nhân tạo đang là một chủ dề mới đón nhận nhiều sự quan tâm hiện nay. Vậy trí tuệ nhân tạo AI là gì? Học trí tuệ nhân tạo như thế nào? Tự học lập trình trí tuệ nhân tạo có ổn không? Cùng mình tìm hiểu qua bài viết này nhé.

Trí tuệ nhân tạo AI là gì?

AI là từ viết tắt của Artifical Intelligence hay còn được gọi là trí tuệ nhân tạo là một ngành thuộc lĩnh vực khoa học máy tính (Computer science).Trí tuệ nhân tạo AI là trí tuệ do con người lập trình với mục đích giúp máy tính có thể tự động hóa về các hành vi thông minh giống như con người.

Khái niệm AI được hình thành, xuất hiện đầu tiên bởi John McCarthy, ông là một nhà khoa học máy tính Mỹ, vào năm 1956 tại Hội nghị The Dartmouth. Còn hiện nay, AI là một thuật ngữ bao gồm nhiều thứ từ quá trình tự động hoá robot đến người máy thực tế.

Hãy cùng mình tìm hiểu các bước sau đây để bắt đầu học lập trình trí tuệ nhân tạo nhé.

Bước 1: Tìm hiểu về Ngôn ngữ Python và SQL

Điều quan trọng là cần phải học một ngôn ngữ lập trình. Mặc dù trong thực tế có rất nhiều ngôn ngữ mà bạn có thể bắt đầu học, nhưng Python thật sự là sự lựa chọn tốt nhất bơi những thư viện của nó phù hợp nhiều với Machine Learning.

Những Lý mà Python được sử dụng phổ biến nhất trong các dự án Học máy và dự án AI bao gồm:

Tính linh hoạt
Tính đơn giản và nhất quán.
Cho phép truy cập vào các thư viện và framework tuyệt vời cho AI và học máy (ML).
Độc lập nền tảng
Và cộng đồng rộng lớn.

Từ những điều này càng làm cho Python ngày càng phổ biến hơn.

Bước 2: Học trí tuệ nhân tạo từ một số khóa học

Elements of AI

Đây là khóa học online của đại học Phần Lan nhằm mục đích cung cấp kiến thức về AI cấp độ rất cơ bản. Nếu quan tâm tới chủ đề AI và muốn tìm một nơi để học hỏi tìm hiểu thêm về nó thì đây chính là khóa học dành cho bạn.

Google AI education

Google AI education là trang cung cấp các tài nguyên học gồm các khóa học, video, hội thảo, tài liệu,…. dành cho tất cả mọi người ở nhiều cấp khác nhau.

Bước 3: Tìm hiểu kiến thức cơ bản về lý thuyết xác suất, thống kê và toán học

Bạn có thể tham khảo các tài liệu:

Đại số tuyến tính – Linear Algebra:
Lý thuyết xác suất và thống kê:

Bước 4: Đọc sách

Đọc sách để có thêm nhiều kiến thức về trí tuệ nhân tạo, sự phát triển của nó như thế nào. Hiện nay, vẫn còn nhiều tranh cãi về chủ đề này, nhưng không thể phủ nhận được vai trò của AI trong sự phát triển của nền kinh tế. Trí tuệ nhân tạo cũng là yếu tố cốt lõi trong cuộc cách mạng công nghiệp lần thứ tư đang diễn ra hiện nay.

Bước 5: Thực hành

Khi bạn đã có một sự hiểu biết đầy đủ về ngôn ngữ lập trình ưa thích của mình và thực hành đủ với những yếu tố cần thiết, bạn nên bắt đầu tìm hiểu thêm về Machine Learning. Trong Python, bắt đầu học với các thư viện Scikit-learning, NLTK, SciPy, PyBrain và Numpy sẽ có giá trị trong khi soạn các thuật toán Machine Learning.

Bước 6: Thực hành – Học – Tự mình thực hành

Với trình tự này, từng bước một, bạn sẽ từ từ trở thành một lập trình viên AI.

Cập nhật tin tức mới về AI

Ngày nay, trí tuệ nhân tạo đang tạo nên một làn sóng mới trên toàn cầu. Có rất nhiều tập đoàn công nghệ hàng đầu đã đổ không ít tiền vào những dự án nghiên cứu và các ứng dụng AI trong thực tế.
Các tập đoàn Google, Facebook hay Microsoft cũng đang tham gia vào những dự án này, bạn nên tìm hiểu những tin tức về AI trên chuyên trang công nghệ chính thức để tìm hiểu và nắm rõ hơn về AI.

Top những ngôn ngữ lập giúp bạn lập trình trí tuệ nhân tạo

Ngôn ngữ lập trình trí tuệ nhân tạo Python

Để lập trình trí tuệ nhân tạo phải kể đến Python. Lập trình trí tuệ nhân tạo ngày nay đang phát triển, xây dựng theo 2 xu hướng:

Một là sản xuất ra các máy móc bắt chước con người.
Hai là xây dựng, phát triển máy tính trở nên cực kỳ thông minh, hoạt động độc lập với suy nghĩ con người.

Ngôn ngữ lập trình Python là một ngôn ngữ phổ biến, nó được ứng dụng nhiều nhất, dễ học và nó có nhiều thư viện hữu ích cho việc sử dụng trong lập trình trí tuệ nhân tạo. Những thư viện như thư viện Scrypy, Pybrain hay Numpy…

Ngôn ngữ lập trình trí tuệ nhân tạo Java

Hiện nay, Java là một ngôn ngữ lập trình tuyệt vời. Trong việc lập trình trí tuệ nhân tạo cần phải sử dụng rất nhiều thuật toán. Nhưng, nếu sử dụng ngôn ngữ Java, bạn sẽ không phải lo lắng điều đó quá nhiều. Ngôn ngữ lập trình này sẽ giúp bạn giải quyết những vấn đề này một cách dễ dàng hơn. Ứng dụng của ngôn ngữ lập trình JAVA vào những lĩnh vực đời sống rất đa dạng, phong phú, độ chuẩn xác cao.

Ngôn ngữ lập trình trí tuệ nhân tạo C++

Ngôn ngữ lập trình C++ hiện được đánh giá là ngôn ngữ lập trình nhanh nhất thế giới. C++ có thể dùng sử dụng vào những kỹ thuật thống kê như neural network, thời gian thực thi nhanh chóng, tốc độ thực thi tăng đáng kể… Điều này chính là nhờ vào khả năng giao tiếp phần cứng cực kỳ tốt của C++.

Ngôn ngữ lập trình trí tuệ nhân tạo Prolog

Đây là ngôn ngữ được sử dụng bao quát trong các hệ chuyên gia của AI và cũng rất phù hợp khi thực hiện các dự án y tế.

Ngôn ngữ lập trình trí tuệ nhân tạo Lisp

Lisp cũng là một ngôn ngữ đáng để lựa chọn cho dự án AI bởi vì các khả năng prototyping (tạo mẫu) tuyệt vời của nó. Lisp là một ngôn ngữ lập trình mạnh mẽ và được áp dụng trong các dự án AI lớn như Macsyma, DART, và CYC.

Vì sao chúng ta nên học lập trình trí tuệ nhân tạo?

Ngày nay, trí tuệ nhân tạo AI có vai trò rất quan trọng, nó giúp ích cho cuộc sống của con người và đó là một thành quả của sự lập trình. Vậy sao chúng ta lại không học lập trình AI để có thể giúp thay đổi cuộc sống của mỗi người trong theo hướng tích cực và tươi đẹp hơn rất nhiều. Ngoài ra, việc học lập trình còn giúp rèn luyện con người và giúp chúng ta có khả năng nắm bắt tốt các cơ hội trong cuộc sống.

Lập trình giúp chúng ta tốt hơn dù làm việc ở nhiều lĩnh vực khác

Việc học lập trình giúp chúng ta giỏi hơn trong các lĩnh vực, công việc khác. Việc học lập trình không hề có giới hạn cụ thể trong một ngành nghệ riêng biệt nào. Nó hoàn toàn có thể ứng dụng rộng rãi trong tất cả lĩnh vực và đời sống.

Giúp chúng ta tìm kiếm và tận dụng được nhiều cơ hội ở trong cuộc sống

Trong xã hội hiện đại, phát triển từng ngày như hiện nay. Mỗi cá nhân cần phải cố gắng, nỗ lực rất nhiều để có thể tự mình trở lên tốt hơn.

Học lập trình AI giúp ta trở lên linh hoạt hơn

Học lập trình tuy không quá khó thế nhưng để có thể giỏi lập trình thì lại là điều không hề dễ. Một trong những yếu tố cần thiết nhất ở người học lập trình AI đó là khả năng có thể tư duy một cách logic. Việc học lập trình AI còn là một cách vô cùng hiệu quả để giúp cho chúng ta rèn luyện khả năng suy luận và tư duy.

Nội dung

Deep Learning là gì?

Ưu nhược điểm của Deep Learning

Ưu điểm

Nhược điểm

Deep Learning giải quyết những vấn đề gì?

Xe tự lái

Phân tích cảm xúc

Trợ lý ảo

Mạng xã hội

Chăm sóc sức khoẻ

Khi nào nên sử dụng Deep Learning?

Có nên sử dụng Deep Learning thay cho Machine Learning?

Độ phức tạp và mục tiêu của dự án

Tài nguyên

Số lượng dữ liệu

Các kỹ thuật Deep Learning

Mạng nơ-ron cổ điển

Mạng nơ-ron tích chập (CNN)

Mạng nơ-ron hồi quy (RNN)

Mạng sinh đối nghịch (GAN)

Boltzmann machine

Học tăng cường sâu

Autoencoder

Backpropagation

Gradient Descent

Câu hỏi thường gặp

Deep Learning và AI có giống nhau không?

Deep Learning được sử dụng như thế nào trong thế giới thực?

Lời kết

Bước 1: Tìm hiểu về Python và SQL

Bước 2: Học trí tuệ nhân tạo từ một số khóa học dưới đây

Bước 3: Tìm hiểu kiến ​​thức cơ bản về lý thuyết xác suất, thống kê và Toán học

Bước 4: Đọc sách

Bước 5: Thực hành

Bước 6: Thực hành – Học – Thực hành …

Trí tuệ nhân tạo AI là gì?

Bước 1: Tìm hiểu về Ngôn ngữ Python và SQL

Bước 2: Học trí tuệ nhân tạo từ một số khóa học

Elements of AI

Google AI education

Bước 3: Tìm hiểu kiến ​​thức cơ bản về lý thuyết xác suất, thống kê và toán học

Bước 4: Đọc sách

Bước 5: Thực hành

Bước 6: Thực hành – Học – Tự mình thực hành

Cập nhật tin tức mới về AI

Top những ngôn ngữ lập giúp bạn lập trình trí tuệ nhân tạo

Ngôn ngữ lập trình trí tuệ nhân tạo Python

Ngôn ngữ lập trình trí tuệ nhân tạo Java

Ngôn ngữ lập trình trí tuệ nhân tạo C++

Ngôn ngữ lập trình trí tuệ nhân tạo Prolog

Ngôn ngữ lập trình trí tuệ nhân tạo Lisp

Vì sao chúng ta nên học lập trình trí tuệ nhân tạo?

Lập trình giúp chúng ta tốt hơn dù làm việc ở nhiều lĩnh vực khác

Giúp chúng ta tìm kiếm và tận dụng được nhiều cơ hội ở trong cuộc sống

Học lập trình AI giúp ta trở lên linh hoạt hơn

Bước 3: Tìm hiểu kiến thức cơ bản về lý thuyết xác suất, thống kê và Toán học

Bước 3: Tìm hiểu kiến thức cơ bản về lý thuyết xác suất, thống kê và toán học