Trang chủKhám phá
Machine Learning – Khởi đầu thú vị và tầm quan trọng đối với AI
Machine Learning – Khởi đầu thú vị và tầm quan trọng đối với AI

Machine Learning – Khởi đầu thú vị và tầm quan trọng đối với AI

Machine Learning – Khởi đầu thú vị và tầm quan trọng đối với AI

Sforum CTV, Tác giả Sforum - Trang tin công nghệ mới nhất
Sforum CTV
Ngày đăng: 04/09/2021-Cập nhật: 14/02/2022
gg news

Machine Learning đang thay đổi thế giới và có thể bạn đã tận dụng được những lợi ích của Machine Learning trong nhiều năm qua. Hầu hết chúng ta sẽ khó có thể trải qua cả ngày mà không sử dụng ít nhất một ứng dụng hoặc dịch vụ web được thúc đẩy bởi Machine Learing.

00. Machine Learing

Phần giới thiệu về Machine Learning này cung cấp một cái nhìn tổng quan về lịch sử của nó, các định nghĩa quan trọng, các ứng dụng và mối quan tâm trong các doanh nghiệp ngày nay.

Machine Learing là gì?

Machine Learning (xin tạm dịch là Máy Học) là một phương pháp phân tích dữ liệu để tự động hóa việc xây dựng mô hình phân tích. Đây là một nhánh của trí tuệ nhân tạo (Aritificial Intelligence – AI) và khoa Máy Học tính (Computer Science), tập trung vào việc sử dụng dữ liệu và thuật toán để bắt chước cách con người học, dần dần cải thiện độ chính xác của nó với sự can thiệp tối thiểu của con người.

01. ML là gì

Máy Học là một thành phần quan trọng của lĩnh vực khoa học dữ liệu đang phát triển. Thông qua việc sử dụng các phương pháp thống kê, các thuật toán được huấn luyện để đưa ra phân loại hoặc dự đoán, khám phá những hiểu biết quan trọng (insight) trong các dự án khai phá dữ liệu (data mining). Những hiểu biết này sau đó thúc đẩy việc đưa ra quyết định trong các ứng dụng và trong các doanh nghiệp, tác động một cách lý tưởng đến các chỉ số (metric) tăng trưởng chính. Khi dữ liệu lớn (Big Data) tiếp tục mở rộng và phát triển, nhu cầu thị trường cho các nhà khoa học dữ liệu (Data Scientist) sẽ tăng lên, đòi hỏi họ phải hỗ trợ trong việc lường trước hầu hết các câu hỏi liên quan đến kinh doanh và sau đó là dữ liệu để trả lời chúng (chat-bot).

02. Advantages-Of-Machine-Learning-scaled

Sự phát triển của Machine Learning

Cùng với công nghệ máy tính ngày càng phát triển, Máy Học ngày nay không giống như Máy Học của quá khứ nữa. Nó được sinh ra từ nhận dạng mẫu (pattern recognition) và lý thuyết rằng máy tính có thể học mà không cần được lập trình để thực hiện các nhiệm vụ cụ thể; các nhà nghiên cứu quan tâm đến trí tuệ nhân tạo muốn xem liệu máy tính có thể học từ dữ liệu hay không. Khía cạnh lặp đi lặp lại của Máy Học rất quan trọng vì khi các mô hình được tiếp xúc với dữ liệu mới, chúng có thể thích ứng một cách độc lập. Chúng học hỏi từ các tính toán trước đó để đưa ra các quyết định và kết quả rất đáng tin cậy, có thể lặp lại. Đây là một ngành khoa học không mới – nhưng lại là một ngành khoa học đã đạt được nhiều bước tiến lớn.

03. History of ML

Trong khi nhiều thuật toán Máy Học đã có từ lâu, khả năng tự động áp dụng các phép tính toán học phức tạp vào dữ liệu lớn (Big Data) (lặp đi lặp lại, ngày càng nhanh hơn) là một sự tiến bộ mới gần đây. Dưới đây là một số ví dụ được công bố rộng rãi về các ứng dụng Máy Học mà bạn có thể quen thuộc:

  • Chiếc xe tự lái, được quảng cáo rầm rộ của Google là tinh hoa của Máy Học.

03. self-driving Google car

  • Các đề xuất khuyến nghị trực tuyến đến từ Amazon và Netflix là những ứng dụng Máy Học cho cuộc sống ngày nay.

03. Đề xuất khuyến nghị trực tuyến

  • Hiểu biết những gì khách hàng sẽ nói gì về bạn trên Twitter thì Máy Học đã kết hợp với việc tạo quy tắc ngôn ngữ.

03.-Knowing-what-customers-are-saying-about-you-on-Twitter

  • Phát hiện gian lận là một trong những cách ứng dụng rõ rằng hơn, quan trọng hơn trong thế giới của chúng ta ngày nay.

03. Fraud detection

Tại sao Machine Learning lại quan trọng?

Mối quan tâm ngày càng tăng đối với Máy Học là do các yếu tố tương tự đã làm cho việc khai thác dữ liệu và phân tích Bayes trở nên phổ biến hơn bao giờ hết. Những thứ như số lượng và nhiều loại dữ liệu có sẵn ngày càng tăng, khiến cho việc xử lý tính toán rẻ hơn và mạnh hơn cũng như lưu trữ dữ liệu với giá cả phải chăng hơn.

Tất cả những điều này có nghĩa là có thể nhanh chóng và tự động tạo ra các mô hình có thể phân tích dữ liệu lớn hơn, phức tạp hơn và đưa đến việc có kết quả nhanh hơn, chính xác hơn – ngay cả trên quy mô rất lớn. Và bằng cách xây dựng các mô hình chính xác, một tổ chức sẽ có cơ hội tốt hơn trong việc xác định các cơ hội sinh lời – hoặc tránh những rủi ro chưa biết.

04. Machine-Learning-Important

Ai đang sử dụng Machine Learning?

Hầu hết các ngành công nghiệp làm việc với lượng lớn dữ liệu đã nhận ra giá trị của công nghệ Máy Học. Bằng cách thu thập thông tin chi tiết từ dữ liệu này - thường là trong thời gian thực - các tổ chức có thể làm việc hiệu quả hơn hoặc giành được lợi thế so với các đối thủ cạnh tranh.

Dịch vụ tài chính: Các ngân hàng và các doanh nghiệp khác trong ngành tài chính sử dụng công nghệ Máy Học cho hai mục đích chính: xác định những thông tin chi tiết quan trọng về dữ liệungăn chặn gian lận. Thông tin chi tiết có thể xác định cơ hội đầu tư hoặc giúp nhà đầu tư biết khi nào nên giao dịch. Khai thác dữ liệu cũng có thể xác định khách hàng có hồ sơ rủi ro cao hoặc sử dụng giám sát mạng để xác định các dấu hiệu cảnh báo gian lận.

05. Machine-Learning-in-Finance

Chính phủ: Các cơ quan chính phủ như An ninh công cộng và các đơn vị Công ích có nhu cầu đặc biệt về Máy Học vì họ có nhiều nguồn dữ liệu có thể được khai thác để hiểu rõ hơn. Ví dụ: phân tích dữ liệu cảm biến, xác định các cách để tăng hiệu quả và tiết kiệm tiền. Máy Học cũng có thể giúp phát hiện gian lận và giảm thiểu hành vi trộm cắp danh tính.

06. ML in government

Chăm sóc sức khỏe: Máy Học là một xu hướng đang phát triển nhanh chóng trong ngành chăm sóc sức khỏe, nhờ sự ra đời của các thiết bị đeo trên người (wearable device) và nhiều cảm biến của nó có thể sử dụng dữ liệu để đánh giá sức khỏe của bệnh nhân theo thời gian thực. Công nghệ này cũng có thể giúp các chuyên gia y tế phân tích dữ liệu để xác định các xu hướng hoặc dấu hiệu cảnh báo (red flag) mà có thể đưa ra để cải thiện việc chẩn đoán và điều trị.

07. ML in Healtcare

Dầu khí: Tìm kiếm các nguồn năng lượng mới. Phân tích khoáng chất trong lòng đất. Dự đoán lỗi cảm biến nhà máy lọc dầu. Hợp lý hóa việc phân phối dầu để làm cho nó hiệu quả hơn và tiết kiệm chi phí hơn. Số lượng các trường hợp sử dụng Máy Học cho ngành này là rất lớn - và vẫn đang tiếp tục mở rộng.

08. Machine-Learning-in-Oil-Gas

Giao thông vận tải: Phân tích dữ liệu để xác định các mô hình và những xu hướng là chìa khóa cho ngành vận tải, dựa vào việc tạo các tuyến đường hiệu quả hơn và dự đoán các vấn đề tiềm ẩn để tăng lợi nhuận. Các khía cạnh phân tích dữ liệu và mô hình hóa của Máy Học là công cụ quan trọng đối với các công ty giao hàng, vận tải công cộng và các tổ chức vận tải khác.

09. ML in Transportation

Machine learning làm việc như thế nào?

Hệ thống học tập của một thuật toán Máy Học được chia thành ba phần chính:

  1. Một Quy trình Quyết định (Decision Process): Nói chung, các thuật toán Máy Học được sử dụng để đưa ra một dự đoán hoặc phân loại. Dựa trên một số dữ liệu đầu vào, có thể được gắn nhãn hoặc không được gắn nhãn, thuật toán của bạn sẽ sinh ra một ước tính về một mẫu trong dữ liệu.
  2. Một Hàm So lỗi (Error Function): dùng để đánh giá dự đoán của mô hình. Nếu tồn tại các mẫu đã biết, một Hàm So lỗi có thể thực hiện so sánh để đánh giá độ chính xác của mô hình.
  3. Một Quy trình Tối ưu hóa Mô hình (Model Optimization Procress): Nếu mô hình có thể phù hợp tốt hơn với các điểm dữ liệu trong tập huấn luyện, thì các trọng số được điều chỉnh nhằm làm giảm sự khác biệt giữa mẫu thử đã biết và ước tính của mô hình. Thuật toán sẽ lặp lại quy trình đánh giá và tối ưu hóa này, việc cập nhật các trọng số sẽ làm một cách tự động cho đến khi đạt đến một ngưỡng chính xác.

10. How-Does-Machine-Learning-Work

Một số phương pháp Máy Học phổ biến

Hai trong số các phương pháp Máy Học được áp dụng rộng rãi nhất là Học có giám sát (Supervised learning) và Học không giám sát (Unsupervised learning). Ngoài ra còn có các phương pháp Máy Học khác, dưới đây là tổng quan về các loại phổ biến nhất.

Học có giám sát (Supervised learning): là các thuật toán được huấn luyện bằng cách sử dụng các ví dụ được gắn nhãn, chẳng hạn như đầu vào mà đầu ra mong muốn được biết đến. Ví dụ: một thiết bị có thể có các điểm dữ liệu được dán nhãn “F” (Failed) hoặc “R” (Run). Thuật toán học nhận được một tập hợp các đầu vào cùng với các đầu ra chính xác tương ứng và thuật toán sẽ học bằng cách so sánh đầu ra thực tế của nó với các đầu ra chính xác để tìm ra những sai khác (error). Sau đó, nó chỉnh sửa mô hình cho phù hợp. Thông qua các phương pháp như phân loại, hồi quy, dự đoán và tăng độ chênh lệch (Gradient), Học có giám sát sẽ sử dụng các mẫu để dự đoán các giá trị của nhãn trên dữ liệu bổ sung chưa được gắn nhãn. Học có giám sát thường được sử dụng trong các ứng dụng nơi mà dữ liệu lịch sử dự đoán các sự kiện có thể xảy ra trong tương lai. Ví dụ: nó có thể dự đoán khi nào các giao dịch thẻ tín dụng có khả năng bị gian lận hoặc khách hàng bảo hiểm nào có khả năng nộp đơn khiếu nại.

11. Supervised learning

Học không giám sát (Unsupervised learning): được sử dụng để chống lại dữ liệu mà không có gắn nhãn trước đó. Hệ thống không cho biết 'câu trả lời đúng'. Thuật toán phải tìm ra những gì đang được hiển thị. Mục đích là khám phá dữ liệu và tìm một số cấu trúc bên trong. Học không giám sát hoạt động tốt trên dữ liệu giao dịch. Ví dụ: nó có thể xác định các phân khúc khách hàng có các thuộc tính tương tự, những người sau đó có thể được đối xử như nhau trong các chiến dịch tiếp thị. Hoặc nó có thể tìm ra các thuộc tính chính ngăn cách các phân khúc khách hàng với nhau. Các kỹ thuật phổ biến bao gồm bản đồ tự tổ chức (self-Organizating map), ánh xạ láng giềng gần nhất (nearest-neighbor mapping), phân cụm k-phương thức (k-means clustering) và phân rã giá trị đơn lẻ (singular value decomposition). Các thuật toán này cũng được sử dụng để phân khúc các chủ đề văn bản, đề xuất các hạng mục và xác định các giá trị ngoại lai của dữ liệu.

12. unsupervised-learning

Học bán giám sát (Semi-supervised learning): được sử dụng cho các ứng dụng tương tự như Học có giám sát. Nhưng nó sử dụng cả dữ liệu được gắn nhãn và không được gắn nhãn để huấn luyện - thường thì một lượng nhỏ dữ liệu được gắn nhãn với một lượng lớn dữ liệu không được gắn nhãn (vì dữ liệu không được gắn nhãn ít tốn kém hơn và mất ít công sức hơn để thu thập). Loại hình học tập này có thể được sử dụng với các phương pháp như phân loại, hồi quy và dự đoán. Học bán giám sát rất hữu ích khi chi phí liên quan đến việc gắn nhãn quá cao để cho phép một quá trình huấn luyện được gắn nhãn đầy đủ. Các ví dụ ban đầu về điều này bao gồm xác định khuôn mặt của một người trên webcam.

13. semi-supervised learning

Học tăng cường (Reinforcement learning) thường được sử dụng cho robot, chơi game và điều hướng. Với Học tăng cường, thuật toán phát hiện ra thông qua quá trình thử (trial) và sai (error), hành động nào mang lại phần thưởng lớn nhất. Loại Học này có ba thành phần chính: tác nhân (agent) (người học hoặc người ra quyết định), môi trường (mọi thứ mà tác nhân tương tác cùng) và hành động (tác nhân có thể làm gì). Mục tiêu là để tác nhân chọn các hành động tối đa hóa phần thưởng mong đợi trong một khoảng thời gian nhất định. Tác nhân sẽ đạt được mục tiêu nhanh hơn nhiều nếu tuân theo một chính sách tốt. Vì vậy mục tiêu trong Học tăng cường là học chính sách tốt nhất.

14. Reinforcement learning

Sự khác biệt giữa Data mining, Machine learning và Deep learning là gì?

Mặc dù tất cả các phương pháp này đều có cùng mục tiêu - trích xuất những hiểu biết sâu sắc (insight), các mẫu (pattern) và mối quan hệ (relationship) mà có thể được sử dụng để đưa ra quyết định - nhưng chúng có các cách tiếp cận và khả năng khác nhau.

Data Mining (Khai phá dữ liệu): có thể được coi là một siêu tập hợp (superset) của nhiều phương pháp khác nhau để trích xuất thông tin quan trọng từ dữ liệu. Nó có thể liên quan đến các phương pháp thống kê truyền thống và Máy Học. Khai phá dữ liệu áp dụng các phương pháp từ nhiều lĩnh vực khác nhau để xác định các mẫu chưa biết trước đây từ dữ liệu. Điều này có thể bao gồm các thuật toán thống kê (statistical algorithms), Máy Học (machine learing), phân tích văn bản (text analytics), phân tích chuỗi thời gian (time series analysis) và các lĩnh vực phân tích khác. Khai phá dữ liệu cũng bao gồm việc nghiên cứu và thực hành lưu trữ dữ liệu cũng như thao tác dữ liệu.

15. Data-Mining

Machine Learning (Máy Học): Sự khác biệt chính với Máy Học đó là cũng giống như các mô hình thống kê, mục tiêu là để hiểu cấu trúc của dữ liệu - phù hợp với các phân phối lý thuyết với dữ liệu đã được hiểu rõ. Vì vậy, với các mô hình thống kê, có một lý thuyết đằng sau mô hình được chứng minh bằng toán học, nhưng điều này đòi hỏi dữ liệu cũng phải đáp ứng các giả định mạnh mẽ nhất định. Máy Học đã phát triển dựa trên khả năng sử dụng máy tính để thăm dò dữ liệu cho cấu trúc, ngay cả khi chúng ta không có lý thuyết về cấu trúc đó trông như thế nào. Bài kiểm tra đối với mô hình Máy Học là một lỗi xác thực trên dữ liệu mới, không phải là bài kiểm tra lý thuyết chứng minh giả thuyết vô hiệu. Vì Máy Học thường sử dụng cách tiế cận lặp đi lặp lại để học từ dữ liệu nên việc học có thể được tự động hóa dễ dàng. Những đường đi được chạy qua dữ liệu cho đến khi tìm thấy một mẫu đủ mạnh.

16. Machine Learning

Deep Learning (Học sâu): kết hợp những tiến bộ về sức mạnh tính toán và các loại mạng thần kinh (neural network) đặc biệt để học các mẫu phức tạp với lượng lớn dữ liệu. Kỹ thuật học sâu hiện đang là kỹ thuật tiên tiến cho việc xác định các đối tượng trong hình ảnh và từ trong âm thanh. Các nhà nghiên cứu hiện đang tìm cách áp dụng những thành công này trong nhận dạng mẫu cho đến các nhiệm vụ phức tạp hơn như dịch ngôn ngữ tự động, chẩn đoán y tế và nhiều vấn đề xã hội cũng như những vấn đề kinh doanh quan trọng khác.

17. Deep Learning

Tạm kết

Machine Learning là khoa học về việc khiến máy tính hoạt động mà không cần được lập trình rõ ràng. Trong thập kỷ qua, công nghệ Máy Học đã mang lại cho chúng ta những chiếc ô tô tự lái, khả năng nhận dạng giọng nói thực tế, tìm kiếm trên web hiệu quả và sự hiểu biết được cải thiện đáng kể về bộ gen của con người. Máy Học ngày nay phổ biến đến mức bạn có thể sử dụng nó hàng chục lần mỗi ngày mà không hề hay biết. Nhiều nhà nghiên cứu cũng cho rằng đó là cách tốt nhất để đạt được tiến bộ đối với AI ở cấp độ con người.

danh-gia-bai-viet
(0 lượt đánh giá - 5/5)

Trang tin công nghệ Sforum.vn được thành lập từ năm 2012, đến nay đã hơn 10 năm tuổi. Chúng tôi vẫn không luôn ngừng đổi mới và thử nghiệm các chuyên mục, nội dung mới để phục vụ bạn đọc. Hi vọng các thông tin công nghệ, game hay mẹo vặt từ Sforum sẽ giúp ích được cho bạn đọc trong đời sống cũng như có những phút giây giải trí lành mạnh.

Bình luận (0)

sforum facebook group logo