Machine learning là gì? Các khái niệm cơ bản

(VOH) - Machine learning là một ứng dụng của trí tuệ nhân tạo (AI) cung cấp cho các hệ thống khả năng tự động học hỏi và cải thiện từ kinh nghiệm mà không cần lập trình rõ ràng. Chi tiết như bên dưới.

Machine learning tập trung vào việc phát triển các chương trình máy tính có thể truy cập dữ liệu và sử dụng nó để tự học.

Quá trình học bắt đầu bằng các quan sát hoặc dữ liệu, chẳng hạn ví dụ như - kinh nghiệm trực tiếp hoặc hướng dẫn, để tìm kiếm các mẫu trong dữ liệu và đưa ra quyết định tốt hơn trong tương lai dựa trên các ví dụ mà chúng ta cung cấp. Mục đích chính là cho phép các máy tính tự động học mà không cần sự can thiệp hay trợ giúp của con người và điều chỉnh các hành động phù hợp.

VOH.com.vn-Machine-learning-la-gi-anh-1

Lịch sử Trí tuệ nhân tạo AI và Machine learning

Vài phương pháp Machine learning

Các thuật toán Machine learning thường được phân loại là giám sát hoặc không giám sát.

**Các thuật toán giám sát Machine learning (Supervised):**

Có thể áp dụng những gì đã học được trong quá khứ vào dữ liệu mới bằng cách sử dụng các ví dụ được gắn nhãn để dự đoán các sự kiện trong tương lai. Bắt đầu từ việc phân tích một tập dữ liệu đào tạo đã biết, thuật toán học tạo ra một hàm được suy ra để đưa ra dự đoán về các giá trị đầu ra. Hệ thống có thể cung cấp các mục tiêu cho bất kỳ đầu vào mới nào sau khi đào tạo đủ. Thuật toán học tập cũng có thể so sánh đầu ra của nó với đầu ra chính xác, dự định và tìm lỗi để sửa đổi mô hình cho phù hợp.

Các thuật toán không giám sát Machine learning (Unsupervised):

Được sử dụng khi thông tin được sử dụng để đào tạo không được phân loại cũng không được dán nhãn. Nghiên cứu học tập không giám sát làm thế nào các hệ thống có thể suy ra một chức năng để mô tả một cấu trúc ẩn từ dữ liệu không được gắn nhãn. Hệ thống không tìm ra đầu ra đúng, nhưng nó khám phá dữ liệu và có thể rút ra các kết luận từ các bộ dữ liệu để mô tả các cấu trúc ẩn từ dữ liệu chưa được gắn nhãn.

Các thuật toán bán-giám sát Machine learning (Semi-supervised):

Nằm ở đâu đó giữa học tập có giám sát và không giám sát, vì chúng sử dụng cả dữ liệu được gắn nhãn và không nhãn cho đào tạo - thường là một lượng nhỏ dữ liệu được gắn nhãn và một lượng lớn dữ liệu không được gắn nhãn. Các hệ thống sử dụng phương pháp này có thể cải thiện đáng kể độ chính xác trong học tập. Thông thường, học bán giám sát được chọn khi dữ liệu được dán nhãn yêu cầu các tài nguyên có kỹ năng và có liên quan để đào tạo / học từ nó. Mặt khác, việc thu thập dữ liệu được gắn nhãn thường không yêu cầu tài nguyên bổ sung.

Các thuật toán củng cố Machine learning (Reinforcement):

Là một phương pháp học tương tác với môi trường của nó bằng cách tạo ra các hành động và phát hiện ra các lỗi hoặc phần thưởng. Thử nghiệm và tìm kiếm lỗi và phần thưởng bị trì hoãn là những đặc điểm phù hợp nhất của việc học tăng cường. Phương pháp này cho phép máy móc và đại lý phần mềm tự động xác định hành vi lý tưởng trong một bối cảnh cụ thể để tối đa hóa hiệu suất của nó. Phản hồi phần thưởng đơn giản là cần thiết cho các đại lý để tìm hiểu hành động nào là tốt nhất; đây được gọi là tín hiệu gia cố.

Machine learning cho phép phân tích số lượng lớn dữ liệu. Mặc dù nó thường mang lại kết quả nhanh hơn, chính xác hơn để xác định các cơ hội có lợi nhuận hoặc rủi ro nguy hiểm, nó cũng có thể cần thêm thời gian và nguồn lực để đào tạo nó đúng cách. Kết hợp Machine learning với AI và công nghệ nhận thức có thể làm cho nó hiệu quả hơn nữa trong việc xử lý khối lượng thông tin lớn.

Nguồn ảnh: Internet

Big data là gì? Tất tần tật những sự thật thú vị về Big Data chưa bao giờ bạn được biết: Big data là gì? Big data là bao gồm các thách thức như phân tích, thu thập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan, truy vấn và tính riêng tư.

Python là gì? Hiểu đúng về ngôn ngữ lập trình Python: Python là một trong những ngôn ngữ lập trình được thiết kế vào những năm 1980 bởi Guido Van Rossum. Đây là loại ngôn ngữ lập trình mang tính hướng đối tượng.