[HD] Ứng dụng học máy cho dự đoán – machine learning – ML

Dự báo Mẹo vặt

Ứng dụng học máy cho dự đoán; Đối với nhiều tổ chức, dữ liệu lớn – khối lượng đáng kinh ngạc của dữ liệu có cấu trúc thô, bán cấu trúc và phi cấu trúc – là nguồn thông minh chưa được khai thác có thể hỗ trợ các quyết định kinh doanh và tăng cường hoạt động. Khi dữ liệu tiếp tục đa dạng hóa và thay đổi, ngày càng có nhiều tổ chức áp dụng phân tích dự đoán, để khai thác tài nguyên đó và hưởng lợi từ dữ liệu trên quy mô lớn.

ỨNG DỤNG MÁY HỌC CHO DỰ ĐOÁN

Phân tích dự đoán là gì?

Một quan niệm sai lầm phổ biến là phân tích dự đoán và học máy là một thứ giống nhau. Đây không phải là trường hợp. (Tuy nhiên, nơi cả hai trùng lặp là mô hình dự đoán – nhưng nhiều hơn về điều đó sau này.)

Về cốt lõi, phân tích dự đoán bao gồm nhiều kỹ thuật thống kê khác nhau (bao gồm học máy , mô hình dự đoán và khai thác dữ liệu) và sử dụng thống kê (cả lịch sử và hiện tại) để ước tính hoặc ‘dự đoán’, kết quả trong tương lai. Ví dụ, những kết quả này có thể là những hành vi mà khách hàng có thể thể hiện hoặc những thay đổi có thể xảy ra trên thị trường. Phân tích dự đoán giúp chúng ta hiểu được những điều có thể xảy ra trong tương lai bằng cách phân tích quá khứ.

Mặt khác, học máy là một lĩnh vực con của khoa học máy tính, theo định nghĩa của Arthur Samuel từ năm 1959, mang lại cho ‘máy tính khả năng học mà không cần được lập trình rõ ràng’ . Học máy phát triển từ việc nghiên cứu nhận dạng mẫu và khám phá khái niệm rằng các thuật toán có thể học hỏi và đưa ra dự đoán trên dữ liệu. Và, khi chúng bắt đầu trở nên ‘thông minh’ hơn, các thuật toán này có thể vượt qua các hướng dẫn của chương trình để đưa ra các quyết định dựa trên dữ liệu, có độ chính xác cao.

Phân tích dự đoán hoạt động như thế nào?

Phân tích dự đoán được thúc đẩy bởi mô hình dự đoán. Đó là một cách tiếp cận hơn là một quá trình. Phân tích dự đoán và học máy đi đôi với nhau, vì các mô hình dự đoán thường bao gồm thuật toán học máy . Những mô hình này có thể được đào tạo theo thời gian để đáp ứng với dữ liệu hoặc giá trị mới, mang lại kết quả mà doanh nghiệp cần. Mô hình dự đoán phần lớn trùng lặp với lĩnh vực máy học .

Đọc thêm:   [Mách bạn] Sai lệch chọn mẫu quan sát - Sample Selection Bias

Có hai loại mô hình dự đoán. Chúng là các mô hình Phân loại, dự đoán tư cách thành viên của lớp và các mô hình Hồi quy dự đoán một số. Các mô hình này sau đó được tạo thành từ các thuật toán. Các thuật toán thực hiện khai thác dữ liệu và phân tích thống kê, xác định xu hướng và mẫu trong dữ liệu. Các giải pháp phần mềm phân tích dự đoán sẽ được tích hợp các thuật toán có thể được sử dụng để tạo các mô hình dự đoán. Các thuật toán được định nghĩa là ‘bộ phân loại’, xác định dữ liệu thuộc về nhóm danh mục nào.

Các ứng dụng học máy cho dự đoán phổ biến:

ứng dụng học máy cho dự đoán
Ứng dụng học máy cho dự đoán

Cây quyết định

Cây quyết định là một dạng phân tích nhiều biến đơn giản nhưng mạnh mẽ. Chúng được tạo ra bởi các thuật toán xác định nhiều cách khác nhau để tách dữ liệu thành các phân đoạn giống như nhánh. Cây quyết định phân vùng dữ liệu thành các tập hợp con dựa trên danh mục của các biến đầu vào, giúp bạn hiểu đường dẫn quyết định của ai đó.

Hồi quy (tuyến tính và logistic)

Hồi quy là một trong những phương pháp phổ biến nhất trong thống kê. Phân tích hồi quy ước tính mối quan hệ giữa các biến, tìm ra các mẫu chính trong các tập dữ liệu lớn và đa dạng và cách chúng liên quan với nhau.

Mạng nơ-ron

Được tạo hình sau hoạt động của các nơ-ron trong não người, mạng nơ-ron (còn gọi là mạng nơ-ron nhân tạo) là một loạt các công nghệ học sâu. Chúng thường được sử dụng để giải quyết các vấn đề nhận dạng mẫu phức tạp – và cực kỳ hữu ích để phân tích các tập dữ liệu lớn. Chúng rất tốt trong việc xử lý các mối quan hệ phi tuyến trong dữ liệu – và hoạt động tốt khi một số biến nhất định không xác định

Các bộ phân loại khác:

  • Thuật toán chuỗi thời gian – Time Series Algorithms: Các thuật toán chuỗi thời gian lập biểu đồ dữ liệu tuần tự và rất hữu ích để dự báo các giá trị liên tục theo thời gian.
  • Thuật toán phân cụm – Clustering Algorithms: Các thuật toán phân cụm tổ chức dữ liệu thành các nhóm có các thành viên tương tự nhau.
  • Thuật toán phát hiện ngoại lệ – Outlier Detection Algorithms: Các thuật toán phát hiện ngoại lệ tập trung vào phát hiện bất thường, xác định các mục, sự kiện hoặc quan sát không phù hợp với mẫu hoặc tiêu chuẩn dự kiến ​​trong tập dữ liệu.
  • Mô hình lắp ráp – Ensemble Models: Mô hình lắp ráp sử dụng nhiều machine learning thuật toán để có được hiệu suất dự đoán tốt hơn những gì có thể thu được từ một thuật toán.
  • Phân tích nhân tố – Factor Analysis: Phân tích nhân tố là một phương pháp được sử dụng để mô tả sự biến đổi và nhằm mục đích tìm ra các biến tiềm ẩn độc lập.
  • Naïve Bayes: Bộ phân loại Naïve Bayes cho phép chúng tôi dự đoán một lớp / danh mục dựa trên một tập hợp các tính năng nhất định, sử dụng xác suất.
  • Máy vectơ hỗ trợ – Support vector machines: Máy vectơ hỗ trợ được giám sátcác kỹ thuật học máy sử dụng các thuật toán học liên quan để phân tích dữ liệu và nhận dạng các mẫu.
Đọc thêm:   cách tính abnormal return lợi nhuận bất thường AR

Mỗi bộ phân loại tiếp cận dữ liệu theo một cách khác nhau, do đó, để các tổ chức có được kết quả họ cần, họ cần chọn các bộ phân loại và mô hình phù hợp.

Các ứng dụng của phân tích dự đoán và máy học

Đối với các tổ chức tràn ngập dữ liệu nhưng đang đấu tranh để biến nó thành thông tin chi tiết hữu ích, phân tích dự đoán và máy học có thể cung cấp giải pháp. Bất kể tổ chức có bao nhiêu dữ liệu, nếu tổ chức đó không thể sử dụng dữ liệu đó để nâng cao các quy trình bên trong và bên ngoài và đáp ứng các mục tiêu, thì dữ liệu sẽ trở thành một nguồn tài nguyên vô dụng.

Phân tích dự đoán được sử dụng phổ biến nhất để bảo mật, tiếp thị, hoạt động, phát hiện rủi ro và gian lận. Đây chỉ là một vài ví dụ về cách phân tích dự đoán và máy học được sử dụng trong các ngành khác nhau:

Dịch vụ tài chính và ngân hàng

Trong ngành dịch vụ tài chính và ngân hàng, phân tích dự đoán vàmáy học được sử dụng kết hợp để phát hiện và giảm gian lận, đo lường rủi ro thị trường, xác định cơ hội và hơn thế nữa.

Bảo mật

Với ​​an ninh mạng được đặt lên hàng đầu trong chương trình nghị sự của mọi doanh nghiệp trong năm 2017, sẽ không có gì ngạc nhiên khi phân tích dự đoán và máy học đóng một vai trò quan trọng trong bảo mật. Các tổ chức bảo mật thường sử dụng phân tích dự đoán để cải thiện dịch vụ và hiệu suất, nhưng cũng để phát hiện sự bất thường, gian lận, hiểu hành vi của người tiêu dùng và tăng cường bảo mật dữ liệu.

Các nhà bán lẻ

đang sử dụng phân tích dự đoán và máy học để hiểu rõ hơn về hành vi của người tiêu dùng; ai mua cái gì và ở đâu? Những câu hỏi này có thể được trả lời dễ dàng với các mô hình và bộ dữ liệu dự đoán phù hợp, giúp các nhà bán lẻ lên kế hoạch trước và dự trữ các mặt hàng dựa trên tính thời vụ và xu hướng tiêu dùng – cải thiện đáng kể ROI.

Đọc thêm:   xác định chuỗi dữ liệu không dừng & cách khắc phục

Phát triển môi trường phù hợp

Trong khi máy học và phân tích dự đoán có thể là một lợi ích cho bất kỳ tổ chức nào, việc triển khai các giải pháp này một cách bừa bãi, mà không xem xét chúng sẽ phù hợp với hoạt động hàng ngày như thế nào, sẽ cản trở đáng kể khả năng cung cấp thông tin chi tiết mà tổ chức cần.

Để tận dụng tối đa các phân tích dự đoán và máy học , các tổ chức cần đảm bảo rằng họ có sẵn kiến ​​trúc để hỗ trợ các giải pháp này, cũng như dữ liệu chất lượng cao để cung cấp cho họ và giúp họ học hỏi. Chuẩn bị và chất lượng dữ liệu là những yếu tố chính cho phép phân tích dự đoán. Dữ liệu đầu vào, có thể trải dài trên nhiều nền tảng và chứa nhiều nguồn dữ liệu lớn, phải được tập trung, thống nhất và có định dạng nhất quán.

Để đạt được điều này, các tổ chức phải phát triển một chương trình quản trị dữ liệu phù hợp để quản lý tổng thể dữ liệu và đảm bảo chỉ dữ liệu chất lượng cao được thu thập và ghi lại. Thứ hai, các quy trình hiện tại sẽ cần được thay đổi để bao gồm các phân tích dự đoán và máy học vì điều này sẽ cho phép các tổ chức thúc đẩy hiệu quả tại mọi thời điểm trong doanh nghiệp. Cuối cùng, các tổ chức cần biết những vấn đề họ đang tìm cách giải quyết, vì điều này sẽ giúp họ xác định mô hình tốt nhất và áp dụng nhất để sử dụng.

Hiểu các mô hình ứng dụng máy học cho dự đoán

Thông thường, các nhà khoa học dữ liệu và các chuyên gia CNTT của tổ chức được giao nhiệm vụ phát triển lựa chọn các mô hình dự đoán phù hợp – hoặc xây dựng mô hình dự báo của riêng chúng để đáp ứng nhu cầu của tổ chức. Tuy nhiên, ngày nay, phân tích dự đoán và machine learning không còn là lĩnh vực của các nhà toán học, thống kê và khoa học dữ liệu mà còn là lĩnh vực của các nhà phân tích và tư vấn kinh doanh. Ngày càng có nhiều nhân viên của doanh nghiệp sử dụng nó để phát triển những hiểu biết sâu sắc và cải thiện hoạt động kinh doanh – nhưng các vấn đề nảy sinh khi nhân viên không biết sử dụng mô hình nào, cách triển khai hoặc cần thông tin ngay lập tức.

 

Summary
recipe image
Review Date
Reviewed Item
Thông tin quá hay
Author Rating
51star1star1star1star1star
Recipe Name
Hướng dẫn ML