Machine Learning Tùy Bút

CON ĐƯỜNG HỌC TẬP TOÀN DIỆN CHO DEEP LEARNING NĂM 2019

19 Tháng Hai, 201919 Tháng Hai, 2019 Bạch TuấnBình luận về bài viết này

CON ĐƯỜNG HỌC TẬP TOÀN DIỆN CHO DEEP LEARNING NĂM 2019 ======== Deep Learning đã và đang có nhiều tác động đến mọi mặt đời sống của chúng ta, bất kể bạn đang ở đâu: trong phòng Lab của một trường ĐH hay ở nhà hay tại nơi làm việc thì việc học tập của… Đọc tiếp CON ĐƯỜNG HỌC TẬP TOÀN DIỆN CHO DEEP LEARNING NĂM 2019

QUY TRÌNH THU THẬP VÀ XỬ LÝ DỮ LIỆU ( DATA ANALYSTS)

27 Tháng Một, 201930 Tháng Một, 2019 Bạch TuấnBình luận về bài viết này

PHÂN TÍCH DỮ LIỆU: Collecting Data from various sources - Thu thập dữ liệu nhiều nhất có thể, thu thập các feature có ảnh hưởng đến kết quả của mẫu, thu thập nhiều mẫu cành tốt Wrangling Data to make it more reliable: Reading data: from sqlalchemy import create_engine engine = create_engine('sqlite:///:memory:') sql_dataframe = pd.read_sql_table('my_table', engine, columns=['ColA',… Đọc tiếp QUY TRÌNH THU THẬP VÀ XỬ LÝ DỮ LIỆU ( DATA ANALYSTS)

Anomaly Detection – Phát hiện bất thường

20 Tháng Một, 2019 Bạch TuấnBình luận về bài viết này

PHÂN PHỐI CHUẨN - HÀM MẬT ĐỘ XÁC SUẤT PHÂN PHỐI Ta tính xác suất phân phối ngẫu nhiên chuẩn của 1 điểm trên tập dữ liệu. Với mỗi một feature. Ta tìm được một giá trị mean và phương sai. Từ đó ta tính được xác suất phân phối ngẫu nhiên của 1 điểm.… Đọc tiếp Anomaly Detection – Phát hiện bất thường

Phân tích thành phần chính (PCA)

14 Tháng Một, 201919 Tháng Một, 2019 Bạch TuấnBình luận về bài viết này

Trước khi đi vào PCA thì mình muốn nói về việc nén dữ liệu và tác dụng của nó. Nén dữ liệu hoặc giảm bớt feature luôn đem lại nhiều lợi ích. Chúng ta có thể phát triển thuật toán học tập nhanh hơn, chúng ta có thể giảm bớt kích cỡ lưu trữ của… Đọc tiếp Phân tích thành phần chính (PCA)

UNSPERVISED LEARNING – CLUSTERING – K MEANS ALGORITHM

2 Tháng Một, 201916 Tháng Một, 2019 Bạch TuấnBình luận về bài viết này

Khác với Supervised learning, Unsupervised learning là kiểu học tập dựa trên những dữ liệu không có nhãn, hay còn gọi là chưa có output. Những thuật toán này thường là giải quyết những bài toán như gom nhóm, tập hợp các đối tượng có cùng đặc điểm, phân cụm... K-Means Algorithm Đây là một… Đọc tiếp UNSPERVISED LEARNING – CLUSTERING – K MEANS ALGORITHM

Support Vector Machine – Non-Linear Decision Boundary

31 Tháng Mười Hai, 2018 Bạch TuấnBình luận về bài viết này

KERNELS Có những bài toán phân loại với kiểu phân bố dữ liệu rất dị dạng. Cụ thể như trong hình sau: Khi ấy ta cần phải xây dựng một hàm giả thuyết đa thức để có được một ranh giới tốt nhất. Và tất nhiên ranh giới đó phi tuyến tính. Vậy thì làm… Đọc tiếp Support Vector Machine – Non-Linear Decision Boundary

Support Vector Machine – Linear Decision Boundary

31 Tháng Mười Hai, 201831 Tháng Mười Hai, 2018 Bạch TuấnBình luận về bài viết này

Decision Boundary ( Ranh giới quyết định) Trong bài toán phân loại nhị phân, chúng ta cần xác định 1 đường chia cắt 2 class khác nhau thành 2 vùng riêng biệt để từ đó với mỗi đầu vào mới ta sẽ dự đoán kết quả của nó thuộc class nào. Đó là ranh giới… Đọc tiếp Support Vector Machine – Linear Decision Boundary

LÀM GÌ TIẾP THEO (Phần II) – CHẨN ĐOÁN HÀM GIẢ THUYẾT LÀ BIAS HAY VARIANCE – CÁCH CHỌN THAM SỐ CHÍNH QUY LAMBDA

29 Tháng Mười Hai, 201829 Tháng Mười Hai, 2018 Bạch TuấnBình luận về bài viết này

Bias và Variance là gì? Trước tiên nhìn vào ảnh sau. Ta có đồ thị của 3 hàm giả thuyết khác nhau: Nhìn vào hình trên ta có thê hiểu bias là ám chỉ hàm có nhiều khoảng với dữ liệu mẫu và variance là chỉ những hàm vừa vặn với dữ liệu mẫu. Nhưng đó… Đọc tiếp LÀM GÌ TIẾP THEO (Phần II) – CHẨN ĐOÁN HÀM GIẢ THUYẾT LÀ BIAS HAY VARIANCE – CÁCH CHỌN THAM SỐ CHÍNH QUY LAMBDA

LÀM GÌ TIẾP THEO (Phần I) – ĐÁNH GIÁ MỘT THUẬT TOÁN HỌC TẬP

29 Tháng Mười Hai, 201829 Tháng Mười Hai, 2018 Bạch TuấnBình luận về bài viết này

Việc đánh giá một thuật toán rất là quan trọng, như là khâu testing sản phẩm trước khi trao cho khách hàng vậy. Chúng ta cần phải đảm bảo thuật toán hoạt động tốt như mong đợi. Giả sử bạn training một tập dữ liệu và triển khai được một thuật toán. Tuy nhiên khi… Đọc tiếp LÀM GÌ TIẾP THEO (Phần I) – ĐÁNH GIÁ MỘT THUẬT TOÁN HỌC TẬP

Vài lưu ý khi Training một Neural Network

28 Tháng Mười Hai, 201828 Tháng Mười Hai, 2018 Bạch TuấnBình luận về bài viết này

Chúng ta sử dụng backpropagation để tính đạo hàm của J tại 1 điểm theta nào đó. Vậy thì kiểm tra giá trị này có hiệu quả hay không thì người ta sử dụng một phương pháp gọi là Gradient Checking GRADIENT CHECKING Theo như gradient checking thì giá trị đạo hàm của J tại… Đọc tiếp Vài lưu ý khi Training một Neural Network