Em đang học về mạng nơ-ron đặc biệt về ứng dụng của mạng trong data-mining. Hiện giờ em chưa biết cách đưa dữ liệu phi số vào làm input cho mạng như thế nào mà vẫn giữ được đặc trưng của dữ liệu..
Nên có anh chị nào biết về cái này, mong chỉ giáo đàn em với
. Hiện giờ em chưa biết cách đưa dữ liệu phi số vào làm input cho mạng như thế nào mà vẫn giữ được đặc trưng của dữ liệu..
Dữ liệu phi số là thế nào? [Đăng nhập để xem liên kết. ] cho ví dụ đi!
[Đăng nhập để xem liên kết. ] sử dụng phương pháp học nào (learning) và hàm để học. Output của hàm này là số mà! Dữ liệu thô đưa qua hàm để học để ra con số.
__________________ Necessity is the mother of in(ter)vention.
Speak softly & carry a big stick. My Technical Blog
Em sử dụng pp lan truyền ngược (back-propagation) để cập nhật trọng số của các kết nối giữa các lớp input, ẩn và ouput.
Lúc trước, em chỉ mới làm về nhận dạng đơn giản, như bỏ 1 ma trận thể hiện chữ A, B.... có kích thước cỡ cố định(nên input khá dễ hiểu) rồi vẽ chữ A , lên đó bằng các ô đánh số 1 hoặc 0 như sau
0 0 1 0 0
0 1 0 1 0
1 1 1 1 1
1 0 0 0 1
1 0 0 0 1
Hiện giờ em đang làm về phát hiện gian lận trong giao dịch trực tuyến(fraud detection), nên kiểu dữ liệu bỏ vào mạng để học khá đa dạng, không chỉ đơn thuần là số, ví dụ như địa chỉ IP, số tiền giao dịch, số thẻ tín dụng, tên chủ thẻ, ngày giờ giao dịch .... nên em chưa biết cách ánh xạ dữ liệu này thành số như thế nào để đặc trưng của nó ko bị mất đi.
Tập dữ liệu training của em chưa xác định được! Để có được điều này thì cần phải dựa vào kinh nghiệm bản thân, hỏi chuyên gia. Sau khi có được tập dữ liệu đầy đủ rồi phân loại chúng thành các lớp. Hàm phân loại này sẽ có output là các số. Đầu vào là lớp dữ liệu thô. Sau đó em mới đưa dữ liệu số này vào mạng.
Em cần tìm tài liệu đọc thêm!