Tốt nghiệp ĐH chính quy loại Khá trở lên chuyên ngành: Khoa học dữ liệu, Khoa học
máy tính, CNTT, Toán học ứng dụng, Điện tử viễn thông hoặc chuyên ngành khác liên
quan;
Có từ 1 năm KN trở lên
Kiến thức về mô hình học máy decision trees, linear regression, ensemble (random
forest, boosting tree), k-means, SVM, PCA...;
Kiến thức về học sâu, mạng neural nhân tạo, các kiểu mạng MLP, CNN, LSTM, RNN...
Kiến thức về xác suất thống kê, đại số tuyến tính, giải tích, lập trình, cấu trúc dữ liệu &
giải thuật, lý thuyết đồ thị, cơ sở dữ liệu;
Kiến thức về phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA);
Kỹ năng sử dụng thành thạo một trong các package học máy (scikit-learn, TensorFlow,
Keras, PyTorch, Pyspark MLlib, Caffe, Theano, Pylearn2, DeepPy, H2O, v.v);
Kỹ năng sử dụng ngôn ngữ lập trình (R, Python, Java, Scala, v.v), SQL;
Kỹ năng sử dụng các công cụ trực quan hóa dữ liệu, đánh giá mô hình.
Có kiến thức về xử lý dữ liệu phân tán, xử lý dữ liệu lớn (Hadoop, Spark, ...) là một lợi
thế;
Tốt nghiệp ĐH chính quy loại Khá trở lên chuyên ngành: Khoa học dữ liệu, Khoa học
máy tính, CNTT, Toán học ứng dụng, Điện tử viễn thông hoặc chuyên ngành khác liên
quan;
Có từ 1 năm KN trở lên
Kiến thức về mô hình học máy decision trees, linear regression, ensemble (random
forest, boosting tree), k-means, SVM, PCA...;
Kiến thức về học sâu, mạng neural nhân tạo, các kiểu mạng MLP, CNN, LSTM, RNN...
Kiến thức về xác suất thống kê, đại số tuyến tính, giải tích, lập trình, cấu trúc dữ liệu &
giải thuật, lý thuyết đồ thị, cơ sở dữ liệu;
Kiến thức về phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA);
Kỹ năng sử dụng thành thạo một trong các package học máy (scikit-learn, TensorFlow,
Keras, PyTorch, Pyspark MLlib, Caffe, Theano, Pylearn2, DeepPy, H2O, v.v);
Kỹ năng sử dụng ngôn ngữ lập trình (R, Python, Java, Scala, v.v), SQL;
Kỹ năng sử dụng các công cụ trực quan hóa dữ liệu, đánh giá mô hình.
Có kiến thức về xử lý dữ liệu phân tán, xử lý dữ liệu lớn (Hadoop, Spark, ...) là một lợi
thế;