PUBLICATIONS

Simultaneous convolutional neural network for highly efficient image steganography

Pham Van Toan - Hoang Dinh Thoi - Do Hoang Thai Duong - Ta Minh Thanh 2019 19th International Symposium on Communications and Information Technologies (ISCIT) http://iscit2019.org

Techinical: Information Security, Image Steganography, Secure Data Transmission, Deep Convolutional Neural Network

Trong bài báo này, công việc của chúng tôi tập trung giải quyết bài toán giấu tin hình ảnh với các mô hình Deep Learning. Các công việc chính là ẩn một hình ảnh (hình ảnh bí mật) bên trong một hình ảnh khác có cùng kích thước (ảnh cover). Thông qua các thử nghiệm của mình chúng tôi đã chứng minh được phương pháp này mang lại hiệu quả tối ưu. Các kết quả được so sánh với nghiên cứu của Google Research và Đại học Thượng Hải cho thấy phương pháp của chúng tôi đạt ưu điểm vượt trội hơn so với nghiên cứu tương tự

Deep Neural Networks based Invisible Steganography for Audio-into-Image Algorithm

Pham Huu Quang - Hoang Dinh Thoi - Pham Van Toan - Ta Minh Thanh 019 IEEE 8th Global Conference on Consumer Electronics (GCCE 2019) http://www.ieee-gcce.org/2019

Techinical: Information Security, Steganography, Secure Data Transmission, Deep Convolutional Neural Network.

Steganography là ngành khoa học che giấu thông tin bí mật bên trong các dạng dữ liệu thông thường. Trong bài báo này, chúng tôi đề xuất việc sử dụng các kỹ thuật Deep learning để giấu đi âm thanh bí mật vào các hình ảnh kỹ thuật số. Các thí nghiệm được thực hiện với một bộ dữ liệu 24.000 ảnh và bộ dữ liệu âm thanh có tên VIVOS Corpus. Thông qua kết quả thử nghiệm, chúng tôi đã chứng minh được phương pháp của chúng tôi hiệu quả hơn các phương pháp truyền thống. Tính toàn vẹn của cả hình ảnh và âm thanh được bảo toàn gần như tuyệt đối trong khi độ dài của âm thanh ẩn được tăng lên đáng kể.

Proposal of feature matching technique using similarity featuresfiltering for image alignment

Pham Van Toan, Ta Minh Thanh, Nguyen Thanh Trung, Pham Thi Hong Anh Proceedings of the ISSAT International Conference on Data Science in Business, Finance and Industry (DSBFI 2019) https://www.researchgate.net/publication/332696653_Proposal_of_Feature_Matching_Technique_Using_Similarity_Features_Filtering_for_Image_Alignment

Techinical: Image alignment, similarity features filtering, feature matching, feature-extraction.

Nghiên cứu đề xuất phương pháp cải tiến cho bài toán feature-based alignment cho dạng dữ liệu dạng biểu mẫu, hóa đơn. Kết quả thực nghiệm cho thấy thuật toán đã cải thiện đáng kể độ chính xác của bài toán feature-based alignment

Improving Phonetic Recognition with Sequence-length Standardized MFCC Features and Deep Bi-directional LSTM

Pham Van Toan, Nguyen Thanh Hau and Ta Minh Thanh 2018 5th NAFOSTED Conference on Information and Computer Science (NICS) https://www.researchgate.net/publication/329705993_Improving_Phonetic_Recognition_with_Sequence-length_Standardized_MFCC_Features_and_Deep_Bi-Directional_LSTM

Techinical: Natural language processing, audio processing with MFCC, sequence length, recurrent neural network with tensorflow.

Phát hiện lỗi sai trong phát âm là một trong những bài toán quan trọng trong lĩnh vực nghiên cứu về ngôn ngữ. Trong bài báo hoa học này, chúng tôi sử dụng phương pháp Mel Frequency Cepstral Coefficients (MFCC) để trích chọn đặc trưng, sử dụng kiến trúc mạng Recurrent Neural Network kết hợp kĩ thuật sequence length. Với data từ tập dữ liệu TIMIT chúng tôi đã cài đặt và thử nghiệm nhiều mô hình với các kiến trúc khác nhau. Trong số các mô hình đó, kết quả tốt nhất được ghi nhận là 13.05 % PER (Phonemes Error Rate), thấp hơn so với kết quả tốt nhất ở thời điểm hiện tại khoảng 3.5%

Large scale fashion search system with deep learning and quantization indexing

Pham Van Toan, Hoang Dinh Thoi, Pham Hoang Anh, Nguyen Thanh Hau, Ta Minh Thanh Proceedings of the Ninth International Symposium on Information and Communication Technology. ACM, 2018. https://dl.acm.org/citation.cfm?id=3287964

Techinical: Object detection with SSD MobilenetV2, Triplet loss,Quantization indexing, Similarity learning, image retrieval.

Trong bài báo khoa học này, chúng tôi xây dựng một hệ thống tự động tìm kiếm các sản phẩm thời trang tương tự trong kho dữ liệu lớn dựa trên hình ảnh mà người dùng cung cấp. Đóng góp chính của nghiên cứu này là phương pháp Quantization Indexing - một phương pháp convert dữ liệu từ không gian vector số thực (numerical space) sang không gian văn bản (text space), từ đó việc tìm các sản phẩm thời trang tương tự có thể được tiến hành một cách dễ dàng với sự giúp đỡ của công cụ Elasticsearch

A Practical Solution to the ACM RecSys Challenge 2018

Pham Thi Hong Anh ACM RecSys challenge 2018 https://www.researchgate.net/publication/330304128_A_Practical_Solution_to_the_ACM_RecSys_Challenge_2018

Techinical: Recommendation with Colaborative Filtering and SVD, Matrix Factorization, Content based learning.

Với tập dataset được cung cấp bởi Spotify cho cuộc thi ACM RecSys challenge 2018. Bài báo trình bày về hướng giải quyết bài toán gợi ý các bài hát tiếp theo cho 10.000 Playlist trong tập challenge.

Deep learning ASR-based approach to non-native learner mispronunciation detection

Pham Van Toan - Ta Minh Thanh - Nguyen Thanh Hau The 2018 Vietnam joint Conference on Artificial Intelligence for Life (AI4Life-2018) https://ai4life.uet.vnu.edu.vn

Techinical: Speech Recognition, Mispronunciation Evaluation, Goodness of Pronunciation Estimation.

Trong các bài báo này chúng tôi đã thử một số mô hình học tập sâu như CNN, RNN và kết hợp chúng cho phân loại ngữ âm tiếng Nhật. Nghiên cứu được áp dụng trong Talky Bird - một ứng dụng di động phát hiện lỗi phát âm của người học tiếng Nhật

Aggregation of non linear features LASSO in real estate pricing

Pham Van Toan, Nguyen Hoang Huy Vietnam Mathematics and Applications 2016 http://www1.vnua.edu.vn/tapchi/Upload/9-2016-cntt.pdf

Techinical: Lasso Regression, Combine Features, Feature Extraction for Real Estate data.

Sử dụng phương pháp kết tập các thuộc tính hồi quy phi tuyến tính cải thiện hiệu năng của ứng dụng định giá bất động sản trên địa bàn quận Long Biên và quận Montreal. Phương pháp đạt được nhiều cải tiến so với các phương pháp cũ như Linear và SVM

Vietnamese Text Classification based on BoW and Keywords Extraction with Neural Network

Pham Van Toan, Ta Minh Thanh The 21st Asia Pacific Symposium on Intelligent and Evolutionary Systems Conference 2017 https://ieeexplore.ieee.org/document/8233559

Techinical: Bag of Word, Keywords Extraction, Neural Network, Text Classification.

Sử dụng phương pháp kết tập các keywords làm vecto đặc trưng và áp dụng với mạng nơ ron ứng dụng cho bài toán phân loại văn bản tiếng Việt. Theo thí nghiệm đánh giá, độ chính xác được báo cáo là 99,75%. Đây là kết quả tốt nhất tại thời điểm nghiên cứu so với các phương pháp ứng dụng trên cùng một tập dữ liệu văn bản tiếng Việt