論文

Simultaneous convolutional neural network for highly efficient image steganography

Pham Van Toan - Hoang Dinh Thoi - Do Hoang Thai Duong - Ta Minh Thanh 2019 19th International Symposium on Communications and Information Technologies (ISCIT) http://iscit2019.org

Techinical: Information Security, Image Steganography, Secure Data Transmission, Deep Convolutional Neural Network

本論文では、ディープラーニングモデルで画像ステガノグラフィの問題を解決することに集中しました。主な仕事は、同じサイズの別の画像(カバー写真)の中に画像(秘密の画像)を隠すことです。私達のテストによると、この方法が最適性能を提供することが証明されました。 グーグルリサーチと上海大学の研究と比較した結果は、この方法が類似の研究より優れた利点を持つことを示した。

Deep Neural Networks based Invisible Steganography for Audio-into-Image Algorithm

Pham Huu Quang - Hoang Dinh Thoi - Pham Van Toan - Ta Minh Thanh 019 IEEE 8th Global Conference on Consumer Electronics (GCCE 2019) http://www.ieee-gcce.org/2019

Techinical: Information Security, Steganography, Secure Data Transmission, Deep Convolutional Neural Network.

本論文では、秘密の音をデジタル画像に隠すためにディープラーニング技術を使用することを提案します。実験は24,000画像のデータセットとVIVOS Corpusという音声データセットで行われました。 テスト結果によると、私達の方法が従来の方法より効果的であることを証明されました。隠された音の長さが大幅に増加しながら、画像と音の両方の整合性はほぼ完璧に維持されています。

Proposal of feature matching technique using similarity featuresfiltering for image alignment

Pham Van Toan, Ta Minh Thanh, Nguyen Thanh Trung, Pham Thi Hong Anh Proceedings of the ISSAT International Conference on Data Science in Business, Finance and Industry (DSBFI 2019) https://www.researchgate.net/publication/332696653_Proposal_of_Feature_Matching_Technique_Using_Similarity_Features_Filtering_for_Image_Alignment

Techinical: Image alignment, similarity features filtering, feature matching, feature-extraction.

本論文では、画像アライメントの時の精度を改善するために、類似性特徴フィルタリングと呼ばれる特徴マッチング法と、請求書などの画像の前処理に適用するいくつかの新しい技術を提案しています。 実験結果は、提案した方法が他の特徴ベースの方法よりも良い結果を達成できることを示しました。

Improving Phonetic Recognition with Sequence-length Standardized MFCC Features and Deep Bi-directional LSTM

Pham Van Toan, Nguyen Thanh Hau and Ta Minh Thanh 2018 5th NAFOSTED Conference on Information and Computer Science (NICS) https://www.researchgate.net/publication/329705993_Improving_Phonetic_Recognition_with_Sequence-length_Standardized_MFCC_Features_and_Deep_Bi-Directional_LSTM

Techinical: Natural language processing, audio processing with MFCC, sequence length, recurrent neural network with tensorflow.

本論文では、音声認識の問題に取り組むためにディープラーニングを用いた新しいアプローチを提案しています。 具体的には、音声の音響特徴を提示し、音声分類に異なるRNNアーキテクチャを使用するための MFCC法(Mel Frequency Cepstral Coefficients) についてです。 そのうえ、よく知られているTIMITデータセットは、トレーニングフェーズと評価フェーズの両方で使用されています。 現在、双方向LSTMを使用することで最小のエラー率(13.05%PER)を達成しており、TIMITにおいて最良の結果となりました。 TIMITデータセットにおいて、既存の最高の結果と比較しても約3.5%の減少を達成しました。

Large scale fashion search system with deep learning and quantization indexing

Pham Van Toan, Hoang Dinh Thoi, Pham Hoang Anh, Nguyen Thanh Hau, Ta Minh Thanh Proceedings of the Ninth International Symposium on Information and Communication Technology. ACM, 2018. https://dl.acm.org/citation.cfm?id=3287964

Techinical: Object detection with SSD MobilenetV2, Triplet loss,Quantization indexing, Similarity learning, image retrieval.

本論文では、服装を自動的に認識し、類似した服装アイテムを即時的におすすめする、検索システムを提案しています。 私たちのシステムの情報検索が、大規模な実験を通して既存の全ての検索システムよりも高速であることが検証されています。

A Practical Solution to the ACM RecSys Challenge 2018

Pham Thi Hong Anh ACM RecSys challenge 2018 https://www.researchgate.net/publication/330304128_A_Practical_Solution_to_the_ACM_RecSys_Challenge_2018

Techinical: Recommendation with Colaborative Filtering and SVD, Matrix Factorization, Content based learning.

ACM RecSys チャレンジ 2018において、自動的にユーザの好みにあった曲をおすすめできるシステムを構築することを目指しました。Spotifyによって提供されたデータセットを用いながら、異なるアルゴリズムとテクニックを採用することで、私たちのシステムは、本チャレンジにおいて、ベスト15の結果を獲得しました。

Deep learning ASR-based approach to non-native learner mispronunciation detection

Pham Van Toan - Ta Minh Thanh - Nguyen Thanh Hau The 2018 Vietnam joint Conference on Artificial Intelligence for Life (AI4Life-2018) https://ai4life.uet.vnu.edu.vn

Techinical: Speech Recognition, Mispronunciation Evaluation, Goodness of Pronunciation Estimation.

本論文では、いくつかのCNNやRNNのようなディープラーニングモデルを試して、音声分類のためのそれらを組み合わせしました。この研究は、日本語学習者の発音の誤りを検出出来るモバイルアプリケーションTalky Birdに適用されています。

Aggregation of non linear features LASSO in real estate pricing

Pham Van Toan, Nguyen Hoang Huy Vietnam Mathematics and Applications 2016 http://www1.vnua.edu.vn/tapchi/Upload/9-2016-cntt.pdf

Techinical: Lasso Regression, Combine Features, Feature Extraction for Real Estate data.

本論文では、ベトナムのLong Bien地区とカナダのモントリオール地区における不動産価格を、予測する新しい方法を提案しています。実験結果によると、提案した方法が、従来の線形回帰アルゴリズムや、サポートベクターマシン(SVM)よりも、正確な不動産価格の予測を生成できることを証明しています。

Vietnamese Text Classification based on BoW and Keywords Extraction with Neural Network

Pham Van Toan, Ta Minh Thanh The 21st Asia Pacific Symposium on Intelligent and Evolutionary Systems Conference 2017 https://ieeexplore.ieee.org/document/8233559

Techinical: Bag of Word, Keywords Extraction, Neural Network, Text Classification.

本論文では、ベトナムのニュースを分類するために、Bag of Words(BoW)、キーワード抽出手法、およびニューラルネットワークアプローチを採用することを提案してます。テキスト分類は、自然言語処理の分野における主要なアプリケーションの一つになっており、 現在までに、この問題に対処するための多くのアプローチが提案されています。しかし、それらのアプローチのほとんどは英語で書かれた文書にのみの対応可能でした。また、今回の実験的評価によると、その精度は99.75%であると報告されています。