ACHIEVEMENTS

AI - MACHINE LEARNING - DEEP LEARNING

Fashion Lookup

06 - 2018

Fashion Lookup

06 - 2018

Techinical: Triplets Loss, CNN, MobileNet, Similarity Search, Image Retrieval.

Sử dụng camera điện thoại quét món đồ muốn mua và tìm kiếm các mặt hàng thời trang tương tự. Sử dụng công nghệ Deep Learning, Triplets Loss để tạo ra các vector đặc trưng của mỗi sản phẩm thời trang. Sử dụng hệ thống indexing dữ liệu để tạo index cho các vector đặc trưng dạng số thực giúp truy vấn nhanh hơn. Ứng dụng đưa mô hình AI lên trên Mobile giúp giảm việc xử lý phía server đi rất nhiều.


;

Face Recognition

06 - 2018

Face Recognition

Techinical: Tensorflow, face net, yolo.

Sử dụng camera giám sát của công ty, phân tích hình ảnh những nhân viên công ty, và cả những người không thuộc công ty, để báo cho admin. Hệ thống hiện tại chỉ được sử dụng cho tầm 100 người, tuy nhiên dự định trong tương lai sẽ dùng cho toàn bộ nhân viên trong công ty.


;

HR Auto Scoring

01 - 2019

HR Auto Scoring

01 - 2019

Techinical: Tensorflow, OpenCV, SVM.

Nhằm giúp bộ phận HR tiết kiệm được thời gian và công sức khi hằng ngày phải xử lý lượng lớn kết quả đến từ các bài kiểm tra trắc nghiệm của các ứng viên ứng tuyển vào công ty. Ứng dụng sử dụng các phương pháp xử lý ảnh kết hợp với học sâu để định vị chính xác các vùng câu trả lời, từ đó xác định ra các câu trả lời ứng viên chọn, so khớp với đáp án có sẵn để trả về kết quả một cách chính xác với tốc độ không đáng kể.


;

Techinical Article Spam Detection

06 - 2018

Techinical Article Spam Detection

06 - 2018 https://machine-learning.viblo.asia/

Techinical: NLP Feature Extraction, Word Embedding, Random Forest, Gradient Boosting.

Xác định xem 1 bài post trên trang Viblo có phải là bài viết spam hay không. Chúng tôi tiến hành thu thập khoảng 15000 bài viết có nội dung liên quan tới kĩ thuật trên Viblo và khoảng 20000 bài viết về các lĩnh vực không liên quan tới kĩ thuật từ các trang báo mạng. Với kĩ thuật TF-IDF cùng thuật toán SVM, hệ thống đạt được độ chính xác lên tới 99.7% trong khi tổng thời gian xử lý ở mức rất thấp (ms).


;

Article Tag Compare

06 - 2018

Article Tag Compare

06 - 2018 https://machine-learning.viblo.asia/

Techinical: Word Embedding, Float Vector Indexing, Float Vector Retrieval.

Tìm các tag có sự tương đồng về mặt ý nghĩa. Sử dụng dữ liệu về tags trên trang Viblo để huấn luyện mô hình có khả năng đánh giá sự tương đồng giữa 2 tags khác nhau.


;

Techinical Article Auto Tagging

06 - 2018

Techinical Article Auto Tagging

06 - 2018 https://machine-learning.viblo.asia/

Techinical: NLP Feature Extraction, Word Embedding, TF-IDF.

Tự động đánh tag phù hợp cho bài viết. Với bài toán này, chúng tôi sử dụng dữ liệu là chính những bài viết kĩ thuật được người dùng đánh tag trên Viblo. Thông qua bước trích chọn đặc trưng từ các keywords có liên quan tới kĩ thuật, mô hình Machine Learning có khả năng tự động gán tag phù hợp cho 1 vài post mới.


;

Article Language Detection

06 - 2018

Article Language Detection

06 - 2018 https://machine-learning.viblo.asia/

Techinical: NLP Feature Extraction, Word Embedding, LSTM.

Xác định ngôn ngữ của bài viết. Hướng tiếp cận của bài toán này là sử dụng kĩ thuật Graph-based N-gram và một vài phương pháp xử lý Unicode cơ bản để xác định ngôn ngữ. Sau khi bài viết đã được xác định đúng ngôn ngữ, việc tìm kiếm các bài viết liên quan cho người dùng thông qua Elasticsearch sẽ cho kết quả chính xác hơn, thông qua đó giúp cho người dùng có được trải nghiệm tốt hơn khi sử dụng Viblo.


;

Article Recommendation System

06 - 2018

Article Recommendation System

06 - 2018 https://machine-learning.viblo.asia/

Techinical: Colaborative Filtering, Content based Recommendation, Doc2Vec.

Hệ thống gợi ý các bài post trên Viblo. Tính tới thời điểm hiện tại, trên Viblo có hơn 20 nghìn bài viết kĩ thuật thuộc 100 chủ để khác nhau và con số này liên tục tăng theo thời gian. Với số lượng bài viết khổng lồ như vậy, việc gợi ý những bài viết có liên quan cho người dùng là 1 việc vô cùng quan trọng. Chính vì vậy, chúng tôi đã xây dựng nên 1 hệ thống gợi ý có khẳ năng tự động tìm kiếm và đưa ra gợi ý những bài viết có nội dung tương tự với bài viết mà người dùng đang đọc hoặc những bài viết cùng nằm trong topic mà người dùng quan tâm.


;

Article Plagiarism Detection

10 - 2018

Article Plagiarism Detection

10 - 2018 https://machine-learning.viblo.asia/

Techinical: Doc2Vec, Edit Distance, Float Vector Indexing and Search.

Phát hiện đạo văn của các bài post trên Viblo. Với số lượng bài viết khổng lồ trên và liên tục tăng như hiện tại, việc kiểm soát chất lượng cũng như sự trung thực các bài viết trên Viblo là một yếu tố rất quan trọng. Nhằm đáp ứng nhu cầu đó, chúng tôi đã xây dựng nên một hệ thống phát hiện kịp thời các bài viết đạo nhái, copy & paste các bài viết của các tác giả khác.


;

OTHER PRODUCTS

Cipher Cascade

2019

#Blockchain

#Blockchain

Cipher Cascade

2019 https://ciphercascade.com

Techinical: Ethereum, Loom Network, Web3js, Reactjs.

Cipher Cascade là một game được phát triển trên nền tảng Blockchain, và có thể được chơi trên các trình duyệt PC cũng như Smartphone. Bình thường thì tốc độ xử lý giao dịch trên nền tảng Ethereum khá là chậm khi mất đến hơn chục giây để có thể tạo ra một block. Cipher Cascade đã xây dựng một side chain liên kết với main chain Ethereum để tăng tốc độ xử lý giao dịch, giúp người dùng có thể chơi game với một tốc độ mượt mà hơn. Ngoài ra, với việc lưu trữ các token cũng như game logic trên side chain, người dùng có thể chơi game, cũng như mua bán, quản lý các tài sản token mà không không phải chi trả bất kỳ chi phí giao dịch (gas) nào.


;

Viblo

2015

#Social

#Social

Viblo

2015 https://viblo.asia

Techinical: Laravel, VueJS, NuxtJS, Docker, Single Page Application, Server side Rendering, Microservices.

Viblo là một Platform nơi mọi người có thể tự do Chia Sẻ, Hỏi Đáp, Học Tập, và Rèn Luyện các kỹ năng IT của mình. Trải qua gần 4 năm hình thành và phát triển, Viblo đã đạt được nhiều thành tựu lớn, trên con đường trở thành một nền tảng hữu ích dành cho các lập trình viên, với hy vọng thúc đẩy hơn nữa sự phát triển của cộng đồng IT Việt Nam. Với hơn 25,000 người dùng, hơn 20,000 bài viết được chia sẻ, hơn 700 bài viết mới cũng như hơn 1,5 triệu pageviews hàng tháng, Viblo hứa hẹn là nơi tuyệt vời để bạn có thể nâng cao năng lực kỹ thuật của mình.


;

Sun* CI

11 - 2018

#DevOps

#DevOps

Sun* CI

11 - 2018

Techinical: ReactJS, Docker, Laravel, Python, Golang.

Sun* CI là một platform được tạo ra nhằm thực hiện các chức năng về Continuous Integration và Continuous Deployment. Sun* CI giúp cho developer tự động trong việc tích hợp và triển khai source code trong quá trình làm việc, tự động chạy các tool test để kết quả sau khi code của developer đạt chất lượng tốt nhất. Việc tự động triển khai giúp hạn chế các thao thác thủ công trước đây đồng thời nâng cao năng suất làm việc.


;

Talky Bird

06 - 2018

#AI

#AI

Talky Bird

06 - 2018 https://talkybird.com

Techinical: Tensorflow, CTC, HMM-GMM Forced Alignment, Goodness of Pronunciation.

Việc kiểm tra lỗi phát âm tiếng Nhật được thực hiện bằng ứng dụng Talky Bird khi gửi âm thanh phát âm từ phía người dùng và text tương ứng lên server. Trên server sẽ sử dụng các giải thuật về trích xuât thời gian của các phoneme (Forced Alignment) và từ các khoảng thời gian tương ứng sẽ trích chọn được đặc trưng của âm thanh. Sau đó sử dụng giải thuật đánh giá phát âm dựa trên đặc trưng của âm thanh giúp đưa ra feedback cho người học tiếng Nhật.


;