Graph Embedding

12 Oct 2019

Giới thiệu.

*GraphSage Embedding Algorithm*

Trong những bài toán về graph, các thành phần thường sẽ có node (các điểm, hay entity ở một số bài báo) và edge (các cạnh). Mối quan hệ giữa các node sẽ được biểu thị bởi cạnh. Bài viết này chủ yếu được tổng hợp từ article này, nếu thích đọc tiếng anh thì có thể đọc ở bài báo đó.

Graph Embedding là một bài toán Unsupervised learning. Dựa trên các tính chất cũng như mối quan hệ node và edge trong một graph, graph embedding sẽ biến đổi các node về một array có số chiều thấp và có ý nghĩa để dùng cho các “downstream task” trong machine learning. Về tổng thể, thì các thuật toán graph embedding có hai phần chính, encoder và decoder, thuật toán sẽ tối ưu hoá đồng thời encoder và decoder để biến đổi cấu trúc graph thành các vector trong không gian có số chiều thấp.

Các bài toán về graph embedding sẽ luôn có hai vấn đề:

Vì các thuật toán graph embedding được tối ưu theo hướng “unsupervised manner”, nên có khá nhiều chỉ số để đánh giá chất lượng của các thuật toán graph embedding, như là “link prediction”, “hit at K (hit@K)”…

Các cách tiếp cận chính trong graph embedding.

Có khá nhiều hướng tiếp cận cho bài toán graph embedding, nhưng theo ý kiến chủ quan của người viết thì có 2 hướng tiếp cận chính:

Trải nghiệm và ý kiến cá nhân.

Đây là dự án nghiên cứu mình làm cho cty, nên những thông tin chi tiết và kết quả thì mình ko thể nói được. Nhưng có thể chia sẻ những thông tin ko quan trọng và ý kiến cá nhân, hy vọng nó hữu ích.