1-1. Data Representation

Advanced Mathematics for AI

Featured image

본 글은 K-MOOC의 인공지능 수학 고급(Advanced Mathematics for AI) 강의를 듣고 요약한 글입니다.

Question

다음과 같은 문서가 있다. 이를 어떻게 우리가 쓰기 쉽게 표현할 수 있을까?

Answer

답은 다음과 같은 행렬을 만드는 것이다. : 문서 : 단어 AijA_{ij}: jj번째 단어가 ii번째 문서에 등장한 횟수

  romeo juliet happy dagger live die free New-Hampshire
d1d_1 1 1 0 0 0 0 0 0
d2d_2 0 1 1 1 0 0 0 0
d3d_3 1 0 0 1 0 1 0 0
d4d_4 0 0 0 0 1 1 1 1
d5d_5 0 0 0 0 0 0 0 1

앞으로 우리는 이러한 데이터들을 다룰 것이다.

데이터는 행렬(matrix) 또는 다차원 배열(multidimensional array)로 표현될 것이며 그 말인즉슨 tensor의 형태로 나타나게 될 것이라는 것이다.