• **Knowledge Graph(지식 그래프)**는 데이터를 entity(노드)와 relationship(엣지)로 표현하는 graph-structured knowledge base
  • 단순 문자열 매칭이 아니라 의미(semantic) 기반 추론·탐색을 가능하게 하는 시맨틱 데이터 모델
  • entity type과 유효한 관계를 정의하는 ontology(스키마) 계층을 가진 구조

쉽게 이해하기

SNS 친구 관계도를 떠올려 보자. 사람은 점(노드), 친구 관계는 선(엣지)이다. “내 친구의 친구”를 따라가며 친구 추천이 가능한 이유가 바로 이 그래프 구조 덕분이다.

지식 그래프는 여기서 한 걸음 더 나아가 사람뿐 아니라 영화·배우·장르·도시까지 모두 점으로 두고, “출연했다 / 같은 장르다 / ~에 산다” 같은 의미 있는 관계를 선으로 잇는다. 그러면 “내가 본 영화에 나온 배우가 출연한, 같은 장르의 다른 영화”처럼 표(table)로는 표현하기 까다로운 연결을 자연스럽게 따라갈 수 있다.

해당 개념이 필요한 이유

  • 관계형 DB의 경직된 테이블 스키마·단순 계층(tree)으로는 복잡한 many-to-many 관계 표현이 어려움
  • 검색 엔진·AI 어시스턴트가 맥락 있는 답을 하려면 entity 간 의미 연결과 추론이 필요
  • 도메인을 넘나드는 지식을 자연스럽게 통합하려면 유연한 그래프 토폴로지가 유리

AS-IS — 관계형/계층 구조

flowchart TD
    R[(Relational / Tree)] --> T1[Table: order]
    R --> T2[Table: customer]
    T1 -. FK join 으로만 연결 .-> T2
    Note1[복잡한 many-to-many·의미 관계 표현이 어색함]

TO-BE — 지식 그래프

flowchart LR
    O((Order)) -->|placed_by| C((Customer))
    C -->|lives_in| Reg((Region))
    O -->|contains| P((Product))
    P -->|category| Cat((Category))
    C -->|similar_to| C2((Customer))

핵심 구성요소

  • 노드(entity) — 객체·이벤트·개념
  • 엣지(relationship) — 의미를 담은 관계 (단순 연결이 아님)
  • ontology — entity type과 허용 관계를 정의하는 형식 스키마
  • entity linking — 도메인을 넘나드는 임의의 entity 상호 연결

RDF, triple, Semantic Web

지식 그래프는 흔히 RDF(Resource Description Framework)의 triple(주어-술어-목적어) 구조를 사용하고, Semantic Web 원칙과 정렬된다. JSON-LD, schema.org 같은 표준을 활용해 기계가 읽을 수 있는 의미와 linked data 상호운용성을 확보한다. 검색 엔진(Google/Bing), AI 어시스턴트(Siri/Alexa), 추천 시스템 등이 대표적 활용처다.

OKF와의 관계

OKF (Open Knowledge Format)에서 각 concept 문서는 일반 markdown 링크로 서로를 참조한다. 그 결과 디렉터리는 파일시스템의 부모/자식 관계를 넘어 관계의 그래프(graph) 가 된다 — 즉 OKF는 무거운 RDF·triple store 없이도 markdown 링크만으로 가벼운 지식 그래프를 구현하는 셈이다.

실제 적용 사례

① Netflix — 그래프 임베딩 추천으로 연 $1B+ 효과

  • 무엇을 모델링하나 — 영화·배우·장르·테마를 노드로, “출연했다 / 같은 장르다 / 유사 테마다” 등을 엣지로 연결한다.
  • 어떻게 쓰나 — 이 그래프를 graph embedding(노드를 벡터로 변환)으로 바꿔 추천 엔진에 넣는다. 관계형 테이블이라면 “내가 본 영화에 나온 배우가 출연한 + 같은 테마의 다른 작품”을 매번 여러 번의 조인으로 풀어야 하지만, 그래프는 이를 엣지를 따라가는 탐색으로 자연스럽게 해결한다.
  • 이점 — 이렇게 만든 초개인화 추천이 가져오는 고객 유지·획득 효과는 연 10억 달러 이상으로 추정된다. “다음에 볼 것”을 잘 맞히는 것 자체가 핵심 비즈니스 가치다.

② Google Knowledge Graph — 검색을 “문자열”에서 “사물”로

  • 무엇을 모델링하나 — 사람·장소·책·사건과 그 상호관계를 수천억 개의 사실(fact) 로 담는다.
  • 어떻게 쓰나 — “에펠탑”을 검색하면 높이·위치·관련 인물이 담긴 정보 패널이 뜨는 것이 대표적. 키워드 매칭이 아니라 엔티티와 맥락을 이해하는 검색을 구동하고, 동음이의어 구분(disambiguation)·음성 질의·생성형 AI 답변을 검증된 사실에 묶어준다(grounding).
  • 이점 — “string에서 thing으로” — 검색이 단어 일치가 아니라 의미 단위로 작동해, 더 자연스러운 질의와 사실 기반 답변이 가능해진다.

③ LinkedIn Economic Graph — 10억 노드로 “아는 사람” 추천

  • 무엇을 모델링하나 — 사람·회사·학교·스킬을 10억+ 노드, 2,500억+ 관계로 연결한다.
  • 어떻게 쓰나 — “People You May Know”, 채용 매칭, 스킬 갭 기반 학습 추천이 모두 이 그래프 위에서 “내 1촌의 1촌”, “이 직무가 요구하는 스킬을 가진 사람” 같은 관계 탐색으로 계산된다.
  • 이점 — 노동 시장 트렌드 분석부터 개인 커리어 추천까지, 표 기반으로는 표현하기 힘든 다단계 인적 네트워크를 직접 질의할 수 있다.

④ Amazon COSMO — 제품 그래프로 맥락 추론

  • 무엇을 모델링하나 — 제품·속성·구매행동·리뷰·호환관계를 엮는다.
  • 어떻게 쓰나 — 단순 “같이 산 상품”을 넘어 기능·대상·사용 장소까지 고려한 추천, 품절 시 대체상품 제안, 사기 탐지를 수행한다.
  • 이점 — 맥락(예: “캠핑용”, “아이 선물용”)을 추론에 넣어, 표면적 동시구매 통계보다 더 의도에 맞는 추천을 만든다.

참고 문서