Knowledge Graph (지식 그래프)

**Knowledge Graph(지식 그래프)**는 데이터를 entity(노드)와 relationship(엣지)로 표현하는 graph-structured knowledge base
단순 문자열 매칭이 아니라 의미(semantic) 기반 추론·탐색을 가능하게 하는 시맨틱 데이터 모델
entity type과 유효한 관계를 정의하는 ontology(스키마) 계층을 가진 구조

쉽게 이해하기

SNS 친구 관계도를 떠올려 보자. 사람은 점(노드), 친구 관계는 선(엣지)이다. “내 친구의 친구”를 따라가며 친구 추천이 가능한 이유가 바로 이 그래프 구조 덕분이다.

지식 그래프는 여기서 한 걸음 더 나아가 사람뿐 아니라 영화·배우·장르·도시까지 모두 점으로 두고, “출연했다 / 같은 장르다 / ~에 산다” 같은 의미 있는 관계를 선으로 잇는다. 그러면 “내가 본 영화에 나온 배우가 출연한, 같은 장르의 다른 영화”처럼 표(table)로는 표현하기 까다로운 연결을 자연스럽게 따라갈 수 있다.

해당 개념이 필요한 이유

관계형 DB의 경직된 테이블 스키마·단순 계층(tree)으로는 복잡한 many-to-many 관계 표현이 어려움
검색 엔진·AI 어시스턴트가 맥락 있는 답을 하려면 entity 간 의미 연결과 추론이 필요
도메인을 넘나드는 지식을 자연스럽게 통합하려면 유연한 그래프 토폴로지가 유리

AS-IS — 관계형/계층 구조

flowchart TD
    R[(Relational / Tree)] --> T1[Table: order]
    R --> T2[Table: customer]
    T1 -. FK join 으로만 연결 .-> T2
    Note1[복잡한 many-to-many·의미 관계 표현이 어색함]

TO-BE — 지식 그래프

flowchart LR
    O((Order)) -->|placed_by| C((Customer))
    C -->|lives_in| Reg((Region))
    O -->|contains| P((Product))
    P -->|category| Cat((Category))
    C -->|similar_to| C2((Customer))

핵심 구성요소

노드(entity) — 객체·이벤트·개념
엣지(relationship) — 의미를 담은 관계 (단순 연결이 아님)
ontology — entity type과 허용 관계를 정의하는 형식 스키마
entity linking — 도메인을 넘나드는 임의의 entity 상호 연결

RDF, triple, Semantic Web

지식 그래프는 흔히 RDF(Resource Description Framework)의 triple(주어-술어-목적어) 구조를 사용하고, Semantic Web 원칙과 정렬된다. JSON-LD, schema.org 같은 표준을 활용해 기계가 읽을 수 있는 의미와 linked data 상호운용성을 확보한다. 검색 엔진(Google/Bing), AI 어시스턴트(Siri/Alexa), 추천 시스템 등이 대표적 활용처다.

OKF와의 관계

OKF (Open Knowledge Format)에서 각 concept 문서는 일반 markdown 링크로 서로를 참조한다. 그 결과 디렉터리는 파일시스템의 부모/자식 관계를 넘어 관계의 그래프(graph) 가 된다 — 즉 OKF는 무거운 RDF·triple store 없이도 markdown 링크만으로 가벼운 지식 그래프를 구현하는 셈이다.

실제 적용 사례

① Netflix — 그래프 임베딩 추천으로 연 $1B+ 효과

무엇을 모델링하나 — 영화·배우·장르·테마를 노드로, “출연했다 / 같은 장르다 / 유사 테마다” 등을 엣지로 연결한다.
어떻게 쓰나 — 이 그래프를 graph embedding(노드를 벡터로 변환)으로 바꿔 추천 엔진에 넣는다. 관계형 테이블이라면 “내가 본 영화에 나온 배우가 출연한 + 같은 테마의 다른 작품”을 매번 여러 번의 조인으로 풀어야 하지만, 그래프는 이를 엣지를 따라가는 탐색으로 자연스럽게 해결한다.
이점 — 이렇게 만든 초개인화 추천이 가져오는 고객 유지·획득 효과는 연 10억 달러 이상으로 추정된다. “다음에 볼 것”을 잘 맞히는 것 자체가 핵심 비즈니스 가치다.

② Google Knowledge Graph — 검색을 “문자열”에서 “사물”로

무엇을 모델링하나 — 사람·장소·책·사건과 그 상호관계를 수천억 개의 사실(fact) 로 담는다.
어떻게 쓰나 — “에펠탑”을 검색하면 높이·위치·관련 인물이 담긴 정보 패널이 뜨는 것이 대표적. 키워드 매칭이 아니라 엔티티와 맥락을 이해하는 검색을 구동하고, 동음이의어 구분(disambiguation)·음성 질의·생성형 AI 답변을 검증된 사실에 묶어준다(grounding).
이점 — “string에서 thing으로” — 검색이 단어 일치가 아니라 의미 단위로 작동해, 더 자연스러운 질의와 사실 기반 답변이 가능해진다.

③ LinkedIn Economic Graph — 10억 노드로 “아는 사람” 추천

무엇을 모델링하나 — 사람·회사·학교·스킬을 10억+ 노드, 2,500억+ 관계로 연결한다.
어떻게 쓰나 — “People You May Know”, 채용 매칭, 스킬 갭 기반 학습 추천이 모두 이 그래프 위에서 “내 1촌의 1촌”, “이 직무가 요구하는 스킬을 가진 사람” 같은 관계 탐색으로 계산된다.
이점 — 노동 시장 트렌드 분석부터 개인 커리어 추천까지, 표 기반으로는 표현하기 힘든 다단계 인적 네트워크를 직접 질의할 수 있다.

④ Amazon COSMO — 제품 그래프로 맥락 추론

무엇을 모델링하나 — 제품·속성·구매행동·리뷰·호환관계를 엮는다.
어떻게 쓰나 — 단순 “같이 산 상품”을 넘어 기능·대상·사용 장소까지 고려한 추천, 품절 시 대체상품 제안, 사기 탐지를 수행한다.
이점 — 맥락(예: “캠핑용”, “아이 선물용”)을 추론에 넣어, 표면적 동시구매 통계보다 더 의도에 맞는 추천을 만든다.

Explorer

날짜별 보기

2026년 (148)

2025년 (8)