[GEO 특별편] 왜 AI는 우리 콘텐츠를 인용하지 않을까?

2026. 4. 30.

마케터를 위한 뉴스레터 [대외비.]

AI에 대한 관심이 점점 더 뜨거워지고 있어요. 최근에는 ChatGPT와 Claude가 경쟁적으로 신규 모델을 내놓았는데요, 그만큼 생성형 AI 검색에 대응하려는 움직임도 많아진 것 같아요. 그래서 그런지 지난 호부터 "우리 브랜드 검색해봤더니 AI가 경쟁사 얘기만 하는 이유가 뭔가요?”, “열심히 콘텐츠를 만드는데, 왜 ChatGPT 답변에는 우리 브랜드가 없을까요?“와 같은 질문들을 많이 해주셨는데요,

이번 [대외비.]에서는 독자 분들께서 많이 질문해주셨던 GEO를 위한 기초 구조, 즉 AI 검색엔진이 수많은 웹페이지 중에서 특정 콘텐츠를 답변의 출처로 선택하는 원리와 이를 실제로 적용하는 구체적인 구조에 대해 소개합니다.

AI는 어떻게 콘텐츠를 인용할까?

AI는 수십 개의 웹페이지 중에서 어떤 기준으로 콘텐츠를 고를까요? 이를 이해하려면 AI 검색엔진이 답변을 만드는 세 단계 과정을 알아야 합니다.

첫 번째 단계는 질문 확장입니다. 사용자의 질문을 받은 AI는 이를 그대로 검색하지 않아요. 하나의 질문을 검색하기 좋은 여러 개의 세부 질문으로 먼저 분해하죠. 이걸 ‘팬아웃 쿼리(Fan-Out Query)’라고 해요. 예를 들어 "ETF 어떻게 시작하나요?"라는 질문은 "ETF 투자 증권 계좌 개설 방법", "ETF 초보자 첫 종목 고르는 기준" 같은 형태로 확장하는 거죠. 그래서 콘텐츠를 작성할 때, 중심 주제와 관련된 세부 주제들을 함께 다뤄야 AI의 인용 가능성을 높일 수 있답니다.

두 번째 단계는 정보 수집이에요. AI는 팬아웃 쿼리로 확장한 질문들을 웹에 검색하고, 이에 적절한 콘텐츠를 수집하는데요, 이 과정을 ‘RAG(Retrieval-Augmented Generation)’라고 해요. 여기서 중요한 건 AI는 페이지 전체를 처음부터 끝까지 읽지 않는다는 점입니다. 질문과 연관성이 높은 단락이나 섹션 단위로 정보를 추출하거든요. 그래서 섹션이 명확하게 나뉘고 각 단락이 독립적으로 의미를 전달하는 글이 AI에게 선택될 가능성이 높아요.

세 번째 단계는 답변 생성이에요. 수집한 정보를 바탕으로 최종 답변을 완성해요. 이를 ‘근거 기반 답변 생성(Grounded Generation)’이라고 합니다. AI는 이 과정에서 수집한 자료의 범위를 벗어나지 않으려 하기 때문에, 수치가 구체적이고 출처가 명확한 콘텐츠일수록 답변에 포함될 가능성이 높아져요.

세 단계를 보면 공통된 맥락을 발견할 수 있어요. AI에게 인용되는 콘텐츠는 AI가 단락 단위로 추출해서 바로 활용할 수 있는 구조를 갖춘 글이라는 거죠. 그렇다면 그 구조는 구체적으로 무엇일까요?

AI가 인용하는 콘텐츠의 5가지 공통점

AI가 인용하는 콘텐츠의 공통점은 크게 5가지로 요약할 수 있어요. 이번 [대외비.]에서는 이 5가지 구조를 소개해볼게요.

1️⃣ 즉답형 구조(Direct Answer) – 핵심을 첫 문장에!

AI는 RAG 방식으로 단락 단위 정보를 추출하기 때문에, 핵심 답변이 첫 문장에 등장하는 콘텐츠를 압도적으로 더 자주 인용하는 경향이 있어요. 관련 연구¹에 따르면 직접 답변 구조는 AI 인용 가시성을 최대 41% 높일 수 있다고 해요.

즉답형 구조는 질문의 답이 하나로 명확하게 떨어지는 경우에 특히 효과적입니다. "A란 무엇인가", "A의 특징은 무엇인가", "A와 B의 차이는 무엇인가"처럼 하나의 문장이나 문단으로 완결되는 질문이 여기에 해당하죠.

미적용 예시: ETF는 최근 많은 투자자들의 관심을 받고 있는 금융 상품입니다. 상장지수펀드라고도 하는데요, 주식 시장에서 거래되는 다양한 상품 중 하나로, 초보 투자자부터 전문 투자자까지 폭넓게 활용되고 있습니다. ETF가 무엇인지, 어떻게 투자하는지 아래에서 자세히 살펴보겠습니다.

적용 예시: ETF(상장지수펀드)란 특정 지수나 자산을 추종하도록 설계된 펀드를 주식처럼 거래소에서 사고팔 수 있도록 만든 금융 상품입니다. 개별 주식처럼 실시간 매매가 가능하면서도 펀드처럼 분산 투자 효과를 얻을 수 있다는 것이 가장 큰 특징입니다.

콘텐츠를 작성하다 보면 미적용 예시처럼 본론에 앞서 자연스러운 도입부를 고려하게 되죠. 하지만 AI 입장에서 미적용 예시는 정보 탐색에 시간이 오래 걸리는 구조예요. 반면, 적용 예시는 첫 문장에 ETF의 정의와 설명이 정리되어 있어서 인용하기에 적합하죠. 글의 앞부분 섹션을 시작할 때 "이 섹션에서 독자가 가장 먼저 알고 싶은 것이 무엇인가?"를 먼저 떠올리고, 그 답을 첫 문장에 배치하면 즉답형 구조를 적용하는 데 큰 도움이 될 수 있어요.

2️⃣ 리스트형 구조 – 나열할 정보는 쪼개서

리스트형 구조는 정보가 독립적으로 구분되어 AI 인용에 효과적이에요. 문단 안에 여러 정보가 섞여 있는 것보다 기준에 따라서 정보가 나뉘어 있는 게 더 이해하기 편하겠죠.

리스트형 구조는 여러 내용을 나열해서 설명해야 할 때 효과적입니다. "ETF 선택 기준은 무엇인가", "초보자가 확인해야 할 투자 지표는 무엇인가"에 대한 답처럼 여러 내용이 서로 다른 정보를 담고 있다면 줄글보다는 리스트형으로 쪼개서 설명하는 걸 추천해요.

미적용 예시: ETF를 고를 때는 총보수, 순자산총액, 일평균 거래량, 추적오차, 분배금 지급 여부를 확인해야 합니다. 총보수는 ETF를 보유하는 동안 매년 차감되는 비용으로, 동일 지수를 추종하는 ETF라면 총보수가 낮은 상품이 장기적으로 유리합니다. 통상 50억 원 이상을 상장폐지 안전선으로 보며, 여유 있게 보려면 100억 원 이상을 권장하는 경우가 많습니다. 거래량은...

적용 예시
- 총보수(운용보수): ETF를 보유하는 동안 매년 차감되는 비용으로, 동일 지수를 추종하는 ETF라면 총보수가 낮은 상품이 장기적으로 유리합니다.
- 순자산총액(AUM): 규모가 클수록 유동성이 높고 상장폐지 위험이 낮습니다. 통상 50억 원 이상을 상장폐지 안전선으로 보며, 여유 있게 보려면 100억 원 이상을 권장하는 경우가 많습니다
- 일평균 거래량: 거래량이 적으면 매수·매도 시 원하는 가격에 체결되지 않을 수 있습니다. 거래대금이 지속적으로 낮은 ETF는 관리종목 지정 및 상장폐지 위험이 있으므로 거래가 활발한 상품을 선택하는 것이 중요합니다.
- 추적오차(Tracking Error): ETF가 추종하는 지수와 실제 수익률의 차이입니다. 수치가 낮을수록 지수를 정확하게 따라가고 있다는 의미입니다.
- 분배금 지급 여부: 분배금을 지급하는 ETF는 현금 흐름을 원하는 투자자에게 유리하며, 미지급 상품은 복리 효과를 극대화할 수 있습니다.

이렇게 리스트형 구조는 다양한 내용을 다뤄야 할 때 효과적이에요. 그리고 각 항목이 독립된 내용으로 완결될 수 있도록 작성하면 더욱 효과적이에요.

3️⃣ 정의형 구조 – 하나의 단락, 하나의 주제!

AI는 하나의 단락 안에서 하나의 정보가 완결되는 구조를 선호합니다. 한 문장에 여러 정보가 섞여 있으면 AI가 필요한 정보만 추출하기 어렵기 때문입니다. AI는 콘텐츠 내용을 이해하기 위해 특정한 정보 단위(청크)로 잘라서 평가하는데요, 이때 한 문장에 여러 정보가 섞여 있으면 AI가 처리해야 할 정보 단위가 길어져서 판단이 어려워지기 때문이죠. 예시를 한번 볼까요?

미적용 예시: PER은 주가와 기업 수익을 비교하는 주식 투자 지표인데, 현재 주가가 주당순이익에 비해 어느 정도 수준인지를 나타내며, PER이 낮은 경우에는 저평가, 높은 경우에는 고평가된 종목으로 볼 수 있어 투자자들이 기업의 주가 수준을 판단할 때 널리 활용되고 있습니다.

적용 예시: PER(주가수익비율)은 현재 주가를 주당순이익(EPS)으로 나눈 값입니다. 투자자가 기업의 순이익 1원에 현재 몇 원을 지불하고 있는지를 나타냅니다. PER이 낮을수록 이익 대비 주가가 저평가, 높을수록 고평가된 것으로 해석합니다.

미적용 예시에는 PER에 대한 정의와 계산 방식, 해석 기준이 복문으로 섞여 있어요. 반면 적용 예시에서는 정보가 개별 문장으로 나뉘어져 있죠. "A는 B입니다" 형태로 한 문장에 하나의 정보만 담는 방식은 개념 설명뿐 아니라 결론 제시, 조건 서술, 원칙 설명 등 콘텐츠 전반에 적용할 수 있어요.

4️⃣ 데이터 기반 구조 - 수치와 출처를 함께!

AI에게 인용되려면 수치와 근거도 신경 써야 합니다. AI는 근거 기반 요약 방식으로 답변을 생성해요. 그래서 “많은 사람들이 이용합니다”처럼 두루뭉술한 말보다는 구체적인 수치, 출처가 명시된 문장이 근거로 인용될 가능성이 높죠. 관련 연구에서도 통계 수치를 포함한 콘텐츠는 그렇지 않은 콘텐츠 대비 최대 40% 높은 AI 인용률을 기록¹했다고 해요.

미적용 예시: NOVA ETF는 국내 투자자들에게 가장 신뢰 받는 ETF 브랜드입니다. 업계 최고 수준의 운용 능력과 다양한 상품 라인업을 바탕으로 꾸준히 높은 수익률을 기록하고 있으며, 앞으로도 투자자 여러분의 자산 성장을 위해 최선을 다하겠습니다.

적용 예시: NOVA ETF의 NOVA 미국S&P500은 2024년 연간 수익률 32.4%를 기록하며, 같은 지수를 추종하는 경쟁 상품 중 수익률 1위입니다. (동기간 국내 ETF 전체 평균 수익률(17.2%) 대비 약 15%p 높은 수치) 순자산총액은 2026년 1분기 기준 4조 2000억 원으로 전년 동기 대비 38% 증가했으며, 이는 동기간 국내 ETF 시장 평균 성장률(17.3%)의 두 배를 웃도는 수치입니다. (출처: 한국거래소, 2026년 1분기 ETF 시장 동향)

* 위의 예시에 등장한 브랜드는 모두 가상의 브랜드입니다.

미적용 예시처럼 근거 없는 홍보성 표현은 오히려 AI 인용 가능성을 낮출 수 있어요. 관련 연구를 찾아 보면 홍보성 표현은 AI 인용 가능성과 -26%의 상관관계가 있다는 조사 결과²도 있었는데요, 브랜드의 USP나 성과를 강조하는 콘텐츠일수록 AI가 신뢰할 수 있는 수치, 비교 기준, 출처 등 근거를 제시하면 효과적으로 AI 인용에 대응할 수 있어요.

5️⃣ 비교형 구조 - 같은 기준으로 나란히

“ETF 상품 중에서 A랑 B 중에 뭐가 더 좋아?”처럼 AI 검색 사용자의 질문 상당수는 비교 의도를 담고 있어요. AI는 비교 의도가 담긴 질문에 답할 때, 두 대상을 공통된 기준으로 한 페이지 안에서 나란히 정리한 콘텐츠를 우선적으로 인용하는 경향이 있습니다.

이런 질문에서 표 형태의 비교 구조는 AI가 두 대상의 차이를 한 번에 추출하기 가장 좋은 형식입니다. 표 형태의 비교 구조가 담긴 콘텐츠는 그렇지 않은 콘텐츠 대비 AI 인용 가능성이 2.5배 높다는 분석 결과³도 있으니까요. 비교형 구조는 서로 다른 두 대상의 특성을 동일한 기준으로 설명해야 할 때 특히 효과적이에요.

추가로, AI는 텍스트 기반으로 인용하기 때문에 표 내용을 정리한 요약 문장을 함께 제공하면 AI 인용에 도움이 될 수 있어요.

적용 예시

국내 시장 중심의 안정적인 투자를 원한다면 거래량이 높고 유동성이 풍부한 NOVA가, 해외 지수나 글로벌 자산에 분산 투자를 원한다면 해외 ETF 라인업이 다양한 KOMEX가 상대적으로 유리합니다.

* 위의 예시에 등장한 브랜드는 모두 가상의 브랜드입니다.

위의 적용 예시처럼 공통된 기준으로 정리된 표와 명확한 요약 문장을 함께 제시하면, 두 ETF 브랜드의 차이를 묻는 질문에 AI가 바로 활용할 가능성을 높일 수 있어요.

마치며

지금까지 살펴본 5가지 구조는 서로 독립적인 요소가 아니에요. 하나의 콘텐츠 안에 이 구조들이 함께 담길수록 AI가 다양한 질문에 걸쳐 해당 페이지를 반복적으로 인용할 가능성을 높일 수 있어요. 즉답형으로 핵심을 먼저 제시하고, 리스트로 항목을 분리하고, 정의형으로 개념을 끊고, 데이터로 주장을 뒷받침하고, 비교표로 선택 기준을 제공하는 거죠.

하지만 이 구조들을 이해하는 것과 실제로 콘텐츠에 적용하는 것은 다른 문제예요. AI의 팬아웃 쿼리에 대응하고 키워드를 어떻게 질문으로 변환하고, 5가지 구조를 한 편의 글 안에 어떤 순서로 배치하고, FAQ를 어떻게 구성해야 하는지, 그리고 발행 후 AI 인용 여부를 어떻게 확인하는지는 별도의 실행 가이드가 필요해요.

그래서 다음 [대외비.]에서는 오늘 소개한 구조를 실제 콘텐츠에 적용하는 실전 기초 설계법을 다뤄보겠습니다.

FAQ

Q. 기존에 발행한 콘텐츠도 구조를 바꾸면 AI 인용 가능성이 올라가나요?

A. 충분히 개선할 수 있어요. AI 검색엔진은 콘텐츠를 지속적으로 크롤링하기 때문에, 기존 페이지라도 구조가 개선되면 다음 시점에 재평가될 수 있어요. ChatGPT가 인용하는 페이지의 76.4%는 최근 30일 이내에 업데이트된 콘텐츠⁴라는 조사 결과도 있어요. 새 글을 발행하는 것보다 이미 인덱싱되어 있는 기존 페이지의 구조를 GEO 관점에서 보강하는 것이 더 빠르게 효과를 볼 수 있는 경우도 많습니다.

Q. 5가지 구조를 모두 넣어야 하나요?

A. 그렇지 않아요. 주제와 내용에 따라 자연스럽게 적용할 수 있는 구조가 다를 수 있거든요. 억지로 모든 구조를 끼워 넣으면 오히려 콘텐츠의 흐름이 어색해질 수도 있고요. 중요한 건 모든 구조를 삽입했는가가 아니라 콘텐츠 내용을 적합한 구조로 잘 표현했는가라고 볼 수 있는 거죠.

Q. 인용할 데이터나 수치가 없는 주제는 어떻게 해야 하나요?

A. 반드시 공식적인 근거가 있어야 하는 것은 아니에요. 자체적으로 수집한 데이터, 고객 사례의 구체적인 수치, 실험 결과 등도 출처와 조사 시점을 명시하면 AI가 신뢰할 수 있는 근거로 인용할 가능성이 있어요. 수치가 전혀 없는 경우라면 정의형, 즉답형, 리스트형 구조를 조합해 정보의 명확성을 높이는 방향으로 보완하는 것도 주요한 전략이 될 수 있답니다.

오늘 소개해드린 GEO를 위한 필수 구조! 어떻게 보셨나요? 시간이 갈수록 GEO에 대한 관심이 더 깊어지고 더 많은 업계에서 나타나고 있는 것 같아요. GEO에 대한 많은 질문도 받고 있어서 다음 달에도 GEO에 대한 인사이트로 인사드리려고 해요.

그리고 [대외비.]를 발행하고 있는 TMCK에서도 생성형 AI 검색에 대응하는 GEO 서비스를 운영 중인데요, 단순한 분석에 그치지 않고 AI가 인용하는 모든 인용 환경을 파악하고 AI 가시성을 개선할 수 있도록 분석부터 실행까지, 통합 GEO 솔루션을 제공하고 있어요. GEO 전략이 막막했다면 TMCK와 함께 AI 검색에 대응해보세요.

* TMCK의 GEO 전략이 더 궁금하시다면 여기를 눌러 문의를 남겨주세요! 😊