AI & IT

EP02. ChatGPT는 어떻게 정보를 찾아주는가?

아무거나설레임 2025. 10. 23. 12:43

Read Time: 5분 | 개발자가 발견한 AI 검색 최적화 시리즈

실험: ChatGPT에게 똑같은 질문을 10번 해봤습니다

지난주 EP01을 발행한 후, 이런 질문을 받았습니다.

"ChatGPT가 정보를 찾는 원리를 알아야 최적화를 할 수 있지 않나요?"

 

맞는 말입니다.

그래서 실험을 해봤습니다.

 

실험 내용: 질문: "온라인 쇼핑몰 분석 도구 추천해줘" → 10번 질문 → 10번의 답변 수집 → 어떤 브랜드가 몇 번 언급되는지 분석

결과는 놀라웠습니다:

도구명 언급 횟수 언급률
Google Analytics 10/10 100%
Cafe24 통계 8/10 80%
Wisetracker 6/10 60%
우리 클라이언트 0/10 0%

같은 질문인데, 왜 어떤 브랜드는 항상 언급되고, 어떤 브랜드는 한 번도 언급되지 않을까요?

ChatGPT의 작동 원리를 이해하면, 답이 보입니다.


ChatGPT는 어떻게 답변을 만드는가?

1단계: 당신의 질문 이해하기

사용자 질문 예시: "온라인 쇼핑몰 분석 도구 추천해줘"

ChatGPT 내부 처리: → "온라인 쇼핑몰" (도메인 파악) → "분석 도구" (카테고리 파악) → "추천" (의도 파악: 제품 추천)

일반 검색 엔진과 달리, ChatGPT는 의도(Intent)를 이해합니다.

단순히 "분석 도구"라는 키워드가 아니라,
"사용자가 쇼핑몰 운영 중이고, 데이터 분석이 필요하구나"까지 파악합니다.

2단계: 웹에서 정보 검색하기 (RAG)

여기가 핵심입니다.

ChatGPT는 두 가지 방법으로 정보를 얻습니다:

방법 1: 사전 학습 데이터 (Pre-trained Knowledge) → 2023년 이전 데이터 → 제한적이고 오래된 정보

방법 2: 실시간 웹 검색 (RAG - Retrieval-Augmented Generation) → Bing 검색 API 활용 → 최신 정보 수집

 

RAG가 무엇인가요?

단순화된 RAG 프로세스:

1단계. 웹 검색 - 사용자 질문으로 웹 검색 실행

2단계. 관련 문서 선택 - 검색 결과 중 상위 10개 정도 선택

3단계. 문서 내용 읽기 - 선택된 문서의 내용 추출\

4단계. 답변 생성 - 컨텍스트 + 질문으로 답변 작성

 

쉽게 말하면:

  1. 웹에서 관련 정보 검색
  2. Top 10 정도 문서 읽기
  3. 그 내용 바탕으로 답변 작성

여기서 중요한 질문:
"ChatGPT는 어떤 문서를 Top 10에 포함시킬까?"


ChatGPT가 선호하는 콘텐츠의 특징

제가 50개 이상의 쿼리로 실험한 결과, 패턴을 발견했습니다.

✅ ChatGPT가 좋아하는 콘텐츠

1. 구조화된 데이터 (Structured Data)

❌ 일반 텍스트: 가격: 29,000원

✅ Schema 마크업:

<div itemscope itemtype="https://schema.org/Product">
  <span itemprop="name">마케팅 자동화 도구</span>
  <span itemprop="price">29000</span>
  <span itemprop="priceCurrency">KRW</span>
</div>

 

ChatGPT는 기계가 읽기 쉬운 형태를 선호합니다.

 

2. FAQ 형식의 콘텐츠

❌ 일반 설명: "저희 도구는 다양한 기능을 제공합니다..."

✅ FAQ 형식: Q: 어떤 쇼핑몰 플랫폼을 지원하나요? A: 카페24, 메이크샵, 고도몰을 지원합니다.

Q: 무료 체험이 가능한가요? A: 14일 무료 체험을 제공합니다.

사용자가 물어볼 법한 질문 형태로 콘텐츠를 구성하면,
ChatGPT가 그대로 가져다 쓰기 쉽습니다.

 

3. 신뢰할 수 있는 출처

신뢰도 순위:

  1. 공식 문서 (docs.example.com)
  2. 회사 공식 블로그
  3. 권위 있는 미디어 (TechCrunch, Forbes)
  4. GitHub 저장소 (README.md)
  5. 커뮤니티 (Reddit, Stack Overflow)

단순히 콘텐츠가 좋다고 선택되는 게 아닙니다.
"이 출처를 믿을 수 있는가?"를 판단합니다.

 

4. 최신성 (Freshness)

같은 품질의 콘텐츠라면:

게시일: 2024년 10월 > 2023년 5월

특히 기술, 제품, 트렌드 관련 질문에서는 최신 콘텐츠가 우선됩니다.

 

5. 구체적인 사례와 숫자

❌ 추상적: "많은 고객들이 만족하고 있습니다"

✅ 구체적: "2,847개 기업이 사용 중이며, 평균 전환율이 15% 증가했습니다"

ChatGPT는 증거가 있는 주장을 선호합니다.


실전 프롬프트 실험 결과

같은 회사, 다른 페이지로 실험해봤습니다.

실험 A: 일반 소개 페이지

페이지 내용: 제목: 최고의 마케팅 자동화 도구 본문: 저희는 국내 1위 마케팅 자동화 솔루션입니다. 다양한 기능과 편리한 UI로 마케터들의 업무를 혁신합니다.

ChatGPT 프롬프트: "마케팅 자동화 도구 추천해줘"

결과: 언급 안 됨 (0/10)


실험 B: FAQ + Schema 페이지

페이지 내용: FAQ 형식 + Schema 마크업 적용

Q: 어떤 기능을 제공하나요? A: 이메일 자동화, SMS 발송, 고객 세그먼트, A/B 테스트, 실시간 대시보드 등 12가지 핵심 기능을 제공합니다.

ChatGPT 프롬프트: "마케팅 자동화 도구 추천해줘"

결과: 언급됨 (7/10)


무엇이 달랐을까?

요소실험 A실험 B

Schema 마크업
FAQ 형식
구체적 정보 추상적 구체적 (12가지 기능)
기계 가독성 낮음 높음

결론: 같은 회사라도 콘텐츠 구조에 따라 결과가 7배 차이


핵심 인사이트: ChatGPT는 "요약봇"이다

많은 사람들이 오해하는 부분입니다.

❌ 잘못된 이해: "ChatGPT가 알아서 좋은 제품을 찾아준다"

✅ 실제: "ChatGPT는 웹에서 찾은 정보를 요약해서 보여준다"

ChatGPT는 창조자가 아니라 큐레이터입니다.

만약 웹에 당신 제품에 대한 정보가:

  • 구조화되어 있지 않거나
  • FAQ 형식이 아니거나
  • 기계가 읽기 어렵다면

ChatGPT는 당신 제품을 추천할 수 없습니다.

왜냐하면, "이해하지 못했기" 때문입니다.


개발자가 할 수 있는 일

이제 원리를 이해했으니, 할 일이 명확해집니다:

GEO 최적화 체크리스트:

1. Schema 마크업 추가 → ChatGPT가 "읽기" 쉽게

2. FAQ 페이지 작성 → ChatGPT가 "인용"하기 쉽게

3. 공식 문서 발행 → ChatGPT가 "신뢰"하기 쉽게

4. 정기적 업데이트 → ChatGPT가 "최신"으로 인식하게

5. 구체적 데이터 포함 → ChatGPT가 "증거"로 활용하게

 

다음 편(EP03)에서는:
당신의 사이트가 현재 ChatGPT에 얼마나 노출되고 있는지
자가진단하는 구체적인 방법을 알려드리겠습니다.

실제로 프롬프트를 입력해보고,
경쟁사와 비교하는 실전 가이드입니다.


💡 Key Takeaways

  • ChatGPT는 웹 검색 + 요약을 통해 답변 생성 (RAG)
  • 구조화된 데이터 (Schema) 가 ChatGPT에게 잘 읽힘
  • FAQ 형식이 AI가 인용하기 가장 쉬운 구조
  • 신뢰도, 최신성, 구체성이 선택 기준
  • 같은 회사라도 콘텐츠 구조에 따라 7배 차이

🧪 직접 실험해보세요

당신의 경쟁사는 ChatGPT에게 어떻게 추천되나요?

ChatGPT에 가서 물어보세요:

"[당신의 카테고리] 도구/서비스 추천해줘"

10번 물어보고 엑셀로 기록해보세요:

  • 경쟁사 A: 언급 9/10
  • 경쟁사 B: 언급 5/10
  • 우리: 언급 0/10

이 데이터가 당신의 GEO 전략 출발점입니다.


💬 다음 편 예고

EP03. 내 사이트 AI 검색 노출도 자가진단

  • 10분 만에 끝내는 GEO 진단 체크리스트
  • 경쟁사 대비 우리의 위치 파악하기
  • 즉시 개선 가능한 5가지 포인트

댓글로 질문 남겨주세요!

  • 당신의 실험 결과가 궁금합니다
  • ChatGPT에 브랜드를 검색해보셨나요?
  • 언급률이 몇 %였나요?