“AI가 거짓말을 만든다” 실험 발표… “설계부터 잘못” 역풍

SEO 업계에서 “생성형 AI가 거짓 정보를 만든다”는 논란이 확산됐지만, 실제로는 AI의 오류가 아니라 실험 설계와 해석 방식의 문제라는 분석이 제기됐다. 가상 브랜드를 활용한 실험은 정답 기준이 부재한 상태에서 결과를 단정했으며, 이는 기존 검색 관점을 생성형 검색에 그대로 적용한 데서 비롯된 혼선으로 평가된다.

Ahrefs, 실체 없는 브랜드로 AI 오답 유도… 판단 근거 부재한 자의적 해석

SEO 업계에서는 생성형 AI가 허위 정보를 만든다는 논란이 제기됐다. 당시 업계는 이 문제를 AI 기술 자체의 결함으로 받아들였다. 그러나 논란의 배경과 실험 내용을 살펴보면, 문제의 원인은 AI가 아니라 이를 해석한 방식에 있었다는 분석이 나오고 있다.

  • 생성형 검색은 정보의 진위를 판별하지 않고, 질문에 가장 적합한 문장을 조합해 답변을 생성한다.
  • 공식 출처 여부보다 문장의 완결성과 설명 구조의 명확성이 더 중요한 기준으로 작동한다.
  • 정답 기준이 없는 환경에서는 AI의 답변을 오답으로 단정할 수 없다.
  • 기존 검색 기준을 그대로 적용하면 생성형 검색 결과를 오해할 소지가 높다.

Ahrefs 실험의 구조와 문제 제기

논란은 SEO 툴 기업 Ahrefs가 공개한 실험에서 시작됐다. Ahrefs는 ‘Xarumei’라는 가상의 브랜드를 설정하고, 공식 사이트와 외부 사이트에 서로 다른 설명을 게시했다. 이후 생성형 AI가 이 정보를 바탕으로 어떤 답변을 생성하는지를 관찰했다. Ahrefs는 이 결과를 근거로 생성형 AI가 잘못된 정보를 선택할 수 있다고 해석했다.

실험 해석에 대한 업계의 반론

하지만, 이 결론에 대해 업계에서는 다른 지적이 나왔다. Search Engine Journal 등은 실험 조건 자체에 문제가 있다고 분석했다. Xarumei는 실존하지 않는 브랜드였고, 외부에서 사실 여부를 확인할 수 있는 기준 정보가 없었다. 공식 페이지도 의도적으로 설명을 거의 넣지 않은 상태였다. 이런 환경에서는 AI의 답변을 정답이나 오답으로 판단할 기준 자체가 없다는 지적이다.

생성형 검색의 작동 방식과 오해

생성형 검색의 작동 방식도 이 지적을 뒷받침한다. 생성형 검색은 사실을 검증하거나 진위를 판별하는 시스템이 아니다. 질문을 해석한 뒤 관련 문장을 수집하고, 그중 질문에 가장 잘 맞는 설명을 조합해 답변을 만든다. AI 오버뷰와 같은 기능은 정보의 공식성보다 문장의 완결성과 설명력을 우선한다. 이번 실험에서 AI가 선택한 것도 특정 정보의 진위를 판단한 결과라기보다, 질문에 바로 답변할 수 있는 설명을 조합한 결과로 볼 수 있다.

기존 SEO 기준을 적용한 해석의 한계

Ahrefs의 해석에 논란이 생긴 이유는 기존 검색 환경의 기준을 그대로 적용됐기 때문이다. 생성형 AI가 사실 여부를 판단하며, 공식 사이트의 정보를 우선한다고 생각했다. 기존 SEO의 핵심 요소들이 생성형 검색에서도 동일하게 작동할 것이라는 전제도 깔려 있었다. 그러나 생성형 검색 환경에서는 공식 출처보다 설명 구조와 문맥의 명확성이 더 중요한 기준으로 작용한다.

국내 웹사이트 운영자에게 주는 시사점

이 때문에 이번 논란은 AI의 오류를 입증한 사례라기보다, 생성형 AI를 기존 검색 관점으로 해석하면서 생긴 혼선으로 마무리되고 있다. 실험의 목적은 AI의 오류를 확인하는 것이었지만, 오류 여부를 판단할 기준이 없는 상태에서 결과를 해석했다는 점이 문제다.

이번 사례는 국내 웹사이트 운영자에게도 직접적인 시사점을 준다.

  • 공식 페이지라 하더라도 설명이 부족하면 생성형 검색에서 인용되지 않을 수 있다.
  • 블로그 콘텐츠도 단순 경험담 나열에서 벗어나 개념과 배경 설명을 명확히 제시해야 한다.
  • 쇼핑몰 상품 페이지도 짧은 문구만으로는 생성형 검색에서 선택되기 어렵다.
  • 생성형 검색에서는 누가 공식 주체인가 보다, 누가 질문에 가장 명확하게 답했는지가 중요해진다.

Q1. 이번 논란에서 AI가 실제로 거짓말을 했는가?
→ 아니다. 정답 기준이 없는 환경에서 생성된 답변을 오답으로 해석한 것이다.

Q2. Ahrefs 실험의 핵심 문제는 무엇인가?
→ 실존하지 않는 브랜드를 사용해 사실 검증 기준 자체가 없었다는 점이다.

Q3. 생성형 검색은 사실 여부를 판단하는 시스템인가?
→ 아니다. 질문에 가장 적합한 설명을 조합하는 방식으로 작동한다.

Q4. 공식 사이트 정보는 생성형 검색에서 우선되지 않는가?
→ 공식성보다 설명의 완결성과 문맥 명확성이 더 중요하게 작용한다.

생성형 검색 시대의 핵심 과제

결국 이번 논란이 보여준 점은 분명하다. 생성형 검색 시대의 핵심은 AI의 오류를 지적하는 데 있지 않다. AI가 어떤 기준으로 문장을 선택하고 답변을 구성하는지를 이해하는 것이 더 중요하다. SEO 환경은 이미 변화했고, 그 변화에 맞춰 콘텐츠와 페이지 구조를 다시 점검하는 것이 운영자의 과제가 되고 있다.

FAQ

Q1. 생성형 AI는 정보를 검증하지 않나요?

→ 생성형 AI는 사실 검증 시스템이 아니라 문맥 기반 답변 생성 시스템이다.

Q2. 공식 홈페이지 정보가 항상 우선되나요?

→ 아니다. 설명이 부족하면 공식 페이지라도 인용되지 않을 수 있다.

Q3. 생성형 검색에 맞는 콘텐츠는 어떻게 달라야 하나요?

→ 질문에 바로 답할 수 있는 구조와 명확한 설명이 중요하다.

Q4. 이번 Ahrefs 논란의 핵심은 무엇인가요?

→ AI 오류가 아니라 오답을 판단할 기준이 없었다는 점이다.

ⓒ SEO NEWS. 무단 전재 및 재배포 금지.

김종일 에디터
김종일 에디터

국내 유력 미디어 및 뉴미디어 플랫폼 창간을 주도한 디지털 콘텐츠 전문가.

한국일보 뉴미디어부 및 인터넷 한국일보 뉴스부에서 기사 작성 및 뉴스 편집 경력을 시작으로, 스포츠한국과 한스경제 창간 TF의 웹사이트 총괄 기획을 담당했습니다. 독립 미디어 이슈인코리아 창간 및 편집국 운영을 통해 디지털 콘텐츠 생태계 전반에 대한 깊은 이해를 갖추고 있습니다. 웹사이트 운영부터 코와몰 쇼핑몰 총괄 기획까지 아우르는 경력을 통해, SEO NEWS의 분석과 가이드를 실질적인 비즈니스 성과와 연결하는 통찰력을 제시합니다.

기사 : 69

댓글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다