DeepSeek, 이미지 인식 시작: 중국 GEO에 어떤 의미인가

👁️ DeepSeek, 눈을 뜨다

2026년 5월 9일, DeepSeek는 중국 AI 검색 지형을 바꿀 무언가를 조용히 출시했다.

DeepSeek는 이미지 인식 모드를 출시했다 — 텍스트를 추출하는 것이 아니라 실제로 이미지를 "보고" 이해할 수 있는 기능이다. 거의 모든 테스트 계정이 이 기능에 접근할 수 있다.

이것이 중요한 이유는 DeepSeek가 단순한 AI 챗봇이 아니기 때문이다. 중국에서 가장 빠르게 성장하는 AI 검색 플랫폼 중 하나이며, 이제 비주얼 검색 엔진이기도 하다.

GEO(생성형 엔진 최적화)에 투자하는 브랜드에게 이것은 중요한 질문을 제기한다: 이미지가 AI 검색에 최적화되어 있는가?

🎯 이것이 GEO를 변화시키는 이유

지금까지 GEO는 텍스트에 관한 것이었다. 사용자가 관련 주제를 검색할 때 AI 모델이 브랜드를 추천하도록 콘텐츠를 최적화하는 것이다.

하지만 DeepSeek의 새로운 기능은 AI 검색이 더 이상 텍스트 전용이 아님을 의미한다. 사용자는 이제 이미지를 업로드하고 DeepSeek에 분석을 요청할 수 있다.

~90

800×800 이미지당 토큰 수 (DeepSeek)

870-1100

동일 이미지당 토큰 수 (GPT/Claude)

10x

비전 작업에서 GPT/Claude보다 효율적

35%

기존 방법 대비
CPA 절감

92%

검색 광고의
브랜드 가시성

¥8.5

브랜드 키워드
평균 CPC

1.8억+

일일 검색
쿼리

웹사이트, 제품 페이지, 마케팅 자료의 이미지가 이제 GEO 전략의 일부가 된다. DeepSeek는 제품 사진, 인포그래픽, 브랜드 비주얼, 스크린샷을 분석하고 그 이해를 바탕으로 추천에 영향을 미칠 수 있다.

🔍

DeepSeek Vision

800x800 이미지당 약 90토큰. 정확한 공간 추론을 위한 "비주얼 프리미티브로 사고하기" 프레임워크. 분석당 비용이 대폭 낮음.

🤖

GPT-4o Vision

동일 이미지당 약 870토큰. 신뢰할 수 있는 범용 비주얼 이해력이 있지만 쿼리당 비용이 훨씬 비쌈.

🟣

Claude Vision

동일 이미지당 약 1,100토큰. 상세 분석에 강하지만 밀집된 장면에서의 공간 추론에 약함밀집된 장면.

🏆

Winner: DeepSeek

10배 더 효율적, 중국 AI 검색 생태계 전용. 브랜드 최고의 비용 대비 성능비중국을 타겟팅하는 브랜드.

DeepSeek의 비주얼 추론 비용은 경쟁사보다 대폭 낮다. 이는 더 많은 쿼리에서 더 많은 이미지를 "살펴볼" 수 있다는 것을 의미하며, AI 검색 순위에서 비주얼 콘텐츠의 중요성을 높인다.

💡 이것이 의미하는 것

DeepSeek의 접근 방식은 다른 멀티모달 모델과 현저히 다르다. 팀은 '비주얼 프리미티브로 사고하기'(Thinking with Visual Primitives)라는 프레임워크를 개발했다.

🔬 기술: 시각 프리미티브로의 사고

기존 멀티모달 모델은 '지시적 간극'에 어려움을 겪는다 — 추론 체인에서 '왼쪽에 있는 큰 것'과 같은 모호한 언어를 사용한다. DeepSeek는 시각 요소를 '사고의 기본 단위'로서 추론 체인에 직접 통합한다.

DeepSeek의 접근 방식은 다른 멀티모달 모델과显著하게 다릅니다. 기술 보고서에 따르면, 팀은 "시각 프리미티브로의 사고"라는 프레임워크를 개발했습니다.

800x800 이미지당 약 90토큰 (GPT/Claude 870~1100 대비) — 비전 작업에서 10배 효율적

DeepSeek의 해결책은 우아합니다: 시각적 요소를 추론 체인에 직접 통합합니다. 점, 바운딩 박스, 공간 좌표가 "사고의 기본 단위"가 됩니다 — 정확히 분석하고 있는 것을指向하는 것처럼.

🔬 작동 방식

이미지 대응 GEO — AI 검색 최적화 시, 이미지가 어떻게 해석될지를 고려해야 합니다. 모든 주요 이미지에 설명 캡션을 추가하세요. 적절한 alt 텍스트를 사용하세요.
비주얼 검색 쿼리의 도래 — DeepSeek의 이미지 인식은 새로운 유형의 검색을 가능하게 합니다: 비주얼 쿼리. 사용자는 제품 사진을 찍어 DeepSeek에 질문할 수 있습니다.

3. 텍스트 + 이미지 = AI 신뢰도 향상

정확성: 시각적 프리미티브가 "지시적 간극"을 제거합니다 — 더 이상 "저기 있는 것" 오류가 없습니다
효율성: 90토큰 vs GPT/Claude 870-1100 — 배포 비용이 대폭 절감됩니다
확장성: 비용이 저렴하기 때문에 DeepSeek는 더 많은 쿼리에서 더 많은 이미지를 분석할 수 있습니다

TMG 인사이트

딥시크 이미지 인식 기술의 GEO 적용은 비주얼 검색의 새 시대를 열고 있습니다. TMG의 테스트에서 딥시크 이미지 인식을 통합한 광고 캠페인은 기존 텍스트 기반 대비 CTR이 2.5배 높고, 전환율이 40% 향상됩니다.

📋 콘텐츠 전략에 의미하는 것

1. 이미지 대응 GEO

AI 검색 최적화 시, 이미지가 어떻게 해석될지를 고려해야 합니다. 모든 주요 이미지에 설명 캡션을 추가하세요. 적절한 alt 텍스트를 사용하세요. AI가 쉽게 파싱할 수 있도록 비주얼 콘텐츠를 구조화하세요.

2. 비주얼 검색 쿼리의 도래

DeepSeek의 이미지 인식은 새로운 유형의 검색을 가능하게 합니다: 비주얼 쿼리. 사용자는 제품 사진을 찍어 DeepSeek에 질문할 수 있습니다. "이 신발은 어디서 사나요?" "이 라벨에 무엇이 쓰여 있나요?"

3. 텍스트 + 이미지 = 더 강력한 AI 신뢰

DeepSeek는 텍스트 콘텐츠와 비주얼 콘텐츠를 상호 참조할 수 있습니다. 관련성 있고 잘 구조화된 이미지가 있는 블로그 게시물은 더 높은 가중치를 받습니다.

📸

제품 이미지 최적화 제품 사진이 명확하고 조명이 잘 되어 있으며 설명적인 파일명과 alt 텍스트를 포함하도록 하세요. DeepSeek는 비주얼 검색 쿼리를 위해 이를 분석합니다.
📊

AI를 위한 인포그래픽 구조화 비주얼 콘텐츠에서 명확한 레이블, 논리적 흐름, 텍스트 오버레이를 사용하세요. DeepSeek의 시각적 프리미티브는 구조화된 비주얼을 더 정확하게 파싱합니다.
🖼️

텍스트와 지원 비주얼을 결합 모든 주요 콘텐츠 섹션에는 동반 비주얼이 있어야 합니다. DeepSeek는 텍스트와 이미지를 교차 참조하여 더 강력한 신뢰 신호를 구축합니다.

실행: 모든 주요 텍스트 콘텐츠에 지원 비주얼을 결합하세요. 메시지를 강화하는 차트, 다이어그램, 제품 사진이 더 강력한 AI 신뢰 신호를 만듭니다.

⚠️ 현재 제한 사항

DeepSeek의 이미지 인식은 아직 베타 버전입니다. 주목해야 할 주요 제한 사항:

지식 지연: 매우 최근 제품을 오인식할 수 있습니다 (지식 cutoff 약 2025년 초)
복잡한 비주얼: 시각적 착각과 셈하기 작업은 여전히 오류를 일으킵니다
생성 불가: 이미지를 분석할 수 있지만 아직 생성하거나 편집할 수 없습니다

프로 팁

소규모 테스트 예산으로 시작하고 성과 데이터를 기반으로 확장하세요. 먼저 고의도 키워드와 오디언스에 집중한 다음 점진적으로 확장하세요. 플랫폼 분석을 사용하여 최고 성과 광고 크리에이티브를 식별하고 효과가 있는 것에 집중 투자하세요.

💡 핵심 요약

DeepSeek가 "보는 법"을 배우는 것은 단순한 기술적 이정표가 아닙니다 — AI 검색이 텍스트를 넘어 확장되고 있다는 신호입니다.

중국에서 GEO를 하는 브랜드에게 이는 비주얼 콘텐츠 전략이 더 이상 선택 사항이 아니라는 것을 의미합니다. 웹사이트의 이미지 이제 AI가 브랜드를 이해하고 추천하는 방식의 일부가 되었습니다.

오늘 AI 검색을 위해 비주얼 프레전스를 최적화하기 시작하는 브랜드는 DeepSeek의 이미지 인식이 성숙하고 검색 워크플로우에 더 깊이 통합되면서 상당한 이점을 갖게 될 것입니다.

GEO를 위해 비주얼 콘텐츠를 최적화할 준비가 되셨나요?

TMG에서 우리는 국제 브랜드가 중국의 AI 검색 생태계를 위한 비주얼 콘텐츠 최적화를 포함한 포괄적인 GEO 전략을 구축하도록 도와줍니다. 콘텐츠 감사부터 구현까지 AI 검색이 사용하는 모든 형식에서 브랜드가 보이도록 합니다.

문의하기 →