어느 AI가 썸네일을 제일 잘 그릴까?: 무료 AI 화상 생성 서비스 스타일 비교

서론
블로그 기사에 있어서 본문만큼 중요한 요소가 있습니다. 바로 썸네일입니다.
좋은 기사는 독자를 늘리지만 좋은 썸네일은 방문자를 늘리기 때문이죠. 그리고 때로는 그게 훨씬 중요합니다.
다행히도 생성형 AI의 등장으로 썸네일 작성 과정은 과거에 비해서 상당히 편해졌습니다. 이제는 기사를 작성하고 AI에게 '이 기사에 맞는 썸네일을 그려줘'라고 말만 해도 뚝딱하고 이미지를 만들어 주니까요.
이 홈페이지에서는 기본적으로 ChatGPT의 DALL-E 3를 쓰고 있었는데요. 얼마 전에 우연히 다른 AI의 생성 이미지를 보고 알게 된 것이 있습니다. 생성 AI의 화풍이 상당히 다를 뿐만 아니라 의뢰 내용을 얼마나 잘 수행하는지도요.
이참에 각 AI가 만든 이미지를 비교하고 가장 적합한 이미지 생성 AI로 바꾸는 것을 고려하는 김에 이 기사를 쓰기로 결정했습니다.
아마 화상 생성 AI를 적극적으로 사용하시는 분이시더라도 모든 AI의 화풍을 비교해 보신 분은 없으리라 생각합니다. 이번 글에서는 대표적인 생성형 AI 도구들을 활용하여 생성된 화상의 스타일과 용도를 비교 분석하고, 각 AI의 장점과 단점을 '썸네일'이라는 용도에 적합한지 정리 해보도록 하겠습니다.
검증 방법
위에서 적은 '서론' 부분을 각 AI에게 전달하고 프롬프트는 아래와 같이 사용하겠습니다.
- 위의 블로그 기사에 어울리는 썸네일을 만들어줘
- 위의 블로그 기사에 어울리는 썸네일을 일러스트 스타일로 만들어줘
그리고 위의 결과에 대해서 썸네일 작성 시 필요한 요소인 '사이즈 변경'에 어느 정도로 잘 대응하는지도 한번 알아보도록 하지요.
각 AI 디자이너 선생님들은 어떤 결과를 내놓았을까요?
1.ChatGpt (DALL-E 3)


2.Claude


3.Gemini (Imagen 3)


4.Copilot


5.Grok3


결론
어떤 AI가 가장 마음에 드시나요? 결과물만 놓고 본다면, 저는 개인적으로 Gemini의 화풍이 좋은 것 같습니다. 하지만 한 가지 단점이 있는데요. Gemini는 출력물의 가로세로 비율을 정할 수 없습니다.
이 분야의 최강자는 ChatGPT인데요. 스타일을 유지하면서 가로 비율을 늘려준다든지, 구성을 유지하면서 스타일만 변경한다든지 하는 후속 요청에 대한 대응 능력이 뛰어납니다.
한편, ChatGPT와 Copilot의 결과물은 잘 그리기는 하지만, 뭔가 필요 이상으로 디테일이 들어간 느낌이라 개인적으로는 그다지 좋아하는 스타일이 아니었습니다.
Claude는 상당히 특이한 방식인데요. 다른 AI들이 이미지를 생성하는 것과 다르게, Claude에서는 SVG 형식으로 벡터 이미지와 비슷한 방식으로 일러스트를 생성합니다. 그렇기 때문에 아무래도 너무 딱딱하고 프레젠테이션 같은 분위기가 있습니다만, 썸네일이 아닌 용도라면 선호하는 분이 있을지도 모르겠습니다.
Grok3에 관해서는, 사진과 다름없는 결과물이 나오기 때문에 썸네일에는 적합하지 않아 보이지만, 실제로 찍힌 사진과 비교해도 손색없는 결과를 보여줍니다. 하나 더 특이한 점은, Grok3은 한 번에 한 장의 화상만 생성해주는 것이 아니라 동시에 다른 스타일의 사진 3~4장을 작성해준다는 점입니다. 이 점은 확실히 편리하네요.
개인적으로 생각하는 최강의 조합은, Grok3처럼 여러 장을 동시에 생성해주되, Gemini의 화풍으로 그림을 그려주고, ChatGPT만큼 후편집이 자유로운 툴이 있다면 참 좋을 것 같습니다.