ChatGPT+DALL·E로 이미지 편집

Apr 3, 2024 • Taeyoung Kim

드디어 ChatGPT 서비스에서 DALL·E의 이미지 편집 기능이 가능해졌습니다.

DALL·E API

DALL·E 2 API에서는 텍스트 to 이미지와 이미지 to 이미지 그리고 이미지 편집 기능을 제공하고 있었는데요. DALL·E 3는 텍스트 to 이미지를 제외한 API를 제공하고 있지 않아서 API 릴리즈 되기를 많이 기다렸습니다.

출처 : https://platform.openai.com/docs/guides/images/usage?context=node

DALL·E API와 ChatGPT의 결합

이제 DALL·E API에서 제공하는 이미지 편집 기능이 ChatGPT에 드디어 탑재되었습니다. 이번에 ChatGPT가 업데이트되면서 생성된 이미지에 대해서 마스크를 지정하고 프롬프트로 해당 마스크에 대해서 이미지를 수정할 수 있게 되었습니다.

새로운 이미지 편집 기능의 사용법

이 기능을 이용하면, 생성된 이미지를 클릭 한 후 편집 아이콘을 클릭하면, 수정하고자 하는 영역을 선택할 수 있습니다. 그 다음 선택된 영역에 대해 변경하고 싶은 내용을 프롬프트로 입력하면, 반영하여 새로운 이미지가 만들어집니다.

이러한 과정은 다음과 같은 단계로 이루어집니다:

ChatGPT 서비스에 연동된 DALL·E를 통해 원하는 이미지를 생성합니다.
생성된 이미지를 클릭한 후, 우측 상단의 편집 아이콘을 클릭합니다.

편집하고자 하는 영역을 선택합니다.

선택된 영역에 대해 변경하고 싶은 내용을 프롬프트로 입력합니다.

이를 ChatGPT에 전달하면, DALL·E API가 입력을 받아 새로운 이미지를 생성합니다.

이제 사용자는 단순히 이미지를 생성하는 것 뿐만 아니라, 그 이미지를 자신의 의도에 맞게 편집하는 것도 가능해졌습니다.다만 이미지 생성 품질로 본다면 이미지 편집 모델은 DALL·E 3가 아니라 DALL·E 2인 것 같다는 예상은 조심스레 해봅니다.

마무리

ChatGPT와 DALL·E의 결합은 단순히 텍스트에서 이미지를 생성하는 것을 넘어서, 사용자가 원하는 대로 이미지를 수정하고 개선할 수 있는 기능까지 제공하게 되었습니다. 앞으로 더 어떤 기능이 제공될 지 기대됩니다.

함께보기

BIC(Beyond Imagination Creations) Gallery 페이스북 그룹

책 소개

교보문고 YES24 반디앤루이스 알라딘 인터파크

[추천사]

하용호님, 카카오 데이터사이언티스트 - 뜬구름같은 딥러닝 이론을 블록이라는 손에 잡히는 실체로 만져가며 알 수 있게 하고, 구현의 어려움은 케라스라는 시를 읽듯이 읽어내려 갈 수 있는 라이브러리로 풀어준다.
이부일님, (주)인사아트마이닝 대표 - 여행에서도 좋은 가이드가 있으면 여행지에 대한 깊은 이해로 여행이 풍성해지듯이 이 책은 딥러닝이라는 분야를 여행할 사람들에 가장 훌륭한 가이드가 되리라고 자부할 수 있다. 이 책을 통하여 딥러닝에 대해 보지 못했던 것들이 보이고, 듣지 못했던 것들이 들리고, 말하지 못했던 것들이 말해지는 경험을 하게 될 것이다.
이활석님, 네이버 클로바팀 - 레고 블럭에 비유하여 누구나 이해할 수 있게 쉽게 설명해 놓은 이 책은 딥러닝의 입문 도서로서 제 역할을 다 하리라 믿습니다.
김진중님, 야놀자 Head of STL - 복잡했던 머릿속이 맑고 깨끗해지는 효과가 있습니다.
이태영님, 신한은행 디지털 전략부 AI LAB - 기존의 텐서플로우를 활용했던 분들에게 바라볼 수 있는 관점의 전환점을 줄 수 있는 Mild Stone과 같은 책이다.
전태균님, 쎄트렉아이 - 케라스의 특징인 단순함, 확장성, 재사용성을 눈으로 쉽게 보여주기 위해 친절하게 정리된 내용이라 생각합니다.
유재준님, 카이스트 - 바로 적용해보고 싶지만 어디부터 시작할지 모를 때 최선의 선택입니다.