ChatGPT+DALL·E로 이미지 편집
드디어 ChatGPT 서비스에서 DALL·E의 이미지 편집 기능이 가능해졌습니다.
DALL·E API
DALL·E 2 API에서는 텍스트 to 이미지와 이미지 to 이미지 그리고 이미지 편집 기능을 제공하고 있었는데요. DALL·E 3는 텍스트 to 이미지를 제외한 API를 제공하고 있지 않아서 API 릴리즈 되기를 많이 기다렸습니다.
- 출처 : https://platform.openai.com/docs/guides/images/usage?context=node
DALL·E API와 ChatGPT의 결합
이제 DALL·E API에서 제공하는 이미지 편집 기능이 ChatGPT에 드디어 탑재되었습니다. 이번에 ChatGPT가 업데이트되면서 생성된 이미지에 대해서 마스크를 지정하고 프롬프트로 해당 마스크에 대해서 이미지를 수정할 수 있게 되었습니다.
새로운 이미지 편집 기능의 사용법
이 기능을 이용하면, 생성된 이미지를 클릭 한 후 편집 아이콘을 클릭하면, 수정하고자 하는 영역을 선택할 수 있습니다. 그 다음 선택된 영역에 대해 변경하고 싶은 내용을 프롬프트로 입력하면, 반영하여 새로운 이미지가 만들어집니다.
이러한 과정은 다음과 같은 단계로 이루어집니다:
- ChatGPT 서비스에 연동된 DALL·E를 통해 원하는 이미지를 생성합니다.
- 생성된 이미지를 클릭한 후, 우측 상단의 편집 아이콘을 클릭합니다.
- 편집하고자 하는 영역을 선택합니다.
- 선택된 영역에 대해 변경하고 싶은 내용을 프롬프트로 입력합니다.
- 이를 ChatGPT에 전달하면, DALL·E API가 입력을 받아 새로운 이미지를 생성합니다.
이제 사용자는 단순히 이미지를 생성하는 것 뿐만 아니라, 그 이미지를 자신의 의도에 맞게 편집하는 것도 가능해졌습니다.다만 이미지 생성 품질로 본다면 이미지 편집 모델은 DALL·E 3가 아니라 DALL·E 2인 것 같다는 예상은 조심스레 해봅니다.
마무리
ChatGPT와 DALL·E의 결합은 단순히 텍스트에서 이미지를 생성하는 것을 넘어서, 사용자가 원하는 대로 이미지를 수정하고 개선할 수 있는 기능까지 제공하게 되었습니다. 앞으로 더 어떤 기능이 제공될 지 기대됩니다.
함께보기
책 소개
[추천사]
- 하용호님, 카카오 데이터사이언티스트 - 뜬구름같은 딥러닝 이론을 블록이라는 손에 잡히는 실체로 만져가며 알 수 있게 하고, 구현의 어려움은 케라스라는 시를 읽듯이 읽어내려 갈 수 있는 라이브러리로 풀어준다.
- 이부일님, (주)인사아트마이닝 대표 - 여행에서도 좋은 가이드가 있으면 여행지에 대한 깊은 이해로 여행이 풍성해지듯이 이 책은 딥러닝이라는 분야를 여행할 사람들에 가장 훌륭한 가이드가 되리라고 자부할 수 있다. 이 책을 통하여 딥러닝에 대해 보지 못했던 것들이 보이고, 듣지 못했던 것들이 들리고, 말하지 못했던 것들이 말해지는 경험을 하게 될 것이다.
- 이활석님, 네이버 클로바팀 - 레고 블럭에 비유하여 누구나 이해할 수 있게 쉽게 설명해 놓은 이 책은 딥러닝의 입문 도서로서 제 역할을 다 하리라 믿습니다.
- 김진중님, 야놀자 Head of STL - 복잡했던 머릿속이 맑고 깨끗해지는 효과가 있습니다.
- 이태영님, 신한은행 디지털 전략부 AI LAB - 기존의 텐서플로우를 활용했던 분들에게 바라볼 수 있는 관점의 전환점을 줄 수 있는 Mild Stone과 같은 책이다.
- 전태균님, 쎄트렉아이 - 케라스의 특징인 단순함, 확장성, 재사용성을 눈으로 쉽게 보여주기 위해 친절하게 정리된 내용이라 생각합니다.
- 유재준님, 카이스트 - 바로 적용해보고 싶지만 어디부터 시작할지 모를 때 최선의 선택입니다.