본문 바로가기
마케팅

이미지를 AI로 만들어주는 달리2 DALL-E 2에 대해서 알아보자. CHAT GPT와 함께 주목해야 하는 AI 기술 [OPEN AI] 텍스를 입력하면 그림을 그려주는 그림 인공지능 어떤 기대를 할 수 있을까?

by Clover Marketer 2023. 2. 7.

DALL-E 2 [ OPEN AI ]

최근에 CHAT GPT에 대한 많은 기대를 하며 최근 많은 사람들에게 알려지고 기대감을 가지게 해주는 AI입니다. 이 CHAT GPT를 만든 회사가 바로 OPEN AI이라는 회사인데 이곳에서 만든 다른 ai가 있습니다. CHAT GPT는 CHATING의 형태로 질문을 하거나 작성을 해달라고 적게되면 정보를 알려주거나 텍스트를 작성해주는 ai입니다.

 

 

 

 

같은 회사 open ai에서 개발한 달리2 DALL-E2는 텍스트를 작성하게 되면 이미지로 바꿔주는 ai 으로 원하는 이미지를 글로 작성하게 되면 이런 주제를 이용해서 이미지로 바꿔 준다고 하니까. 너무 신기하고 대단한 것 같습니다. 그렇다면 DALL-E2, 달리2에 대해서 자세히 알아보도록 하겠습니다.

 

OPEN AI DALL-E2

dall e2을 검색해서 홈페이지에 들어가게 되면 OPEN AI의 회사가 적혀 있어요. 우측 상단에 있는 Login을 해주시면 됩니다. chat gpt와 같이 구글이나 마이크로소프트의 회원정보를 이용해서 로그인이 가능한 부분이 특히 편했는데요.

 

 

 

 

로그인을 하고 나면 검색을 할 수 있는 검색창이 하나 나오게 됩니다. 한글로 검색할 수 있는 부분은 다소 미약한 부분이 있는거 같아. 아주 간단한 영어로 저는 검색을 했어요.

 

clean sky, dog. 깨끗한 하늘과 강아지라는 글을 작성했고. 이 부분에 대해서 해당하는 사진 4개를 보여줬습니다. 조금 더 자세하고 길게 작성을 해줄 수록 더욱 세부화되고 원하는 이미지를 얻을 수 있겠죠?

아직 베타버전이기 때문에 매달 토큰을 적립해주고 한달에 20번 정도의 검색을 할 수 있다고 하니까. 재미있다고 무분별하게 사용하면 나중에 필요할 때 사용을 하지 못하니까. 꼭 아껴두셨다가 필요할때 사용하시길 바랍니다.

 

마지막 사진이 마음에 들어서 저는 저장을 했는데요. 마치 합성을 한 것 같은 이미지지만 제가 말한 이미지를 바로 ai의 기술력을 이용해서 나타내준 것은 아주 재미있는거 같습니다.

 

DALL E2 달리2의 기본적인 정보

DALL E2는 언어를 이용한 기술을 이용하여 사실적인 영상과 예술을 만들 수 있는 새로운 AI 시스템이에요.  DALL E2는, 오리지널하고 리얼한 이미지와 아트를, 델의 모바일 테크놀로지로부터 작성할 수 있습니다. 텍스트 설명개념, 속성 및 스타일을 결합할 수 있어요.

 

 

 

 

DALL E2는 원래의 캔버스보다 화상을 확대해, 새로운 구성을 폭 넓게 작성할 수 있어요.

출처 : DALL-E2 홈페이지 이미지

 

DALL-E2 달리2는 자연스럽게 기존의 이미지를 리얼하게 편집하고 제작할 수 있어요. 그림자, 반사 및 텍스처를 고려하면서 요소를 추가하거나 제거할 수 있어요.

출처 : DALL-E2 홈페이지 이미지

 

 

 

 

DALL-E2는 이미지를 촬영하여 다른 이미지를 생성할 수 있는데, 원작에서 영감을 얻는 것의 변화된 형태이에요.

출처 : DALL-E2 홈페이지 이미지

DALL-E2는 이미지를 ai가 직접 관계를 학습하고 텍스트를 이미지로 변화하는 기술이 있습니다. 이런 과정을 이용하여 랜덤한 점의 패턴을 시작해서 이미지의 특정 측면을 인식하고 그 패턴을 점차적으로 이미지 쪽으로 변화시키는 것입니다.

OPEN AI에서는 2021년 1월에 달리1 DALL-E를 도입을 했는데요. 1년이 지난 지금 델의 최신 시스템 DALL E2는 옛날에 비해 4배 가량 높은 해상도를 자랑하며 사실적이고 더욱 정확한 이미지를 보여주고 있어요, 과거 DALL E1과 비교하면 현재 DALL E2는 캡션 매칭과 포토리얼리즘을 가지고 있다고 하니까 우리는 달리2를 사용하는게 더욱 좋겠죠?

달리2 DALL E2는 연구 프로젝트로 시작이 되었다고 하는데, 베타판으로 발매되고 있어요. 다음에는 CHAT GPT처럼 유료버전이 나오지 않을까 싶기도 합니다.  또한 달리2는 안전 대책에 대해서 고민을 하고 있는데 그 부분은 아래에서 정리를 해볼까 싶어요. 

 

유해 생성 방지

DALL E2의 폭력성, 증오성, 성인 이미지는 생성 기능을 제한했다고 해요. 교육 데이터에서 가장 명확한 내용을 제거하여 DALL E2가 유해성이 있는 자료는 최대한 노출되는 것을 줄였다고 해요, 또한 개인정보로 볼 수 있는 개인의 얼굴의 이미지 역시 공유가 되는 것을 막기 위해서 새로운 높은 기술을 사용해서 유해성을 방지하기 위해 노력을 하고 있습니다.

오용 억제

델의 콘텐츠정책에서는 사용자가 폭력, 성인 또는 정치적 콘텐츠를 생성 할 수 없어요. 필터가 정책을 위반할 수 있는 텍스트 프롬프트 및 이미지 업로드를 식별하는 경우 이미지를 생성하지 않고, 오용이 가능한 이미지에 대해서는 보호를 해서 자동화 감시 시스템을 갖추고 있다고 합니다.

학생에 근거한 단계적 도입

실제 사용하면서 배워지는 것은 책임감 있게 AI를 개발하고 배치하는데 있어 중요한 부분이에요. 배타 서비스를 통해서 DALL E2를 사용하게 한 뒤 기술의 역량과 한계를 더 잘 알고 안전시스템에 대한 자신감이 높아짐에 따라, 2022년 7월 DALL E를 베타 버전으로 출시하여 현재 사용이 가능하도록 하고 있습니다.

 

 

 

728x90
그리드형

댓글