구글 모델 서치는 기존 NAS(네트워크 아키텍처 탐색)의 단점을 보안하고, 효율적이고 자동으로 최적의 모델을 개발할 수 있도록 오픈소스로 제공되는 플랫폼입니다. 이러한 구글 모델 서치를 코랩에서 바로 구동해볼 수 있도록 테스트한 결과를 공유합니다. 깃헙 설치부터 패키지 설치, 환경 설정, 예제 소스 코드 설명 그리고 출력값을 확인해보도록 하겠습니다.

  • 블로그 주소: https://ai.googleblog.com/2021/02/introducing-model-search-open-source.html
  • 깃헙 주소: https://github.com/google/model_search

먼저 깃헙에서 소스코드 다운로드 받습니다.

!git clone https://github.com/google/model_search.git
미리 정의한 구글 프로토콜 버퍼 파일(데이터를 저장하는 하나의 방식)을 파이썬 코드로 변환합니다.

!protoc --python_out=./ model_search/proto/hparam.proto
!protoc --python_out=./ model_search/proto/phoenix_spec.proto
!protoc --python_out=./ model_search/proto/distillation_spec.proto
!protoc --python_out=./ model_search/proto/ensembling_spec.proto
!protoc --python_out=./ model_search/proto/transfer_learning_spec.proto

코랩 실행 시에 명령 인자 해석 오류가 일어나지 않도록 명령 인자 처리를 수행합니다.

import sys
from absl import app

sys.argv = sys.argv[:1]

  app.run(lambda argv: None)


블로그에 나와있는 간단한 예제를 시작하겠습니다. 주요 인자 위주로 살펴보면,

  • number_models=200
    • 200개 모델 검색을 시도합니다.
  • root_dir=”/tmp/run_example”
    • 검색한 모델 평가 결과를 담고 있는 디렉토리를 지정합니다. 텐서보드에서 열 수 있으며, 평가메트릭과 함께 보실 수 있습니다.
  • logits_dimension=2
    • 이진 분류 모델을 탐색합니다.
  • filename=”model_search/data/testdata/csv_random_data.csv”
    • 데이터셋 파일 경로를 지정합니다.
  • spec=”model_search/configs/dnn_config.pbtxt”
    • 모델 탐색을 위한 스펙이 정의된 파일을 지정합니다.
import model_search
from model_search import constants
from model_search import single_trainer
from model_search.data import csv_data

trainer = single_trainer.SingleTrainer(
        record_defaults=[0, 0, 0, 0],

구글 모델 서치를 코랩에서 구동하기 위한 환경설정 및 소스코드 예제를 살펴보았습니다. 다음에는 모델 서치 결과 확인 및 활용 방안에 대해서 알아보겠습니다.