다양한 유형의 RNN

  • 지금까지는 TxT_xTyT_y 가 같은 RNN 만 학습했다.
  • TxT_x 는 0일 수도 있고, TyT_y 와 서로 다를 수도 있어야 한다.
    • activity recognition
      • TxT_x: 동영상 프레임 수
      • TyT_y: 단어 수

http://karpathy.github.io/2015/05/21/rnn-effectiveness/

  • 지금까지 배운 RNN architecture 는 입출력 시퀀스의 길이가 같은 “many to many” 구조다.
  • 한 문장의 영화 평론을 보고 1~5점의 점수를 매기는 모델을 구현한다면 문장의 길이가 TxT_x 가 되고 출력할 점수는 하나면 되기 때문에 Ty=1T_y=1 이 된다.
    • 이 경우는 “many to one” 이라고 한다.