[NATURAL LANGUAGE PROCESSING IN TENSORFLOW] Sequence models

코세라의 deeplearning.AI tensorflow developer 전문가 자격증 과정내에 Natural Language Processing in TensorFlow

과정의 3주차 sequence models 챕터의 코드 예제입니다.

1) imdb reviews 데이터 로드

2) training과 testing data 분리

3) 미리 token화된 subword 데이터를 로드해서 token으로 사용

4) LSTM 모델 구성 -> multi bidirectional LSTM

5) vecs.tsv 와meta.tsv를 만들어서 단어 비쥬얼라이즈tool에서 로드해서 각 단어의 의미별 vector 군집도를 확인하는데 사용할수도있다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55

"""# Multiple Layer LSTM"""
 
from __future__ import absolute_import, division, print_function, unicode_literals
 
 
import tensorflow_datasets as tfds
import tensorflow as tf
print(tf.__version__)
 
import tensorflow_datasets as tfds
import tensorflow as tf
print(tf.__version__)
 
# Get the data
dataset, info = tfds.load('imdb_reviews/subwords8k', with_info=True, as_supervised=True)
train_dataset, test_dataset = dataset['train'], dataset['test']
 
tokenizer = info.features['text'].encoder
 
BUFFER_SIZE = 10000
BATCH_SIZE = 64
 
train_dataset = train_dataset.shuffle(BUFFER_SIZE)
train_dataset = train_dataset.padded_batch(BATCH_SIZE, train_dataset.output_shapes)
test_dataset = test_dataset.padded_batch(BATCH_SIZE, test_dataset.output_shapes)
 
model = tf.keras.Sequential([
    tf.keras.layers.Embedding(tokenizer.vocab_size, 64),
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(64, return_sequences=True)),
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(32)),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid')
])
 
model.summary()
 
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
 
NUM_EPOCHS = 10
history = model.fit(train_dataset, epochs=NUM_EPOCHS, validation_data=test_dataset)
 
import matplotlib.pyplot as plt
 
 
def plot_graphs(history, string):
  plt.plot(history.history[string])
  plt.plot(history.history['val_'+string])
  plt.xlabel("Epochs")
  plt.ylabel(string)
  plt.legend([string, 'val_'+string])
  plt.show()
 
plot_graphs(history, 'accuracy')
 
plot_graphs(history, 'loss')
Colored by Color Scripter

cs

Conv1D + GlobalAveragePooling1D 를 사용한 모델과 성능 비교를 해볼 수 있다.

1
2
3
4
5
6
7

model = tf.keras.Sequential([
    tf.keras.layers.Embedding(tokenizer.vocab_size, 64),
    tf.keras.layers.Conv1D(128, 5, activation='relu'),
    tf.keras.layers.GlobalAveragePooling1D(),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid')
])
Colored by Color Scripter

cs

저작자표시 비영리 변경금지 (새창열림)

'AI & 머신러닝 coding skill' 카테고리의 다른 글

[SEQUENCES, TIME SERIES AND PREDICTION] Deep neural network for time series 예측 (0)	2020.11.11
[SEQUENCES, TIME SERIES AND PREDICTION] Preparing features and labels (0)	2020.11.11
[SEQUENCES, TIME SERIES AND PREDICTION] Sequences and Prediction (0)	2020.11.11
[NATURAL LANGUAGE PROCESSING IN TENSORFLOW] Sequence models and Literature (0)	2020.11.11
[NATURAL LANGUAGE PROCESSING IN TENSORFLOW] subwords text encoder (0)	2020.11.11
training data in tensorflow site (0)	2020.11.11
[NATURAL LANGUAGE PROCESSING IN TENSORFLOW] Word embeddings (0)	2020.11.11
[NATURAL LANGUAGE PROCESSING IN TENSORFLOW] Text to sequence and padding (0)	2020.11.11

세상탐험대 블로그

[NATURAL LANGUAGE PROCESSING IN TENSORFLOW] Sequence models

'AI & 머신러닝 coding skill' 카테고리의 다른 글

티스토리툴바

[NATURAL LANGUAGE PROCESSING IN TENSORFLOW] Sequence models

'AI & 머신러닝 coding skill' 카테고리의 다른 글

관련글

티스토리툴바