Fully connected layer là gì, bài 6: convolutional neural network

     

Bài này đã ra mắt về convolutional neural network, sẽ được cần sử dụng Lúc input của neural network là hình ảnh. Mọi fan yêu cầu hiểu trước bài xích neural network và cách xử trí ảnh trước lúc ban đầu bài xích này.

Bạn đang xem: Fully connected layer là gì, bài 6: convolutional neural network


Thiết lập bài toán

Gần trên đây vấn đề đánh giá mã captphụ vương để xác minc chưa phải robot của google bị bao gồm robot quá qua


*
Mô hình neural network.

Mỗi hidden layer được call là fully connected layer, tên gọi theo đúng ý nghĩa sâu sắc, từng node vào hidden layer được kết nối với tất cả những node trong layer trước. Cả quy mô được điện thoại tư vấn là fully connected neural network (FCN).

Vấn đề của fully connected neural network với cách xử trí ảnh

Nlỗi bài xích trước về giải pháp xử lý hình ảnh, thì hình họa màu 64*64 được màn trình diễn bên dưới dạng 1 tensor 64*64*3. Nên để biểu hiện không còn văn bản của tấm hình thì nên truyền vào input layer toàn bộ những px (64*64*3 = 12288). Nghĩa là input layer giờ đồng hồ gồm 12288 nodes.


*

Tuy nhiên hình họa màu tất cả tới 3 channels red, green, blue nên khi màn biểu diễn hình họa bên dưới dạng tensor 3D. Nên ta cũng trở nên quan niệm kernel là 1 trong những tensor 3 chiều form size k*k*3.

Xem thêm: Tây Ban Nha In English - Spanish Nghĩa Là Gì Trong Tiếng Anh


*
Sau pooling layer (2*2).Source: http://cs231n.github.io/convolutional-networks/

Có 2 nhiều loại pooling layer thông dụng là: max pooling cùng average pooling.


*
Ví dụ quy mô convolutional neural network. Source: https://www.easy-tensorflow.com/tf-tutorials/convolutional-neural-nets-cnns

Có thể coi chi tiết vào từng layer ở đây.


Mạng VGG 16

VGG16 là mạng convolutional neural network được khuyến cáo vị K. Simonyan and A. Zisserman, University of Oxford. Model sau thời điểm train do mạng VGG16 đạt độ đúng mực 92.7% top-5 thử nghiệm trong dữ liệu ImageNet gồm 14 triệu hình ảnh thuộc 1000 lớp khác nhau. Giờ vận dụng kỹ năng làm việc bên trên nhằm so với mạng VGG 16.


Phân tích:

Convolutional layer: form size 3*3, padding=1, stride=1. Tại sao không ghi stride, padding cơ mà vẫn biết? Vì khoác định đã là stride=1 và padding để cho output thuộc width và height cùng với input đầu vào.Pool/2 : max pooling layer cùng với kích thước 2*23*3 conv, 64: thì 64 là số kernel áp dụng trong layer đấy, tốt depth của output của layer đấy.Càng những convolutional layer sau thì kích cỡ width, height càng giảm tuy nhiên depth càng tăng.Sau không ít convolutional layer với pooling layer thì dữ liệu được flatten và bỏ vô fully connected layer.

Bài sau mình sẽ ra mắt về keras với lý giải sử dụng keras để vận dụng convolutional neural vào những ứng dụng nlỗi nhấn diện số viết, dự đoán thù góc di chuyển trong ô tô từ bỏ lái.



Search for:

Bài viết ngay sát đây


Mục bài xích viết


Deep Learning cơ phiên bản ©2021. All Rights Reserved. Powered by WordPress.Theme by Phoenix Web Solutions

Chuyên mục: Tài liệu