caffe的python接口學習（1）：生成配置文件

2019-11-06 08:25:15

字體：大中小

來源：轉載

供稿：網友

caffe是C++語言寫的，可能很多人不太熟悉，因此想用更簡單的腳本語言來實現。caffe提供matlab接口和python接口，這兩種語言就非常簡單，而且非常容易進行可視化，使得學習更加快速，理解更加深入。

半年前，我在學習CAFFE的時候，為了加深理解，因此寫下了隨筆，有了一系列的caffe學習文章。半年過去，很多人問到關于python接口和可視化的一些問題，現在有點空閑時間，就再次寫下一些隨筆，大家一起來學習。有些重復的內容，我就不再多講，如果大家有興趣可移步：

如何配置CAFFE的python接口？

如何將圖片轉換成LMDB文件？

如何計算訓練數據的均值文件？

以上這些操作都是訓練之前的預處理操作，不管是用什么接口，都要用到。

首先，我們需要掌握的，就是如何寫配置文件，通過下面的代碼來學習：

# -*- coding: utf-8 -*-"""Spyder Editor"""from caffe import layers as L,params as P,to_通過上面這個文件的執行，我們就會得到兩個配置文件：train.prototxt和val.prototxt，分別用于訓練階段和驗證階段。
這種方式生成配置文件，必須有個前提，就是要先把原始圖片轉換成LMDB文件才行。如果我們已經把原始圖片做成了一個列表清單（txt文件，一行一張圖片），則可以不用LMDB格式作為輸入數據，可以用ImageData作為數據源輸入，代碼如下：
# -*- coding: utf-8 -*-from caffe import layers as L,params as P,to_protopath='/home/xxx/data/'train_list=path+'train.txt'val_list=path+'val.txt'           train_proto=path+'train.prototxt'   val_proto=path+'val.prototxt'       def create_net(img_list,batch_size,include_acc=False):    data,label=L.ImageData(source=img_list,batch_size=batch_size,new_width=48,new_height=48,ntop=2,                           transform_param=dict(crop_size=40,mirror=True))    conv1=L.Convolution(data, kernel_size=5, stride=1,num_output=16, pad=2,weight_filler=dict(type='xavier'))    relu1=L.ReLU(conv1, in_place=True)    pool1=L.Pooling(relu1, pool=P.Pooling.MAX, kernel_size=3, stride=2)    conv2=L.Convolution(pool1, kernel_size=53, stride=1,num_output=32, pad=1,weight_filler=dict(type='xavier'))    relu2=L.ReLU(conv2, in_place=True)    pool2=L.Pooling(relu2, pool=P.Pooling.MAX, kernel_size=3, stride=2)    conv3=L.Convolution(pool2, kernel_size=53, stride=1,num_output=32, pad=1,weight_filler=dict(type='xavier'))    relu3=L.ReLU(conv3, in_place=True)    pool3=L.Pooling(relu3, pool=P.Pooling.MAX, kernel_size=3, stride=2)    fc4=L.InnerProduct(pool3, num_output=1024,weight_filler=dict(type='xavier'))    relu4=L.ReLU(fc4, in_place=True)    drop4 = L.Dropout(relu4, in_place=True)    fc5 = L.InnerProduct(drop4, num_output=7,weight_filler=dict(type='xavier'))    loss = L.SoftmaxWithLoss(fc5, label)        if include_acc:                     acc = L.Accuracy(fc5, label)        return to_proto(loss, acc)    else:        return to_proto(loss)    def write_net():    #    with open(train_proto, 'w') as f:        f.write(str(create_net(train_list,batch_size=64)))    #        with open(val_proto, 'w') as f:        f.write(str(create_net(val_list,batch_size=32, include_acc=True)))        if __name__ == '__main__':    write_net() 即第一層由原來的Data類型，變成了ImageData類型，不需要LMDB文件和均值文件，但需要一個txt文件。