利用Python实现网页应用程序，可图片识别狗的类型（附源码）-电子发烧友网

在这篇文章中，将教大家实现一个网页应用程序，该程序可以接收狗的图片，然后输出其品种，其准确率超过80％！

我们将使用深度学习来训练一个识别狗品种的模型，数据集是狗图像与他们的品种信息，通过学习图像的特征来区分狗的品种。数据分析数据集可以从这里下载（https：／／s3－us－west－1．amazonaws．com／udacity－aind／dog－project／dogImages．zip）。以下是关于数据的一些介绍：犬种总数：133狗图片总数：8351（训练集：6680，验证集：835，测试集：836）最受欢迎的品种：阿拉斯加对应96个样本，博德牧羊犬对应93个样本按图片数量排序的前30个品种如下：

利用Python实现网页应用程序，可图片识别狗的类型（附源码）

我们还可以在这里看到一些狗的图片和它们的品种：

数据预处理我们会把每个图像作为一个numpy数组进行加载，并将它们的大小调整为224x224，这是大多数传统神经网络接受图像的默认大小，另外我们为图像的数量添加为另一个维度。from keras．preprocessing import image from tqdm import tqdm

def path＿to＿tensor（img＿path）：＇＇＇将给定路径下的图像转换为张量＇＇＇ img ＝ image．load＿img（img＿path， target＿size＝（224， 224）） x ＝ image．img＿to＿array（img） return np．expand＿dims（x， axis＝0）

def paths＿to＿tensor（img＿paths）：＇＇＇将给定路径中的所有图像转换为张量＇＇＇ list＿of＿tensors ＝［path＿to＿tensor（img＿path） for img＿path in tqdm（img＿paths）］ return np．vstack（list＿of＿tensors）最后，我们使用ImageDataGenerator对图像进行动态缩放和增强train＿datagen ＝ tf．keras．preprocessing．image．ImageDataGenerator（rescale＝1．／255， horizontal＿flip＝True， vertical＿flip＝True， rotation＿range＝20）

valid＿datagen ＝ tf．keras．preprocessing．image．ImageDataGenerator（rescale＝1．／255．）

test＿datagen ＝ tf．keras．preprocessing．image．ImageDataGenerator（rescale＝1．／255．）

train＿generator ＝ train＿datagen．flow（train＿tensors， train＿targets， batch＿size＝32）valid＿generator ＝ train＿datagen．flow（valid＿tensors， valid＿targets， batch＿size＝32）test＿generator ＝ train＿datagen．flow（test＿tensors， test＿targets， batch＿size＝32）CNN我们将在预处理数据集上从头开始训练卷积神经网络（CNN），如下所示：model ＝ tf．keras．models．Sequential（［ tf．keras．layers．Conv2D（16，（3，3）， activation＝＇relu＇， input＿shape＝（224， 224， 3））， tf．keras．layers．MaxPooling2D（2， 2）， tf．keras．layers．Conv2D（32，（3，3）， activation＝＇relu＇）， tf．keras．layers．MaxPooling2D（2，2）， tf．keras．layers．Conv2D（64，（3，3）， activation＝＇relu＇）， tf．keras．layers．MaxPooling2D（2，2）， tf．keras．layers．Conv2D（128，（3，3）， activation＝＇relu＇）， tf．keras．layers．MaxPooling2D（2，2）， tf．keras．layers．Conv2D（256，（3，3）， activation＝＇relu＇）， tf．keras．layers．MaxPooling2D（2，2）， tf．keras．layers．Flatten（）， tf．keras．layers．Dense（2048， activation＝＇softmax＇）， tf．keras．layers．Dropout（0．5）， tf．keras．layers．Dense（1024， activation＝＇softmax＇）， tf．keras．layers．Dropout（0．5）， tf．keras．layers．Dense（133， activation＝＇softmax＇）］）

model．compile（optimizer＝＇rmsprop＇， loss＝＇categorical＿crossentropy＇， metrics＝［＇accuracy＇］）

checkpointer ＝ tf．keras．callbacks．ModelCheckpoint（filepath＝＇．．／saved＿models／weights＿best＿custom．hdf5＇， verbose＝1， save＿best＿only＝True）

model．fit（train＿generator， epochs＝5， validation＿data＝valid＿generator， callbacks＝［checkpointer］）我们使用一个ModelCheckpoint的回调来保存验证分数较高的模型。通过测试模型，我们得到的准确率只有1％左右使用迁移学习现在，我们使用迁移学习来实现更高的准确率。首先我们下载ResNet－50，可以通过运行下面的代码来提取相应的训练集、测试和验证集：bottleneck＿features ＝ np．load（＇Data／bottleneck＿features／DogResnet50Data．npz＇）train＿Resnet50 ＝ bottleneck＿features［＇train＇］valid＿Resnet50 ＝ bottleneck＿features［＇valid＇］test＿Resnet50 ＝ bottleneck＿features［＇test＇］我们现在再次定义模型，并对提取的特征使用GlobalAveragePooling2D，它将一组特征平均为一个值。最后，如果验证损失在两个连续的epoch内没有增加，我们使用额外的回调来降低学习率；如果验证损失在连续的5个epoch内没有增加，可以提前停止训练。Resnet50＿model ＝ tf．keras．models．Sequential（）Resnet50＿model．add（tf．keras．layers．GlobalAveragePooling2D（input＿shape＝train＿Resnet50．shape［1：］））Resnet50＿model．add（tf．keras．layers．Dense（1024， activation＝＇relu＇））Resnet50＿model．add（tf．keras．layers．Dense（133， activation＝＇softmax＇））

Resnet50＿model．compile（loss＝＇categorical＿crossentropy＇， optimizer＝＇rmsprop＇， metrics＝［＇accuracy＇］）

checkpointer ＝ tf．keras．callbacks．ModelCheckpoint（filepath＝＇saved＿models／weights＿best＿Resnet50．hdf5＇， verbose＝1， save＿best＿only＝True）early＿stopping ＝ tf．keras．callbacks．EarlyStopping（patience＝5， monitor＝＇val＿loss＇）

reduce＿lr ＝ tf．keras．callbacks．ReduceLROnPlateau（patience＝2， monitor＝＇val＿loss＇）Resnet50＿model．fit（train＿Resnet50， train＿targets， validation＿data＝（valid＿Resnet50， valid＿targets）， epochs＝50， batch＿size＝20， callbacks＝［checkpointer， early＿stopping， reduce＿lr］， verbose＝1）＃＃＃训练模型最后在测试集上的准确率为82．65％，这与我们白手起家训练的模型相比，是一个巨大的进步。构建web应用程序对于web应用程序，我们首先编写了一个helper函数，该函数接受图像路径并返回品种。label＿to＿cat字典将每个数字标签映射到它的狗品种。def predict＿breed（img＿path）：＇＇＇预测给定图像的品种＇＇＇＃提取特征 bottleneck＿feature ＝ extract＿Resnet50（path＿to＿tensor（img＿path）） bottleneck＿feature ＝ tf．keras．models．Sequential（［ tf．keras．layers．GlobalAveragePooling2D（input＿shape＝bottleneck＿feature．shape［1：］）］）．predict（bottleneck＿feature）．reshape（1， 1， 1， 2048）＃获得预测向量 predicted＿vector ＝ Resnet50＿model．predict（bottleneck＿feature）＃模型预测的犬种 return label＿to＿cat［np．argmax（predicted＿vector）］对于web应用程序，我们将使用flaskweb框架来帮助我们用最少的代码创建web应用程序。我们定义一个接受图像的路由，并用狗的品种呈现一个输出模板＠app．route（＇／upload＇， methods＝［＇POST＇，＇GET＇］）def upload＿file（）： if request．method ＝＝＇GET＇： return render＿template（＇index．html＇） else： file ＝ request．files［＇image＇］ full＿name ＝ os．path．join（UPLOAD＿FOLDER， file．filename） file．save（full＿name） dog＿breed ＝ dog＿breed＿classifier（full＿name） return render＿template（＇predict．html＇， image＿file＿name ＝ file．filename， label ＝ dog＿breed）predict．html是分别显示图像及其犬种的模板。

结论

祝贺你！你已经成功地实现了一个狗品种分类器，并且可以准确地分辨出狗的品种。让我们总结一下我们在这里学到的知识：我们对数据集进行了分析和预处理。机器学习算法需要单独的训练集、测试集和验证集来进行置信预测。我们从零开始使用CNN，由于未能提取特征，所以表现不佳。然后我们使用了迁移学习，准确度大大提高最后，我们构建了一个Flask web应用程序来实现我们的项目封装我们确实学到了很多东西，但你还可以尝试很多其他的事情。你可以在heroku上部署web应用程序，也可以尝试使用不同的层（如Dropout层）来提高准确性。

参考链接：https：／／towardsdatascience．com／dont－know－the－breed－of－your－dog－ml－can－help－6558eb5f7f05
责编AJX

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉