在实体店买衣服的过程中我们會被眼花缭乱的信息轰炸。要兼顾某件衣服的款式、价格、商场优惠还不够商场的灯光、拥挤的过道,无时无刻不在考验着人们分辨信息的能力
那么,电脑能自动检测衬衫、裤子、连衣裙或运动鞋的照片吗事实证明,如果有高质量的训练数据准确地对时尚单品图片進行分类是很很容易做到的。在本文中我们将讲解如何用Fashion-MNIST数据集搭建一个用于辨认时尚单品的机器学习模型。我们会提到如何训练模型、针对类别分类设计输入和输出以及每个模型的最终结果
这一任务中涉及到的问题包括视角的变化、尺度变化、同类的多种变化、照片形变、照片遮挡、光线条件、背景等问题。如何写出一套可以区分图片类型的算法呢计算机视觉研究人员提出了一种数据驱动的方法来解决。过去人们会了解每一图片类别的代码,从而进行分类现在,研究人员从每类图像中都选出一些样本训练深度学习算法学习每種类别的特点。换句话说他们首先收集带标签的训练数据集,然后输入到计算机中让计算机熟悉这些数据。
-
输入的是一个含有N张图片嘚数据集每张图片都带有类别标签,数据集中共有K个不同的类别
-
之后,我们用训练集去训练一个分类器学习每种类别的样式。
-
最后让分类器对陌生图片进行标签预测,从而对分类器质量进行评估之后我们会比较真实标签和分类器的预测标签。
去年八月份德国研究机构Zalando Resech在GitHub上推出了一个全新的数据集,其中训练集包含60000个样例测试集包含10000个样例,分为10类其中的样本都来自日常穿着的衣裤鞋包,每個都是28×28的灰度图像其中总共有10类标签,每张图像都有各自的标签
嵌入是一种将分散目标(图像、文字等等)映射到高维向量中的方法。这些向量中的每个维度通常都没有内在意义机器学习运用的是想两件的距离和总体的模式。在这里我打算用TensorBoard表示高维的Fashion MNIST数据。阅讀了数据并创建测试标签后我用以下代码创建了TensorBoard的嵌入投射器:
模型训练后,测试损失和精确度如下:
时尚领域是计算机视觉和机器学習应用的热门由于其中的予以复杂性,导致问题难度增加希望这篇文章能对你在图像分类任务上有所启发。