【大厂AI课学习笔记NO.50】2.3深度学习开发任务实例(3)任务背景与目标

news/发布时间2024/6/8 1:06:25

我们经常在做项目的时候,觉得分析背景和目标是浪费时间,觉得不过如此。

其实目标梳理特别重要,直接决定你数据的需求分析,模型的选择,决定你交付的质量。

人工智能项目也和其他项目一样,不要想当然,不要自己闷头去干。

当前的课程,给了一个玩具小车,在赛道上识别交通标志的深度学习案例,图像识别的图像分类。

背景:玩具车增加识别交通指示牌的能力。

目标:利用玩具车的前置摄像头,检测交通标志的位置。

任务过程包括:

  • 明确数据采集需求
  • 制作数据集
  • 模型训练
  • 模型评测

 

效果就是这样的。

我们可以看到,赛道是类似纸张铺设的,所以不平整。玩具交通标志,被用检测框标记出来。是很小的立起来的小牌子,塑料的,所以很容易有俯仰角、翻滚角等问题。

 计算机视觉(CV)实际应用中。

我们要注意,除了关注的主体,还有很多其他要关注的信息,比如背景、光照;

我们在做图像识别,那么光就是最重要的因素。是不是有逆光、背光、面向光?如果样本图片,不包含这些情况,那么训练出来的模型,就将出现准确率和召回率都很低的情况。

还有客户给我们讲需求时,由于客户不理解这些,可能认为一切很简单,给的项目预算,就有问题,而实际,在这个项目中,我们要采集甚至超过1万个样本,都要进行特征标注,这是非常大的工作量,都要项目经费去支撑。

作为项目负责人,如果忽略了这一点,也将导致项目无法继续交付和落地。

延伸学习:


在深度学习中,图像分类是一个复杂且具有挑战性的任务。以下是一些难点和注意事项:

难点:

  1. 数据集的质量和多样性:图像分类的性能在很大程度上取决于训练数据的质量和多样性。如果数据集不够大、标注不准确或者缺乏多样性,那么模型的泛化能力可能会受到限制。
  2. 模型的复杂性:图像分类需要处理大量的输入数据,并学习从这些数据中提取有用的特征。因此,模型需要具有足够的复杂性来捕捉这些特征,但同时也要避免过拟合。
  3. 光照和视角变化:图像中的光照和视角变化可能会对模型的性能产生负面影响。模型需要能够处理这些变化,并正确地分类图像。
  4. 类别不平衡:在某些数据集中,某些类别的样本数量可能远多于其他类别,这可能导致模型在训练过程中偏向这些样本数量较多的类别。

注意事项:

  1. 数据预处理:在进行图像分类之前,需要对图像进行适当的预处理,如缩放、裁剪、归一化等,以确保输入数据的一致性和模型的稳定性。
  2. 模型选择:根据具体任务和数据集的特点选择合适的模型。目前有许多先进的深度学习模型可用于图像分类,如卷积神经网络(CNN)、残差网络(ResNet)等。
  3. 调参技巧:在训练过程中,需要合理地设置学习率、批大小等超参数,并使用优化算法来加速训练过程。同时,还需要关注模型的过拟合问题,并采取相应的措施来避免过拟合。

目前最先进的模型和算法:

在图像分类领域,目前最先进的模型之一是EfficientNet系列模型。EfficientNet通过一种称为复合缩放的方法,在保持计算效率和精度的同时,实现了更高的性能。此外,还有许多其他优秀的模型,如ViT(Vision Transformer)等。

在算法方面,除了传统的梯度下降算法外,还有许多优化算法可用于加速训练过程和提高模型性能,如Adam、RMSProp等。这些算法可以根据具体任务和数据集的特点进行选择。

工具:

目前有许多深度学习框架和工具可用于图像分类任务,如TensorFlow、PyTorch、Keras等。这些工具提供了丰富的API和预训练模型,可以方便地构建和训练深度学习模型。此外,还有一些可视化工具可以帮助我们更好地理解模型的训练过程和性能,如TensorBoard等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.bcls.cn/DwPF/5572.shtml

如若内容造成侵权/违法违规/事实不符,请联系编程老四网进行投诉反馈email:xxxxxxxx@qq.com,一经查实,立即删除!

相关文章

ETL数据仓库的使用方式

一、ETL的过程 在 ETL 过程中,数据从源系统中抽取(Extract),经过各种转换(Transform)操作,最后加载(Load)到目标数据仓库中。以下是 ETL 数仓流程的基本步骤&#xff1a…

Mysql入门

什么是关系型数据,什么是非关系型数据库? 关系型数据库是一种使用表、行和列来组织和存储数据的数据库系统。它们遵循结构化查询语言(SQL)标准,数据以表格形式存储,并支持事务处理和复杂查询。 非关系型数…

上班族如何安排自学时间?待办事项时间管理软件

自学对于我们这些上班族来说,是一种非常重要的自我提升和成长的方式。作为一名渴望知识、追求进步的上班族,我总是想要在繁忙的工作之余,找到时间来充实自己,学习新的技能或知识。然而,面对工作的压力和忙碌的日程&…

【c++】类与对象(下)

1.再谈构造函数 1.1 构造函数体赋值 在创建对象时,编译器通过调用构造函数,给对象中各个成员变量一个合适的初始值。 class Date { public: Date(int year, int month, int day){_year year;_month month;_day day;} private: int _year; int _month…

基于机器学习、遥感和Penman-Monteith方程的农田蒸散发混合模型研究_刘燕_2022

基于机器学习、遥感和Penman-Monteith方程的农田蒸散发混合模型研究_刘燕_2022 摘要关键词 1 绪论2 数据与方法2.1 数据2.2 机器学习算法2.3 Penman-Monteith方程2.4 Medlyn公式2.5 模型性能评估 3 基于机器学习算法的混合模型估算农田蒸散量的评价与比较4 利用人工神经网络算法…

如何使用视频号下载提取器提取视频,推荐2种方法使用!

视频号下载提取视频号视频,推荐大家2个方法​! 前者简单,后者较为复杂,不过都可以提取视频号视频,大家可根据实际情况来使用​。 视频号下载工具提取器​? 1:通过搜一搜的这款搜索引擎找到自己…

JVM虚拟机初步了解

各位小伙伴们大家好,欢迎来到这个小扎扎的专栏 总结 | 提效 | 拓展,在这个系列专栏中记录了博主在学习期间总结的大块知识点;以及日常工作中遇到的各种技术点 ┗|`O′|┛ 🌆 题目速览 1. JVM的位置2. JVM的体系结构3…

LeetCode第二题: 两数相加

文章目录 题目描述示例 解题思路 - 迭代法Go语言实现 - 迭代法算法分析 解题思路 - 模拟法Go语言实现 - 模拟法算法分析 解题思路 - 优化模拟法主要方法其他方法的考虑 ‍ 题目描述 给出两个非空的链表用来表示两个非负的整数。其中,它们各自的位数是按照逆序的方…

sentinel中监听器的运用--规则管理

sentinel中监听器的运用–规则管理 规则结构 类图关系 类关系图如下 Rule 将规则抽象成一个类, 规则与资源是紧密关联的, 也就是说规则作用于资源。因此, 我们需要将规则表示为一个类, 并包含一个获取资源的方法 这里采用接口的原因就是规则是一个抽象概念而非具体实现。…

【C进阶】顺序表详解

文章目录 📝线性表的概念🌠 顺序表🌉顺序表的概念 🌠声明--接口🌉启动🌠初始化🌉扩容🌠尾插🌉 打印🌠销毁🌉 尾删🌠头插🌉…

kitti数据可视化

数据下载 The KITTI Vision Benchmark Suite 这里以 2011_09_26_drive_0005 (0.6 GB)数据为参考,下载[syncedrectified data] [calibration] 数据。 下载完毕之后解压,然后将calibration文件解压后的结果放在如下目录下, 下载kitti2bag包 …

《Docker 简易速速上手小册》第4章 Docker 容器管理(2024 最新版)

文章目录 4.1 容器生命周期管理4.1.1 重点基础知识4.1.2 重点案例:启动并管理 Python Flask 应用容器4.1.3 拓展案例 1:调试运行中的容器4.1.4 拓展案例 2:优雅地停止和清理容器 4.2 容器数据管理与持久化4.2.1 重点基础知识4.2.2 重点案例&a…

数字孪生的技术开发平台

数字孪生的开发平台可以基于各种软件和硬件工具来实现,这些平台提供了丰富的功能和工具,帮助开发人员构建、部署和管理数字孪生系统,根据具体的需求和技术要求,开发人员可以选择合适的平台进行开发工作。以下列举了一些常见的数字…

离散数学——树思维导图

离散数学——树思维导图 文章目录 前言内容大纲参考 前言 这是当初学习离散数学时整理的笔记大纲,其中包含了自己对于一些知识点的体悟。现将其放在这里作为备份,也希望能够对你有所帮助。 当初记录这些笔记只是为了在复习时更快地找到对应的知识点。…

蓝桥杯:真题讲解2(C++版)附带解析

星系炸弹 来自:2015年六届省赛大学B组真题(共6道题) 分析:这题涉及到平年和闰年的知识,如果我们要解这题,首先要知道每月有多少天,其实也就是看2月份的天数,其它月份的天数都是一样的&#xff…

铭瑄科技——为星闪技术发展与应用带来新推力

随着智能化生活逐渐普及,无线通信不仅是不仅是信息时代的重要基础设施,而且是推动社会向智能化发展的核心力量之一,其中短距无线通信更是推动未来智能化发展的关键。 为积极推动未来硬件智能化、产业智能化发展,铭瑄正式宣布成为星…

微信小程序 --- 自定义组件

自定义组件 1. 创建-注册-使用组件 组件介绍 小程序目前已经支持组件化开发,可以将页面中的功能模块抽取成自定义组件,以便在不同的页面中重复使用; 也可以将复杂的页面拆分成多个低耦合的模块,有助于代码维护。 开发中常见的…

vue3 使用qrcodejs2-fix生成二维码并可下载保存

直接上代码 <el-button click‘setEwm’>打开弹框二维码</el-button><el-dialog v-model"centerDialogVisible" align-center ><div class"code"><div class"content" id"qrCodeUrl" ref"qrCodeUrl&q…

【MySQL面试复习】谈一谈你对SQL的优化经验

系列文章目录 在MySQL中&#xff0c;如何定位慢查询&#xff1f; 发现了某个SQL语句执行很慢&#xff0c;如何进行分析&#xff1f; 了解过索引吗&#xff1f;(索引的底层原理)/B 树和B树的区别是什么&#xff1f; 什么是聚簇索引&#xff08;聚集索引&#xff09;和非聚簇索引…

免费享受企业级安全:雷池社区版WAF,高效专业的Web安全的方案

网站安全成为了每个企业及个人不可忽视的重要议题。 随着网络攻击手段日益狡猾和复杂&#xff0c;选择一个强大的安全防护平台变得尤为关键。 推荐的雷池社区版——一个为网站提供全面安全防护解决方案的平台&#xff0c;它不仅具备高效的安全防护能力&#xff0c;还让网站安…
推荐文章