【大厂AI课学习笔记NO.51】2.3深度学习开发任务实例(4)计算机视觉实际应用的特点

news/发布时间2024/5/15 2:21:40

今天考试通过腾讯云人工智能从业者TCA级别的认证了!

还是很开心的,也看不到什么更好的方向,把一切能利用的时间用来学习,总是对的。

我把自己考试通过的学习笔记,都分享到这里了,另外还有一个比较全的思维脑图,我导出为JPG文件了。下载地址在这里:https://download.csdn.net/download/giszz/88868909

这个号码真好,88868909,我喜欢。

今天来总结计算机视觉实际应用的特点。

机器学习和深度学习,总算是搞明白了。今天考试,有好几个考点,都和这个有关系。

我理解的机器学习和深度学习的区别和联系

  • 机器学习包含了深度学习;
  • 深度学习主要是神经网络技术,这是Hinton这个大神,也就是人工智能之父,40年坚持的结果;
  • 机器学习主要是特征工程的存在,有标注,也有标签,深度学习也需要数据标注,但是基本不需要做特征工程,也就是人工进行数据预处理、特征抽取、特征选择、特征这些工作;
  • 深度学习只关注端到端,就是输入到输出的过程。其中也有多隐层神经网络等,在例子中的前馈神经网络,是最简单的神经网络模型;
  • 机器学习由于有人的参与,所以可解释性很强,很多时候其实是为了特定任务而去做的,普适性不是很强,而深度学习,自己就能学习;
  • 比如在图片分类中,机器学习要对图片进行特征工程,就是打标签,找出汽车车身的特征,而深度学习,直接用卷积算法就可以,滑动窗口,整个图片使用同一个权重,得到特征值,通过多层神经网络,学习哪个是汽车;
  • 所以说机器学习是人工来提取特征,深度学习是从数据中创建新的特征;
  • 机器学习要把复杂的工作,拆分为小的任务,逐个攻克;深度学习只关注端到端;
  • 机器学习可以使用少量的数据,就能预测,而深度学习不行;
  • 机器学习用低性能的计算机就能计算,而深度学习不行;

大概就是这样。

这是整个人工智能课程的核心。

当然,现在大家都普遍关心的,是sora,大模型LLM等,这肯定更有魅力的应用方向。大模型的出现,让人工智能真的是走向了新的高峰。

有人说,之前的人工智能,都是针对特定任务的,没有普适性。从大模型的出现来看,AGI也许已经在某个实验室里面实现了。

AGI是Artificial General Intelligence的首字母缩写,意为人工通用智能,也称为强人工智能。它指的是一种具有类似于人类全面智能的人工智能系统,可以处理不同领域的任务和问题,包括学习、推理、理解语言、感知环境、创造性思考等多种能力。与只能处理特定任务的狭窄人工智能(Narrow AI)不同,AGI旨在实现人类智能的全面模拟,并可以在不同场景和任务中表现出与人类相似的智能水平。

AGI的实现需要融合多个领域的知识和技术,包括机器学习、自然语言处理、计算机视觉、机器人技术等,同时也需要解决许多挑战和难题,如理解自然语言、掌握常识知识、具备有效的推理能力、能够感知和适应不同的环境等。

虽然AGI的实现仍面临着许多挑战和风险,如数据隐私、伦理道德等问题,但其对人类社会的影响和意义是巨大的。AGI可以帮助我们解决许多重大问题,如环境保护、医疗保健、安全保障等,同时也可以在各个领域中充当人类的助手、合作伙伴甚至是导师的角色,推动人类社会的进步和发展。

因此,AGI是当前人工智能领域的一个重要研究方向,也是未来人工智能发展的一个重要趋势。

言归正传,我们今天该学习机器视觉的一些普通特性了。

看,就是这些核心的内容。

很多朋友又要感觉没意思了,觉得没有关键技术名词,没有英文对照,没有示例代码等等。

其实,这些理念,是更重要的东西。

当前我们的任务,是要给玩具小车,加上自动识别标识牌的能力,我们暂且不管,边缘端的情况,我们来看这些要注意的事项。

  • 样本具象化。图像是具体表现形式,除了主体外,还有大量的信息,如背景,光照等。
  • 算法光线敏感性。侧光,面向光,背光,强光,暗光,都有影响,如果样本没有这些光线的图片,效果会欠佳。
  • 理解硬件条件可能造成的图片效果偏差。带来色差、模糊、角度变化,样本如果没有这些资料,效果会欠佳。
  • 客户理解的偏差。不理解光线影响,不能清晰的表达述求,都在需求梳理时摸清,否则影响交付。

前面都好说,有经验的项目人员,就能知道怎么来理解了。

最后的客户理解偏差,反而是我在实践中,感觉最头疼的。

客户认为,这不是很简单的事吗!

这要很久吗?!

这那个什么什么公司,不是早就做出来了吗?我们只是要做个一样的,甚至还更简答的而已!

好吧,客户不知道,除了识别这些标志,我们还要看,你这个场地,有什么特点,光线,硬件条件等等,包括这些小车搭载的摄像机,是多少分辨率!

延伸学习:


在计算机视觉的实际应用中,有许多关键的注意事项和经验,这些可以影响算法的准确性和效率。以下是一些主要的考虑因素:

  1. 图像质量:高质量的图像对于计算机视觉算法至关重要。图像的清晰度、分辨率和噪声水平都会影响算法的性能。因此,在实际应用中,需要确保使用的图像采集设备能够提供高质量的图像,或者采用图像增强技术来改善图像质量。
  2. 光照条件:光照条件是影响计算机视觉算法性能的另一个重要因素。不同的光照条件(如亮度、颜色温度、方向等)会对图像的外观产生显著影响,从而影响算法的准确性。为了解决这个问题,可以采用背景光照补偿技术、阴影去除技术等,以提升计算机视觉系统的鲁棒性。同时,在实际应用中,应尽量选择光线充足、均匀的环境,避免强光和暗光交替的情况出现。
  3. 数据集偏差:训练数据集的选择和准备对于计算机视觉算法的性能至关重要。如果训练数据集中存在偏差,比如样本不平衡、类别不均衡等,可能导致算法的泛化能力下降。为了解决这个问题,可以采用数据集采样均衡化、数据增强等技术,以改善模型的性能。同时,应注意数据的质量和多样性,确保数据集具有足够的标签和多样的样本。
  4. 镜头选择:在计算机视觉应用中,镜头的选择也会影响图像的质量和算法的准确性。不同的镜头有不同的焦距、光圈和景深等特性,这些特性会影响图像的清晰度和细节表现。因此,在实际应用中,应根据具体的需求选择合适的镜头。
  5. 避免畸变:在定位及高精度测量的系统中,畸变是一个需要特别注意的问题。畸变会导致图像中的物体形状发生扭曲,从而影响算法的准确性。为了解决这个问题,可以采用畸变校正技术,或者在系统标定时使用远心镜头等特殊镜头来减小畸变的影响。
  6. 恰当的照明与曝光:照明和曝光是影响图像质量的关键因素之一。如果照明不足或曝光过度,图像将不能提供足够的反差和细节信息,这将严重影响算法的准确性。因此,在实际应用中,需要选择适合的灯源和曝光设置,以确保图像具有足够的反差和细节信息。同时,还应注意系统周围环境的影响,避免其他光源对图像产生干扰。
  7. 算法选择与调优:对于不同的视觉任务,可能有多种不同的算法可供选择。在实际应用中,应根据任务的要求和数据集的特点选择合适的算法,并进行必要的调优。这包括选择合适的网络结构、调整超参数、使用正则化技术等手段来提高算法的准确性和效率。
  8. 实时性与性能平衡:在计算机视觉应用中,实时性和性能之间往往存在一定的权衡关系。为了提高算法的实时性,可能需要牺牲一部分性能;反之,为了提高性能,可能需要增加计算复杂度和时间成本。因此,在实际应用中,需要根据具体的需求和场景来平衡实时性和性能之间的关系。

总之,在计算机视觉的实际应用中,需要考虑多个方面的因素来确保算法的准确性和效率。通过注意以上提到的注意事项和经验,可以更好地应用计算机视觉技术来解决实际问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.bcls.cn/DIIp/4271.shtml

如若内容造成侵权/违法违规/事实不符,请联系编程老四网进行投诉反馈email:xxxxxxxx@qq.com,一经查实,立即删除!

相关文章

跨越千年医学对话:用AI技术解锁中医古籍知识,构建能够精准问答的智能语言模型,成就专业级古籍解读助手(LLAMA)

跨越千年医学对话:用AI技术解锁中医古籍知识,构建能够精准问答的智能语言模型,成就专业级古籍解读助手(LLAMA)。 介绍:首先在 Ziya-LLaMA-13B-V1基线模型的基础上加入中医教材、中医各类网站数据等语料库&a…

【爬虫逆向实战篇】定位加密参数、断点调试与JS代码分析

文章目录 1. 写在前面2. 确认加密参数3. 加密参数定位4. XHR断点调试 【作者主页】:吴秋霖 【作者介绍】:Python领域优质创作者、阿里云博客专家、华为云享专家。长期致力于Python与爬虫领域研究与开发工作! 【作者推荐】:对JS逆向…

爬取m3u8视频

网址:https://www.bhlsm.com/cupfoxplay/609-3-1/ 相关代码: #采集网址:https://www.bhlsm.com/cupfoxplay/609-3-1/ #正常视频网站:完整视频内容 # pip install pycryptodomex #流媒体文件:M3U8(把完整的…

React18源码: React调度中的3种优先级类型和Lane的位运算

优先级类型 React内部对于优先级的管理,贯穿运作流程的4个阶段(从输入到输出),根据其功能的不同,可以分为3种类型: 1 )fiber优先级(LanePriority) 位于 react-reconciler包,也就是L…

[ROS 系列学习教程] rosbag 命令行介绍

ROS 系列学习教程(总目录) 本文目录 rosbag 命令行1.1 rosbag check1.2 rosbag compress1.3 rosbag decompress1.4 rosbag filter1.5 rosbag fix1.6 rosbag info1.7 rosbag play1.8 rosbag record1.9 rosbag reindex 有时我们需要将 topic 中的数据保存下来以便后面分析&#x…

西门子S7-1500作为智能设备共享功能

本章节介绍了共享设备的功能,优势,使用要求,使用规则,如何将智能设备作为共享设备,实现一个智能设备同时与2个IO控制器进行通信的示例,以及常见问题。 一、共享设备功能概述 信号模块可以被不同的IO控制器…

SpringMVC 学习(三)之 @RequestMapping 注解

目录 1 RequestMapping 注解介绍 2 RequestMapping 注解的位置 3 RequestMapping 注解的 value 属性 4 RequestMapping 注解的 method 属性 5 RequestMapping 注解的 params 属性(了解) 6 RequestMapping 注解的 headers 属性(了解&…

Linux环境下基本指令

今天我们一起来认识一下Linux环境下一些基本的指令,这些指令是我们学习Linux的基础,只有掌握了这些指令,我们才能在Linux环境下进一步学习知识,话不多说,我们开始(以下演示操作是在云服务器的环境下&#x…

k8s-hpa控制器 16

hpa可通过metrics-server所提供pod的cpu或者内存的负载情况,从而动态拉伸控制器的副本数,从而达到后端的自动弹缩 官网:https://kubernetes.io/zh/docs/tasks/run-application/horizontal-pod-autoscalewalkthrough/ 上传镜像 创建hpa实例 …

【初始RabbitMQ】发布订阅的实现

发布确认原理 生产者将信道设置成 confirm 模式,一旦信道进入 confirm 模式,所有在该信道上面发布的消息都将会被指派一个唯一的 ID(从 1 开始),一旦消息被投递到所有匹配的队列之后,broker 就会发送一个确认给生产者(包含消息的…

C语言每日一题(60)对链表进行插入排序

题目链接 力扣网 147 对链表进行插入排序 题目描述 给定单个链表的头 head ,使用 插入排序 对链表进行排序,并返回 排序后链表的头 。 插入排序 算法的步骤: 插入排序是迭代的,每次只移动一个元素,直到所有元素可以形成一个有…

Puppeteer 使用实战:如何将自己的 CSDN 专栏文章导出并用于 Hexo 博客(二)

文章目录 上一篇效果演示Puppeteer 修改浏览器的默认下载位置控制并发数错误重试并发控制 错误重试源码 上一篇 Puppeteer 使用实战:如何将自己的 CSDN 专栏文章导出并用于 Hexo 博客(一) 效果演示 上一篇实现了一些基本功能,…

Python初学者必备:超级全面的基础知识详解

1. 数据类型和变量 Python使用缩进来组织代码块,一般使用4个空格的缩进.使用#来注释一行,其他每一行都是一个语句,当语句以冒号:结尾时,缩进的语句视为代码块.Python对大小写敏感. 1.1 整数 Python可以处理任意大小的整数,包括负整数,写法与数学上写法一致,例如:-…

联想开天昭阳N4620Z笔记本如何恢复出厂麒麟操作系统(图解)

联想开天昭阳N4620Z笔记本简单参数: 中央处理器:KX-6640MA G2 内存:8GB 固态硬盘:512GB SSD 显示器:14.0”FHD 电池:4Cell 操作系统:麒麟KOS中文RTM(试用版) 此款笔…

华为 OD 一面算法原题

2.2 亿彩票公布调查结果 昨天,闹得沸沸扬扬的《10 万中 2.2 亿》的彩票事件,迎来了官方公告。 简单来说,调查结果就是:一切正常,合规合法。 关于福利彩票事件,之前的推文我们已经分析过。 甚至在后面出现《…

如何在 CentOS 上安装 ONLYOFFICE 文档 8.0

使用社区版,您可以在本地服务器上安装 ONLYOFFICE 文档,并将在线编辑器与 ONLYOFFICE 协作平台或其他热门系统集成在一起。 ONLYOFFICE 文档是什么 ONLYOFFICE 文档是一个功能强大的文档编辑器,支持处理文本文档、电子表格、演示文稿、可填写…

微信小程序 ---- 生命周期

目录 生命周期 1. 小程序运行机制 2. 小程序更新机制 3. 生命周期介绍 4. 应用级别生命周期 5. 页面级别生命周期 6. 生命周期两个细节补充说明 7. 组件生命周期 总结 生命周期 1. 小程序运行机制 冷启动与热启动: 小程序启动可以分为两种情况&#xff0…

劳动的抽象度不同,则被AI淘汰的速度也不一样

概述 昨天,听了《刘润对话王建硕:Sora的到来,到底意味着什么》的直播,其中,王建硕提到了一个很有意思的观念:劳动的抽象度。 网上有一篇《面对 ChatGPT 大潮,应该从低抽象度劳动,向…

Android java中包的使用

一.包的使用 为了更好的实现项目中类的管理,提供包的概念。 package语句作为Java源文件的第一条语句,指明该文件中定义的类所在的包。(若缺省该语句,则指定为无名包)。 它的格式为:package 顶层包名.子包名 ; 二.java中主要的包…

uni-app 开发调试自动打开手机屏幕大小界面(Aidex移动端开发项目)

上效果: 下载Aidex的移动端项目并打开: 若依-ruoyi-AiDex-Uniapp: 若依-Ruoyi APP 移动解决方案,基于uniappuView封装的一套基础模版,开箱即用,免费开源,一份代码多终端适配,支持H5、支付宝小程…
推荐文章