Sora了解资料

news/发布时间2024/5/15 17:55:54

一、基本介绍

1.1sora

在 2024 年 2 月 16 日,Open AI 宣布推出全新的生成式人工智能模型“Sora”。据了解,通过文本指令,Sora 可以直接输出长达 60 秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。
这意味着,继文本、图像之后,OpenAI 将其先进的 AI 技术拓展到了视频领域。OpenAI 亦表示,Sora 是能够理解和模拟现实世界的模型的基础,这一能力将是实现 AGI(通用人工智能)的重要里程碑。
对于 OpenAI 视频生成模型的出现,业内其实早有预期,但仍有人评价称“比想象中来得更快”,亦有人振奋地表示“我们真的看到新工业革命来临”。

Sora 官方网址:
https://openai.com/sora

目前 OpenAI 官网上已经更新了 48 个 Sora 生成的视频 demo,色彩艳丽,效果逼真。
官方网站:https://openai.com/sora?open_in_browser=true
2024 年的真正红利点:文生视频。
友情提示:目前 sora 没有对外开放,也没有内测申请,请不要相信任何账号买卖,课程培训!!!

1.2获取问题


需要强调给大家的一点是,截止至2024年2月18日,Sora目前没有公开测试,也没有内测申请渠道,国内是没有渠道可以去尝试的,下面这个信息源不一定真实,大家仅供参考。

1.3模型效果对比

1.4AI 视频玩家盘点

据不完全统计,过去一年来全球 AI 生成视频类赛道的融资已经超过数 10 亿美元,其中大部分的公司都以种子轮、A 轮为主。就在今年 1 月底,A16Z 还专门针对 AI 视频生成领域做了一个全面的回顾和展望,并盘点了市场上超过 20 个明星产品。

以上图片是2023 年 AI 视频生成行业的参与者盘点

二,Sora 的 6 大优势

(1)准确性和多样性:

Sora 的显著特征之一是能够准确解释长达 135 个单词的长提示。它可以准确地解释用户提供的文本输入,并生成具有各种场景和人物的高质量视频剪辑。这一新工具可将简短的文本描述转化成长达 1 分钟的高清视频。它涵盖了广泛的主题,从人物和动物到郁郁葱葱的风景、城市场景、花园,甚至是水下的纽约市,可根据用户的要求提供多样化的内容。


(2)强大的语言理解:

OpenAI 利用 Dall-E 模型的 re-captioning(重述要点)技术,生成视觉训练数据的描述性字幕,不仅能提高文本的准确性,还能提升视频的整体质量。此外,与 DALL·E 3 类似,OpenAI 还利用 GPT 技术将简短的用户提示转换为更长的详细转译,并将其发送到视频模型。这使 Sora 能够精确地按照用户提示生成高质量的视频。


(3)以图/视频生成视频:

Sora 除了可以将文本转化为视频,还能接受其他类型的输入提示,如已经存在的图像或视频。这使 Sora 能够执行广泛的图像和视频编辑任务,如创建完美的循环视频、将静态图像转化为动画、向前或向后扩展视频等。OpenAI 在报告中展示了基于 DALL·E 2 和 DALL·E 3 的图像生成的 demo 视频。这不仅证明了 Sora 的强大功能,还展示了它在图像和视频编辑领域的无限潜力。


(4)视频扩展功能:

由于可接受多样化的输入提示,用户可以根据图像创建视频或补充现有视频。作为基于 Transformer 的扩散模型,Sora 还能沿时间线向前或向后扩展视频。从 OpenAI 提供的 4 个 demo 视频看,都从同一个视频片段开始,向时间线的过去进行延伸。因此,尽管开头不同,但视频结局都是相同的。


(5)优异的设备适配性:

Sora 具备出色的采样能力,从宽屏的 1920x1080p 到竖屏的 1080x1920,两者之间的任何视频尺寸都能轻松应对。这意味着 Sora 能够为各种设备生成与其原始纵横比完美匹配的内容。而在生成高分辨率内容之前,Sora 还能以小尺寸迅速创建内容原型。


(6)场景和物体的一致性和连续性:

Sora 可以生成带有动态视角变化的视频,人物和场景元素在三维空间中的移动会显得更加自然。Sora 能够很好地处理遮挡问题。现有模型的一个问题是,当物体离开视野时,它们可能无法对其进行追踪。而通过一次性提供多帧预测,Sora 可确保画面主体即使暂时离开视野也能保持不变。

三,Sora 可能带来的影响

如果 Sora 能够真正意义上实现文生视频,可能会带来哪些影响呢?
1、没有演员的影视作品出现,对演员来说是个小挑战,将出现真正的“虚拟偶像”,此前的二次元人物并没有真正达到“偶像”的级别。
2、利好编剧行业,剧本、文本创作力成为核心竞争力。
3、Sora 可能才是真正的文生视频,此前的文生视频大多只有 2 秒,仅仅是对象的小幅度移动。
4、OpenAI 继续拉大领先程度,对众多还在进行大模型测试打分 pk 的厂商,构成压力。
5、直接的影响是影视行业,特别是特效行业。使用 AI 来制作一些特效和高风险的镜头,可以大幅降低拍摄成本,也可以避免很多危险。
6、摄影师行业也会受到影响,用文本来生成一些视频,可以省去很多拍摄工作。
7、短视频流行开以后,视频剪辑师也随之成为一个热门职业。如果视频剪辑的工作可以用 AI 来代替,可能会有很多视频剪辑师失业。
8、对于很多短视频创作者来说,用 AI 来替代繁琐的剪辑工作,可以大幅提高工作效率。
9、很多歌手拍摄 MV 都是大成本制作,如果可以用 AI 来生成所需要的 MV 画面,也可以省去很大一部分制作成本。10、另外,如果真正意义上的文生视频得以实现,可能会有不法份子利用这项技术实施新手段的违法犯罪。

不过,从 Sora 官网目前展示的视频画面效果来看,效果还没那么逼近真实,短期内不会产生让行业失业,但会有辅助作用,做个动画片应该问题不大。
在 Sora 官网,OpenAI 表示,Sora 是能够理解和模拟现实世界的模型的基础,OpenAI 相信这一能力将是实现 AGI 的重要里程碑。
至于 Sora 文生视频到底能带来多大影响,会不会翻车,还需要“让子弹飞一会儿”。

四、赚钱方法

1、搞流量

流量=钱,AI 领域新产品的出现总会伴随着所有人的关注,Sora 在视频生成领域的出现不亚于大语言模型的 GPT-4.0,此时的流量生意总是能最先拿到结果的生意,现在大把的 Sora 公众号爆文,爆款短视频,用来获取流量非常可观,咱们先不管是捧还是骂,话题度在。

2、卖账号


目前的 Sora 模型还没有对普通用户开放,不过大家都已经迫不及待了。就像当年的 ChatGPT 一样,OpenAI 的账号销售一定能继续大卖。只是国内的大语言模型和国外的相比,许多普通人并不能进行完整地分辨,等到文生图的时候,差距逐渐显现,等到真正 Sora 对普通用户开放的时候,国内外的差距就比较明显了。这个时候,会有更多的人想用上 Sora。

3、卖课程


课程永远是 AI 行业不缺的赚钱渠道,目前 AI 行业做课程赚的最多的当属李一舟,据说年入 1 个亿,而 Sora 还没开放账号,已经有课程上线了,这就是“搞钱”的原动力!AI 工具使用的课程会长期成为 AI 行业的赚钱赛道,也算是先行者的付费布道,课程要在有产品以后发布。

4、套壳


众所周知的原因,国内乃至全国的套壳网站和应用众多,只要你有一定的流量或者推广渠道,套壳网站会为你持续带来收益。目前 Sora 的推出,已经有人开始通过套壳网站赚到第一笔年费了。

目前的套路是注册含有关键词 sora 的域名,同时应用商店提交 Sora 相关的 app,同时接入 Runway 等产品的 API,先把流量跑出来,等到 Openai 发布 Sora API 的时候,再进行切换,从而丝滑过渡。

5、投资


如果你是二级市场投资客,那么关注 AI 行业一定能让你赚到(中国股市可能除外),Sora 的推出,利空哪家公司呢?
Adobe! 
受 Sora 发布的影响,Adobe2 月 16 日当日跌幅达到 7.41%。如果此前做空 Adobe,那是要赚上一笔了。

6、提示词交易


去年的 AI 绘画提示词交易很火,今年 AI 文生视频的提示词一定也会有市场,从提示词打包交易到提示词交易平台。
日光之下并不新事。


7 、剧本创作


文生视频提示词的升级是视频的剧本创作,无论是长视频还是短视频,更依赖剧本的创作,这更依赖于创作者。
从这个角度来看,Sora 的发布是非常利好内容创作者。如果把未来的视频创作比如电影创作的话,那么编剧的权重在进一步强化,或者是编剧、导演和制片在进一步融合。大团队面临挑战,而小团队的机会在进一步上升。


8、视频制作


视频生成这个业务勿庸多言,Sora 就是干这个的,大家只要充分地学习和试错,做出更好的视频(质量和数量),赚钱的机会一定有。在 AI 绘画时代已经切入的团队和个体会更有机会,毕竟前期的铺垫已经足够了,学习成本很低。


9、 原业务优化


AI 工具对生产力的提升是毋庸置疑的,如何直接用 AI 工具进行商业变现,不如考虑在原有的业务上进行 AI 化。
商业的竞争说到底还是生产率的竞争,成本打下来了,自然就有价格调整的空间了,也就有更大的获客和竞争优势了。只要是涉及视频类的公司(我说的是“涉及”,这与 08 部分并不一致),都应该重视 Sora 的使用,考虑如何将其融入进原业务。


10、 企业服务


部分做传统行业的公司并没有自我 AI 化的能力,那么就可以有相关的 AI 团队来进行咨询服务,从做事的本质上来讲有点像以前的咨询公司,只是这样的咨询公司对 AI 理解和使用更深入,同时这样的咨询公司一定是高度关注和践行 RPA(机器人流程自动化)。
除此以外,企业服务的另一种商业化形式就是商业化的软件工具,在行业领域内融合专业知识和生产流程,再利用像 Sora 这样的 API 实现相应的生产功能,最终商业变现。

11.Sora+电商


用 Sora 生成各类电商产品宣传视频投流,或者制作各类短视频,嵌入产品进行推广,参考 AI 模特变装、虚拟试衣等。
12.开发与 Sora 相关的网站或工具
针对具备技术背景的人士,开发与 Sora 相关的网站或工具,如导航网站或 AI 写真工具,以此获取收益。

五,AI心得


1,AI 不是风口,是未来深入到生活,工作,乃至思考的必备工具。
2,AI 的技术迭代日新月异,你可以怀疑当前的缺陷,但你不能怀疑 AI 不断智能的趋势。
3,AI 进化速度太快,其实会有人为干预,你无法想象 AI 来的太快,社会还没反应过来,政府要面临怎样的压力。
4,普通人多研究 AI 应用,把 AI 当做自己的思考一部分,这样才能保持不被淘汰。
5,不要过度恐慌 AI 带来的变革,但是容易被替代的岗位也不要太乐观。
6,普通人完全可以参与 AI 带来的机遇,也许你不懂技术,但是你可以认真研究应用场景,甚至探索新的应用场景,给更多的人做示范案例。
7,多看看国外的 AI 技术变革,国内一直在追国外的技术,其实差距还不止一点点,每次革命性的 AI 节点都是国外技术推动的。
8,在 AI 赛道创业,明显的是出海的创业项目增多了,这是很好的一个选择,海外市场比国内大得多,这是少有的国内国外一致进行的技术革命。
9,国内的各大内容平台,在迎合 AI 生产内容,甚至是不得不接受 AI 生产内容,因为这是趋势。
10,谁掌握了先进的生产工具,谁就是金字塔顶尖的那批人,这就是 AI 带来的机遇。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.bcls.cn/WcLO/1310.shtml

如若内容造成侵权/违法违规/事实不符,请联系编程老四网进行投诉反馈email:xxxxxxxx@qq.com,一经查实,立即删除!

相关文章

Spring中常见的注解

1 spring注解介绍 Spring Framework是一个开源的Java平台,广泛用于创建高性能的企业应用程序。随着Spring的发展,注解(Annotation)已经成为了配置Spring应用程序的主要方式,逐渐取代了传统的XML配置。使用注解可以使代…

9、使用 ChatGPT 的 GPT 制作自己的 GPT!

使用 ChatGPT 的 GPT 制作自己的 GPT! 想用自己的 GPT 超越 GPT ChatGPT 吗?那么让我们 GPT GPT 吧! 山姆 奥特曼利用这个机会在推特上宣传 GPTs 的同时还猛烈抨击了埃隆的格罗克。 GPTs概览 他们来了! 在上周刚刚宣布之后,OpenAI 现在推出了其雄心勃勃的新 ChatGPT…

开源数据可视化应用程序JSON Crack

什么是 JSON Crack ? JSON Crack 是一款免费的开源数据可视化应用程序,能够将 JSON、YAML、XML、CSV 等数据格式可视化为交互式图表。凭借其直观且用户友好的界面,JSON Crack 可以轻松探索、分析和理解即使是最复杂的数据结构。无论您是从事大…

数据结构--排序

数据结构--排序 1. 各类排序算法的性质2. 插入排序2.1 直接插入排序2.2 折半插入排序 3. 希尔排序4. 交换排序4.2 冒泡排序 5. 快速排序6. 选择排序6.1 简单选择排序6.2 堆排序 7. 归并排序8. 基数排序 1. 各类排序算法的性质 2. 插入排序 2.1 直接插入排序 2.2 折半插入排序 …

openai公司的chatgpt-3.5参数库内还未增加sora的语料信息

openai公司的chatgpt-3.5参数库内还未增加sora的语料信息!我想通过openai公司的chatgpt3.5来了解一下关于sora的技术信息,结果呢,它竟然回答不知道sora是什么。看来,sora的语料库信息还未来得及加入chatgpt3.5的训练模型中。 如图…

vue的十大面试题详情

1 v-show与v-if区别 v-if与v-show可以根据条件的结果,来决定是否显示指定内容&#xff1a; v-if: 条件不满足时, 元素不会存在. v-show: 条件不满足时, 元素不会显示(但仍然存在). <div id"app"><button click"show !show">点我</but…

计算机视觉基础【OpenCV轻松入门】:获取图像的ROI

OpenCV的基础是处理图像&#xff0c;而图像的基础是矩阵。 因此&#xff0c;如何使用好矩阵是非常关键的。 下面我们通过一个具体的实例来展示如何通过Python和OpenCV对矩阵进行操作&#xff0c;从而更好地实现对图像的处理。 ROI&#xff08;Region of Interest&#xff09;是…

【Spring】循环依赖

目录标题 什么是循环依赖循环依赖场景Java SE 演示Spring 容器演示三级缓存核心知识三级缓存四大方法三级缓存中的迁移 三级缓存源码分析源码思维导图 源码图例课前问题推荐阅读 循环依赖是什么&#xff1f;循环依赖的场景有哪一些&#xff1f;三级缓存分别是什么&#xff1f;三…

HarmonyOS4.0系统性深入开发34栅格布局(GridRow/GridCol)

栅格布局&#xff08;GridRow/GridCol&#xff09; 概述 栅格布局是一种通用的辅助定位工具&#xff0c;对移动设备的界面设计有较好的借鉴作用。主要优势包括&#xff1a; 提供可循的规律&#xff1a;栅格布局可以为布局提供规律性的结构&#xff0c;解决多尺寸多设备的动态…

HarmonyOS4.0系列——08、整合UI常用组件

HarmonyOS4.0 系列——08、UI 组件 Blank Blank 组件在横竖屏占满空余空间效果 // xxx.ets Entry Component struct BlankExample {build() {Column() {Row() {Text(Button).fontSize(18)Blank()Toggle({type: ToggleType.Switch}).margin({top: 14,bottom: 14,left: 6,righ…

多线程相关(1)

线程调度 线程状态&#xff1a;状态切换阻塞与唤醒阻塞唤醒 wait 与 sleep创建线程方式 线程是cpu任务调度的最小执行单位&#xff0c;每个线程拥有自己独立的程序计数器、虚拟机栈、本地方法栈。 线程状态&#xff1a; 线程状态包括&#xff1a;创建、就绪、运行、阻塞、死亡…

ipad作为扩展屏的最简单方式(仅需在同一局域网下,无需数据线)

ipad和win都下载安装toDesk&#xff0c;并且都处于同一局域网下 连接ipad&#xff0c;在ipad中输入win设备的设备密码和临时密码&#xff0c;连接上后可以看到ipad会是win屏幕的镜像&#xff0c;此时退出连接&#xff0c;准备以扩展模式再次连接。 注意&#xff0c;如果直接从…

Java 正则表达式 Pattern类和Matcher类

java.util.regex包主要包括三个类&#xff1a; PatternMatcherPatternSyntaxExcepiton Pattern类 Pattern对象是一个正则表达式对象。Pattern类没有公共的构造方法。要创建一个Pattern对象&#xff0c;需要调用其公共静态方法。该方法接收一个正则表达式作为它的第一个参数。…

七、MyBatis-Plus高级用法:最优化持久层开发

目录 一、MyBatis-Plus快速入门 1.1 简介 1.2 快速入门 二、MyBatis-Plus核心功能 2.1 基于Mapper接口CRUD Insert方法 Delete方法 Update方法 Select方法 自定义和多表映射 2.2 基于Service接口CRUD 对比Mapper接口CRUD区别&#xff1a; 使用Iservice接口方式 CRUD方…

[嵌入式系统-32]:RT-Thread -17- 任务、进程、线程的区别

目录 一、基本概念澄清 1.1 任务 1.2 进程 1.3 线程 1.4 比较 1.5 任务VS进程 1.6 进程 VS 线程 1.7 任务 进程 线程 发展历史 任务&#xff08;Task&#xff09;&#xff1a; 进程&#xff08;Process&#xff09;&#xff1a; 线程&#xff08;Thread&#xff09;…

MAC VSCODE g++编译器无法编译C++11语法的 解决办法(CodeRunner版本)

如果你是使用的 codeRunner 这个插件&#xff0c;就是这个按钮 coderunner的原理大致是&#xff1a;先判断你这是什么语言&#xff0c;然后有一个 code-runner.executorMap 来对应各个语言是用什么执行语句 我发现&#xff0c;我修改之前&#xff08;无法执行C11语法的原因是&a…

SQL笔记-多表查询(合并记录新增字段)

比如要统计2张表的所有数据&#xff0c;这两张表无关联关系&#xff0c;统计的数据需要在同一行&#xff1a; SELECT (SELECT COUNT(*) FROM reptile_csdn_article) AS table1_count, (SELECT COUNT(*) FROM reptile_tag_type) AS table2_count 运行截图如下&#xff1a; 大于…

Flink join详解

Flink SQL支持对动态表进行复杂而灵活的连接操作。 为了处理不同的场景&#xff0c;需要多种查询语义&#xff0c;因此有几种不同类型的 Join。 默认情况下&#xff0c;joins 的顺序是没有优化的。表的 join 顺序是在 FROM 从句指定的。可以通过把更新频率最低的表放在第一个、…

PyCharm - Script parameters (脚本参数)

PyCharm - Script parameters [脚本参数] References Run -> Edit Configurations… -> Run/Debug Configurations -> Configuration -> Script parameters 命令行&#xff1a; python display_yolo_log.py ./person_training_log/person_train_log_DIMM40_stdout…

力扣题目训练(17)

2024年2月10日力扣题目训练 2024年2月10日力扣题目训练551. 学生出勤记录 I557. 反转字符串中的单词 III559. N 叉树的最大深度241. 为运算表达式设计优先级260. 只出现一次的数字 III126. 单词接龙 II 2024年2月10日力扣题目训练 2024年2月10日第十七天编程训练&#xff0c;今…
推荐文章