您的浏览器不支持JavaScript,请开启后继续
Sora掘金一本通:AI短视频原理、提示词到商业盈利

Sora掘金一本通:AI短视频原理、提示词到商业盈利

  • 作者
  • 明机 编著

如何快速了解Sora文生视频这一强大模型,制作AI短视频,抢占市场先机,赚取第一桶金? 本书包括8章专题内容布局+73个官方视频示例分析+490多张图片全程图解,随书还赠送了8大资源:106分钟同步教学视频+111页PPT教学课件+112组AI视频生成提示词+119个效果文件+57集AI绘画教学视频+56集AI文案写作教学视频+15000多组AI绘画关键词等。具体内容从下面两条线展开...


  • ¥78.00

ISBN: 978-7-122-45340-2

版次: 1

出版时间: 2024-06-01

图书介绍

ISBN:978-7-122-45340-2

语种:汉文

开本:16

出版时间:2024-06-01

装帧:平

页数:180

编辑推荐

一本书全面精通Sora,成为AI短视频掘金高手! 技术原理+模型框架+功能详解+指令编写+提示词库+商业变现 8章专题内容布局+73个官方视频示例分析+490多张图片全程图解 随书还赠送了8大资源:106分钟同步教学视频+111页PPT教学课件+112组AI提示词+119个效果文件+57集AI绘画教学视频+56集AI文案写作教学视频+15000多组AI绘画关键词等

图书前言

◎ 市场优势
随着科技的飞速发展,人工智能已逐渐渗透到人们生活的方方面面,而AI短视频生成技术作为其中的一颗“新星”,更是受到了广泛关注。根据Mob研究院发布的报告显示,2023年中国短视频市场规模近3000亿,用户规模占整体网民的94.8%。这些数据表明,短视频市场正在迅速增长,用户规模庞大,且持续增长。
据市场研究公司Statista的报告,到2025年,全球AI视频技术的市场规模预计将达到120亿美元。根据艾媒咨询公司的报告显示,2023年中国AIGC产业规模约为143亿元,预计到2030年,产业规模有望达到11441亿元,这显示出AIGC产业在未来几年内具有巨大的增长潜力。
在这样的大背景下,我们策划编写了本书,为广大短视频创作者、影视制作人员、市场营销人员、AI技术爱好者与开发者、教育工作者,以及研究人员提供了一本关于Sora AI短视频生成技术的全面指南。
◎ 工具介绍
Sora作为一款引领短视频创作新时代的人工智能工具,它集成了先进的算法和模型架构,为创作者提供了前所未有的创作自由度和便捷性。Sora的独特之处在于其强大的生成式AI功能,使得创作者只需通过简单的指令和提示词库,就能让Sora为他们创作出独具匠心的短视频内容。
本书通过深入解读Sora的技术原理、功能特点、提示词优化及商业应用,帮助读者更好地掌握和利用AI技术生成高质量的短视频。通过学习本书内容,读者将能够全面掌握Sora AI短视频生成技术的核心原理、功能特点及实战应用,为自身在短视频创作、影视制作、市场营销等领域的发展提供有力支持。
◎ 本书特色
本书是一本全面、深入、实用的技术指南,从Sora的基本概念、技术原理到实际应用案例,进行了系统而全面的介绍,无论是初学者还是专业人士,都能从中找到所需的知识和信息。本书特色如下。
(1)73个官方示例,实战应用导向:为了让读者更好地将理论知识转化为实际操作,本书精选了73个官方展示的AI视频示例。这些示例涵盖了不同的题材和用途,旨在帮助读者快速掌握高效、高质量的短视频制作技巧。通过学习和模仿这些示例,读者将能够轻松提升自己的AI短视频制作水平,实现创意与技术的完美结合!
(2)80多个小节讲解,解析前沿技术:本书精心策划了8大章共80多个小节,全方位、多角度地深入解析了Sora这一前沿的AI短视频生成模型。通过对本书的专业解读,读者将能够掌握其核心技术原理与优势,不仅站在技术的前沿,更能轻松应对各种挑战,成为AI短视频领域的佼佼者。
(3)7大超值资源赠送,全面且丰富:为了给读者带来前所未有的学习体验,精心准备了7大超值资源赠送给读者,这些资源包括:教学视频+PPT教学课件+AI视频生成提示词+效果文件+AI绘画教学视频+AI文案写作教学视频+AI绘画关键词等,让您全方位了解AI短视频的魅力。
◎ 温馨提示
(1)版本更新:在编写本书时,是基于当前各种AI工具和网页平台的界面截取的实际操作图片,但本书从编辑到出版需要一段时间,这些工具的功能和界面可能会有变动,请在阅读时,根据书中的思路,举一反三,进行学习。
(2)提示词:也称为提示、文本描述(或描述)、文本指令(或指令)、关键词等。需要注意的是,即使是相同的提示词,Sora等AI模型每次生成的视频、图像效果也会有差别,这是模型基于算法与算力得出的新结果,是正常的,所以大家会看到书里的截图与视频有所区别。用同样的提示词,自己再制作时,出来的效果也会有差异。
(3)效果问题:本书所展示的示例效果,均来源于Sora官方发布的演示视频。鉴于Sora模型目前尚处于初期研发阶段,它不可避免地存在一些问题。例如,生成的人物面部表情可能显得不够自然,肢体动作也可能略显僵硬。此外,还可能出现多手多脚,以及其他不符合现实世界物理规律的现象。然而,我们深信这些问题都将在后续的版本中逐步得到改进和优化,为我们带来更加出色的短视频创作体验。
(4)使用问题:本书内容写于2024年2月底,此时Sora正处于内测阶段,因此,本书关于Sora具体生成视频的实战教程部分内容较少,建议大家关注书封底的QQ群,等Sora正式开源后,作者会赠送具体的制作教程,到时请读者朋友留意查收。
◎ 资源获取
如果读者需要获取书中案例的素材、视频和课件,请使用微信“扫一扫”功能按需扫描下列对应的二维码。
◎ 作者售后
本书由明机编著,参与编写的人员还有苏高等人,在此表示感谢。由于编者知识水平有限,书中难免有疏漏之处,恳请广大读者批评、指正,沟通和交流请联系微信:2633228153,添加时请输入关键词:明机。

作者简介

明机
·AI训练师:对人工智能三要素算法、算力、算据(数据)拥有深厚的研究,熟悉AI算法和模型特性,擅长使用TensorFlow、PyTorch等框架技术进行模型训练与产品开发;
·AI工程师:对Sora生成连贯视频序列的循环神经网络,Sora处理复杂视觉内容的空间时间补丁,Sora加快视频生成速度的自回归变压器等技术,Sora成为世界模拟器等技术掌握颇深;
·AI先行者:AI提示词库创作者,首批应用ChatGPT、gemini、Stable Diffusion 、Midjourney、DALLoE、Firefly、Sora、Pika、Runway等AI工具的从业人员,擅长AI文案编写、AI绘画与AI视频生成训练。

精彩书摘

如何快速了解Sora文生视频这一强大模型,制作AI短视频,抢占市场先机,赚取第一桶金?
本书包括8章专题内容布局+73个官方视频示例分析+490多张图片全程图解,随书还赠送了8大资源:106分钟同步教学视频+111页PPT教学课件+112组AI视频生成提示词+119个效果文件+57集AI绘画教学视频+56集AI文案写作教学视频+15000多组AI绘画关键词等。具体内容从下面两条线展开。
一条是技能线:从AI短视频的相关技术入手,介绍Sora的概念特点、基本能力、技术原理、模型架构、生成式AI功能、指令编写、提示词库、商业变现等内容,通过学习和实践,读者将能够充分发挥Sora的强大功能,创作出令人惊叹的短视频作品,实现自己的创作和商业目标。
一条是案例线:本书非常注重Sora的实际应用,并通过大量的视频案例分析,包括人像、风光、动物、植物、幻想、旅行等多种题材,同时涉及动画短片、电影预告片、无人机航拍视频、历史镜头视频、电商广告视频、游戏视频等多个领域,全方位展示了Sora在不同场景下的应用效果。
本书是一本不可多得的AI短视频生成技术指南,适合短视频创作者、影视制作人员、摄影师、市场营销人员、AI技术爱好者与开发者、教育工作者及研究人员等广大群体阅读。此外,本书还可以作为相关培训机构和职业院校的参考教材。

目录

第1章 认识Sora:强大的人工智能视频生成模型	1
1.1 Sora是什么	2
1.1.1 Sora的基本介绍	2
【示例1】:走在东京街头的时尚女性	3
1.1.2 Sora的功能特点	4
【示例2】:穿过东京郊区的火车窗外的倒影	4
1.1.3 Sora的竞品对比	6
【示例3】:坐在天空中的一片云上看书的年轻人	7
1.1.4 Sora的核心优势	9
1.1.5 Sora的创意用途	10
【示例4】:培养皿里的竹林和奔跑的熊猫	11
1.2 面对Sora,我们该思考的5个问题	12
1.2.1 文生视频模型为什么会火	12
【示例5】:在日落时分惬意地漫步	16
1.2.2 Sora的发布意味着什么	17
【示例6】:手机镜头下的未来城市风貌	18
1.2.3 我们与Sora有何关系	19
【示例7】:“云人闪电”的科幻电影片段	20
1.2.4 我们该如何应对Sora	21
1.2.5 普通人该怎么入局	23
【示例8】:冬日长毛猛犸象的壮丽景色	24

第2章 能力解析:Sora如何高效地生成视频	26
2.1 Sora的技术创新点	27
2.1.1 支持多样化视频格式	27
【示例9】:在大海中游动的海龟	27
2.1.2 改进的画面构图和框架	29
【示例10】:兔子和松鼠的奇妙混合物	30
2.1.3 语言理解与视频生成	31
【示例11】:不同的人物在不同的城市散步	33
2.1.4 多模态输入处理	34
【示例12】:无人机环绕拍摄的海边建筑	35
2.1.5 可变的持续时间、分辨率、宽高比	36
【示例13】:白发男人的特写镜头	37
2.2 Sora强大的视频生成能力	37
2.2.1 3D一致性:以3D的视角呈现物体和人物的运动	37
【示例14】:推镜头展示熙熙攘攘的东京城市街道	38
【示例15】:摇镜头展示令人惊叹的山水风光	39
2.2.2 长期一致性:保持视频中的人物和场景的不变	40
【示例16】:一只达尔马提亚狗从窗户向外看	41
2.2.3 世界交互模拟:模拟人物与环境之间简单的互动	42
【示例17】:模拟画家的创作过程	42
【示例18】:模拟人物吃汉堡的场景	42
2.2.4 模拟数字世界:探索与创造的无界数字世界	43
【示例19】:模拟《我的世界》游戏场景	43
2.2.5 复杂元素生成能力:打造出逼真的虚拟场景	44
【示例20】:一大堆老式电视播放着不同的节目	44
【示例21】:逼真的动画特写场景	46
2.2.6 多镜头生成能力:呈现出丰富的视觉盛宴	46
【示例22】:用不同的镜头展示的机器人	47
2.3 Sora面临的一些局限性和挑战	48
2.3.1 模拟物理世界的局限性	48
【示例23】:破碎的玻璃杯	49
2.3.2 生成长视频的难度	50
【示例24】:在沙漠中发现的塑料椅子	50
【示例25】:篮球通过篮筐后爆炸	51
2.3.3 理解复杂提示词的准确性	52
【示例26】:庆祝生日的温馨家庭场景	53
2.3.4 训练模型的复杂性	54
【示例27】:35毫米电影风格的跑步动作场景	55
2.3.5 提升视频生成的时效性	56
【示例28】:偏僻路上小狼嬉戏的场景	57

第3章 技术原理:解析Sora的技术特性与优势	59
3.1 解析Sora的技术原理	60
3.1.1 Sora如何根据文本生成内容——Diffusion模型	60
3.1.2 Sora如何处理复杂视觉内容——时间空间补丁	62
3.1.3 Sora如何生成连贯的视频序列——循环神经网络	63
【示例29】:中国农历新年庆祝视频	64
3.1.4 Sora如何生成不同风格的视频——生成对抗网络	65
3.1.5 Sora如何加快视频的生成速度——自回归变换器	67
3.2 Sora在视频生成过程中的3个关键步骤	68
3.2.1 步骤1:视频压缩网络	68
【示例30】:一窝金毛寻回犬在雪地里玩耍	68
3.2.2 步骤2:时间空间潜在补丁提取	69
3.2.3 步骤3:视频生成的Transformer模型	70
【示例31】:淘金热期间加利福尼亚州的历史录像	70
3.3 Sora技术的未来展望	71
3.3.1 技术革新与性能升级:速度更快、稳定性更强、体验更流畅	71
3.3.2 跨领域融合与拓展应用:让生活更加多姿多彩、充满无限可能	72

第4章 模型架构:Sora的基础是世界通用模型	73
4.1 认识世界通用模型	74
4.1.1 什么是世界通用模型	74
4.1.2 世界通用模型的作用是什么	75
【示例32】:Santorini的航拍建筑美景	76
4.1.3 多模态模型促进AI更好地理解真实世界	77
【示例33】:一列蒸汽火车行驶在高架桥上	78
4.1.4 世界通用模型打破了虚拟与现实的边界	79
【示例34】:惬意漫步的南非妇女	79
4.1.5 世界通用模型的代表——Runway	80
4.2 Sora将视频生成模型作为世界模拟器	81
4.2.1 用大语言模型的方法理解视频	81
【示例35】:一群纸飞机在茂密的丛林中飞舞	82
【示例36】:愉快漫步的老人	83
【示例37】:白雪皑皑的东京城	84
4.2.2 实现对物理世界的“涌现”	85
【示例38】:可爱的达尔马提亚狗	85
4.2.3 模拟真实物理世界的运动	87
【示例39】:壮观的海岸风光	88
4.3 Sora模型训练的核心技术	90
4.3.1 自然语言理解	90
4.3.2 生成式人工智能模型	92
【示例40】:老年人的悠闲生活与美丽的自然风光	93
4.3.3 场景构建与精细化渲染	96
4.3.4 AI驱动的动画技术	98
【示例41】:眨眼的特写镜头	99
4.3.5 个性化定制与持续优化	100
【示例42】:不同风格的袋鼠漫步场景	101

第5章 功能详解:使用Sora快速生成视频	105
5.1 Sora的文生视频功能	106
5.1.1 Sora的注册方法	106
5.1.2 申请Sora的内测资格	110
5.1.3 使用文生视频功能	113
5.2 Sora的其他AI生成功能	114
5.2.1 图生视频:为DALL·E图像制作动画	114
【示例43】:活泼可爱的柴犬	115
【示例44】:一个多样化的怪物家族	116
【示例45】:由字母组成的云朵图片	117
【示例46】:冲浪者在历史大厅中驾驭巨浪	118
5.2.2 视频生视频:向前或向后扩展视频的时长	119
【示例47】:旧金山的高空城市缆车	119
【示例48】:永无止境的骑行场景	122
5.2.3 视频到视频编辑:转换视频的风格和环境	123
【示例49】:飞驰在丛林中的跑车	123
5.2.4 连接视频功能:创建神奇的无缝过渡效果	125
【示例50】:无人机视频与蝴蝶视频的连接	126
【示例51】:越野车视频与豹子视频的连接	128
5.2.5 图像生成功能:为用户带来卓越的体验	130

第6章 指令编写:优化提示词提升Sora的生成效果	133
6.1 编写Sora提示词的基础思路	134
6.1.1 明确具体的视频元素	134
【示例52】:一只在拍摄视频的柯基犬	134
6.1.2 详细描述场景细节	135
【示例53】:一朵花生长的定格动画	135
6.1.3 创造性地使用提示词	136
【示例54】:一群鱼在纽约的街道上游动	136
6.1.4 构思引人入胜的角色和情节	137
【示例55】:一只猫叫醒正在睡觉的主人	137
6.1.5 用逐步引导的方式构建提示词	139
【示例56】:挤满了工人的建筑工地	139
6.2 Sora提示词的编写技巧	140
6.2.1 如何选择Sora的提示词	140
【示例57】:基纳巴丹干河上的野生动物	141
6.2.2 Sora提示词的编写顺序	142
【示例58】:美术馆内的艺术盛宴	143
6.2.3 编写Sora提示词的注意事项	143
【示例59】:跳迪斯科舞的卡通袋鼠	144

第7章 提示词库:打造专业级视频效果必备的要素	145
7.1 Sora内容型提示词	146
7.1.1 主体特征	146
【示例60】:在南极洲愉快漫步的女人	147
【示例61】:不同主体特征的视频效果	148
7.1.2 场景特征	150
【示例62】:色彩斑斓的鱼类和海洋生物	151
7.1.3 艺术风格	152
【示例63】:太空冒险故事的电影预告片	153
7.2 Sora标准化提示词	155
7.2.1 画面构图	155
【示例64】:变色龙的特写镜头	156
7.2.2 视线角度	157
【示例65】:维多利亚冠鸽的侧面视角	158
7.2.3 画面景别	159
【示例66】:玻璃球体里的小矮人	160
7.2.4 色彩色调	161
【示例67】:在茂密的花园里奔跑的虎斑猫	162
7.2.5 环境光线	163
【示例68】:月光下的狼嚎剪影动画	164
【示例69】:在霓虹灯城市中嬉戏的小狗	165
7.2.6 镜头参数	165
【示例70】:深海中的大章鱼和帝王蟹之战	166

第8章 商业变现:从文本到视频的创收之路	168
8.1 Sora未来可能的商业场景应用	169
8.1.1 电商产品展示	169
8.1.2 视频广告制作	170
8.1.3 游戏开发和动画片制作	170
【示例71】:展示游戏《我的世界》	171
【示例72】:水獭的热带冲浪冒险	172
8.1.4 电影电视节目制作	173
【示例73】:海盗船激战瞬间	173
8.1.5 教育内容制作	174
8.2 如何利用Sora实现多渠道变现	174
8.2.1 广告收入与赞助变现	175
8.2.2 知识付费变现	175
8.2.3 提示词交易变现	176
8.2.4 内容创作变现	177
8.2.5 Sora的其他变现方式	178

发送电子邮件联系我们