Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND APPARATUS FOR CONVERTING PICTURE INTO VIDEO, AND DEVICE AND STORAGE MEDIUM
Document Type and Number:
WIPO Patent Application WO/2022/071875
Kind Code:
A1
Abstract:
A method and apparatus for converting a picture into a video, and a device and a storage medium. The method comprises: segmenting an original picture to obtain a foreground region and a background region; performing iterative transformation of visual depth on the background region, and storing, as a picture frame, an image obtained from each transformation, so as to obtain a plurality of frames of images, wherein the iterative transformation comprises performing visual depth transformation at least twice; and splicing the plurality of frames of images to obtain a target video. By means of the method for converting a picture into a video provided in the embodiments of the present disclosure, a plurality of images, which are produced by means of performing iterative transformation of visual depth on an image in a background region, are spliced, so as to obtain a video album having a foreground image in focus and a background image with a Hitchcock transformation effect, and there is no need to make the album manually and the convenience of album production is improved.

Inventors:
ZHANG SHUPENG (CN)
QIU BOHENG (CN)
WANG PENG (US)
LIAO JIE (US)
Application Number:
PCT/SG2021/050522
Publication Date:
April 07, 2022
Filing Date:
August 30, 2021
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
LEMON INC (SG)
International Classes:
H04N13/128; G06T7/194; G06N3/02; G06T7/10; H04N21/44
Foreign References:
CN108616745A2018-10-02
CN111447428A2020-07-24
US20180139432A12018-05-17
CN110602479A2019-12-20
US20120051625A12012-03-01
CN103024408A2013-04-03
CN202011063249A2020-09-30
Other References:
See also references of EP 4171027A4
Attorney, Agent or Firm:
POH, Chee Kian, Daniel (SG)
Download PDF:
Claims:
权 利要 求 书

1、 一种图片转视频 的方法 , 包括: 对原始 图片进行 分割, 获得前景区域 和背景 区域; 对所述 背景区域 进行视觉深 度的迭代 变换, 并将每次变换 得到的 图像存 储为 画面帧,得到 多帧图像 ; 其中, 迭代变换包括至少两次视 觉深度的变换; 将所述 多帧图像 进行拼接 , 获得目标视频。

2、 根据权利要求 1所述的方法 , 其中, 对原始图片进行分割, 获得前景 区域 和背景 区域, 包括: 对原始 图片中的 目标物体 进行识别; 将所述 目标物体 所在的 区域作为前 景区域进行 分割, 获得前景区域和背 景 区域; 其中, 背景区域为原始 图片中除 目标物体所 在的区域 之外的 区域。

3、根据权 利要求 2所述的方法 , 其中, 将所述目标物体所在的区域 作为 前景 区域进行 分割, 获得前景区域 和背景 区域, 包括: 获取所 述前景 区域的中心 点深度; 基于 所述中心点 深度对所 述前景 区域的像素 点进行深度 平滑处理 , 对所 述背 景区域和 所述前景 区域分别 进行边缘深 度锐化处理 , 获得处理后的前 景 区域 和背景 区域。

4、根据权 利要求 3所述的方法 , 其中, 对所述背景区域进行视觉深度 的 迭代 变换, 包括: 基于设 定机器 学习模型,将 背景区域 中抠除前景 的区域进 行图像的 补齐; 对补齐后 的背景 区域进行视 觉深度的 迭代变换 。

5、根据权 利要求 3所述的方法 , 其中, 对所述背景区域进行视觉深度 的 迭代 变换, 包括: 基于 所述中心点 深度, 对所述背景 区域的像 素点的深 度按照第 一设定步 长进行 由近到远 的变换。

6、根据权 利要求 3所述的方法 , 其中, 对所述背景区域进行视觉深度 的 迭代 变换, 包括: 基于 所述中心点 深度, 对所述背景 区域的像 素点的深 度按照第 二设定步 长进行 由远到近 的变换。 7、 根据权利要求 1-6任一所述的方法 , 其中, 原始图片为用户输入或者 选中 的图片, 若原始图 片包括至少 两张, 则针对每张原 始图片, 执行对原始 图片 进行分割 , 获得前景区域和 背景区域; 对所述背景区域进行 视觉深度 的 迭代 变换, 并将每次变换 得到的 图像存储为 画面帧, 得到多帧图像 ; 将所述 多帧 图像进行拼 接, 获得目标视频 的操作; 获得至少 两个目标视 频; 在获得 至少两个 目标视频之 后, 还包括: 对所述 至少两个 目标视频按 照设定顺 序进行排序 ; 采用在 相邻 目标视频间添加 设定转场特 效的方 式对排序后 的至少 两个目 标视频 进行拼接 ; 对拼接 后的至少 两个目标 视频进行渲 染, 获得最终的视频 。

8、 根据权利要求 1-7任一所述的方法 , 其中, 所述前景区域包括人像 区 域。

9、 一种图片转视频 的装置 , 包括: 区域获 取模块 , 用于对原始图片进行 分割, 获得前景 区域和背景 区域; 视觉深 度变换模 块, 用于对所述背景 区域进行视 觉深度 的迭代变换 , 并 将每 次变换得到 的图像存 储为画面 帧, 得到多帧图像; 其中, 迭代变换包括 至少 两次视觉深 度的变换 ; 目标视 频获取模 块, 用于将所述多帧 图像进行拼 接, 获得目标视频 。

10、 一种电子设备 , 包括: 一个或 多个处理 装置; 存储装 置, 用于存储一个 或多个指 令; 当所述 一个或 多个指令被 所述一个 或多个处 理装置执 行, 使得所述一个 或多 个处理装 置实现如权 利要求 1-8中任一所述的 图片转视频 的方法。

11、 一种计算机可读 存储介质 , 其上存储有计算机 程序, 其中, 该程序 被处 理装置执行 时实现如权 利要求 1-8中任一所述的 图片转视频 的方法。

Description:
图片转视频 的方法 、 装置、 设备及存储介质 本申请 要求于 2020年 9月 30日提交的 中国专利 申请第 202011063249.9 的优 先权, 该中国专利 申请的全文 通过引用 的方式结合 于此以作 为本申请 的 一部 分。 技术领 域 本公 开实施例涉 及一种 图片转视频的 方法、 装置、 设备及存储介质 。 背景技 术 随着 智能设备的 不断普及 , 拍照功能已经成 为手机中 不可或缺 的一个功 能 。 目前, 手机拍出来的照片只 是一个静 态的图片 , 趣味性差。 希区柯 克式移动 变焦技术 , 应用于影视作品 中, 通过推轨镜头和 变焦镜 头, 拍摄出被拍摄主体和 背景间的 距离变换 , 以营造画面、 空间扭曲的视 觉 效果 , 带领观众进入 主角的心 理状态 。 希区柯克式移 动变焦技 术的原理 是: 视频 拍摄过程 中焦段的 变换。 在保证视频的每 一帧图像 中主体所 占比例不 变 的前 提下, 在长焦段和 广角段间切 换, 也就是说, 相对于被拍摄 主体, 将镜 头拉 近或者拉 远的同时镜 头变焦进行 拍摄。 这种技术一般 都需要借 助专业拍 摄设备 , 在拉近或者拉远 的过程 中进行镜头焦 距无级切 换, 而目前移动终端 上的 镜头大部 分都是不 可变焦的镜 头或者由 几个不 同焦段的镜 头构成, 而无 法进 行希区柯 克式移动 变焦技术的 拍摄, 进行希区柯克 式移动 变焦技术的 拍 摄具 有局限性 。 发明 内容 本公 开实施例提 供一种 图片转视频的 方法、 装置、 设备及存储介质 , 可 以 实现将静态 图片转换为动 态视频, 实现前景图像聚焦, 背景图像希区柯克 变换 的影集制作 , 无需手动制动 , 提高影集制作的便 捷性。 第一 方面, 本公开实施例 提供了一 种图片转视 频的方法 , 包括: 对原始 图片进行 分割, 获得前景区域 和背景 区域; 对所述 背景区域 进行视觉深 度的迭代 变换, 并将每次变换 得到的 图像存 储为 画面帧,得到 多帧图像 ; 其中, 迭代变换包括至少两次视 觉深度的变换; 将所述 多帧图像 进行拼接 , 获得目标视频。 第二 方面, 本公开实施例 还提供 了一种图片转 视频的装 置, 包括: 区域获 取模块 , 用于对原始图片进行 分割, 获得前景 区域和背景 区域; 视觉深 度变换模 块, 用于对所述背景 区域进行视 觉深度 的迭代变换 , 并 将每 次变换得到 的图像存 储为画面 帧, 得到多帧图像; 其中, 迭代变换包括 至少 两次视觉深 度的变换 ; 目标视 频获取模 块, 用于将所述多帧 图像进行拼 接, 获得目标视频 。 第三 方面, 本公开实施例还提 供了一种 电子设备 , , 所述电子设备包括: 一个或 多个处理 装置; 存储装 置, 用于存储一个 或多个指 令; 当所述 一个或 多个指令被 所述一个 或多个处 理装置执 行, 使得所述一个 或多 个处理装 置实现如本 公开实施 例所述的 图片转视频 的方法。 第四 方面, 本公开实施例 还公开了一 种计算机 可读存储介 质, 其上存储 有计 算机程序 , 该程序被处理装置 执行时实现 如本公开 实施例所 述的图片转 视频 的方法。 本公开 实施公开 了一种图 片转视频的 方法、 装置、 设备及存储介质 。 首 先对原 始图片进 行分割 , 获得前景区域和背 景区域 , 然后对背景区域进行 视 觉深度 的迭代 变换,并将每次 变换得到 的图像存储 为画面帧 ,得到多帧图像; 其 中, 迭代变换包括至 少两次视 觉深度的变换 , 最后将多帧图像 进行拼接 , 获得 目标视频 。 本公开实施例提供 的图片转视 频的方法 , 将由背景区域中 图 像进 行视觉深度 的迭代 变换生产的 多张图像进 行拼接, 获得具有前景图像聚 焦 、 背景图像希区柯克 变换效果 的视频影集 , 无需手动制动, 提高影集制 作 的便 捷性。 附图说 明 图 1是本公开实施例 中的一种 图片转视频 的方法 的流程图; 图 2是本公开实施例 中的一种 图片转视频 的装置 的结构示意 图; 图 3是本公开实施例 中的一种 电子设备 的结构示意 图。 具体 实施方式 下面将 参照附 图更详细地描 述本公 开的实施例 。 虽然附图中显示 了本公 开的 某些实施例 , 然而应当理解 的是, 本公开可以通 过各种形 式来实现 , 而 且不 应该被解释 为限于这 里阐述的 实施例, 相反提供这 些实施例 是为了更加 透彻 和完整地 理解本公 开。 应当理解的是 , 本公开的附图及实施 例仅用于 示 例性 作用 , 并非用于限制 本公开的保 护范围。 应当理 解, 本公开的方法 实施方式 中记载的各 个步骤可 以按照不 同的顺 序执 行, 和/或并行执行。 此外, 方法实施方式可以 包括附加 的步骤和 /或省 略执 行示出的 步骤。 本公开的范 围在此方面 不受限制 。 本文使 用的术语 “包括” 及其变形是 开放性 包括, 即 “包括但不限于” 。 术语 “基于” 是 “至少部分地基 于” 。 术语 “一个实施例” 表示 “至少一个 实施 例” ; 术语 “另一实施例” 表示 “至少一个另外的 实施例” ; 术语 “一 些 实施例” 表示 “至少一些实施例” 。 其他术语的相关定义将 在下文描 述中 给 出。 需要 注意, 本公开中提及 的 “第一” 、 “第二” 等概念仅用于对 不同的 装置 、 模块或单元进行 区分, 并非用于限定 这些装置 、 模块或单元所执行 的 功能 的顺序或者 相互依存 关系。 需要 注意, 本公开中提及 的 “一个” 、 “多个” 的修饰是示意性 而非限 制性 的, 本领域技术人 员应当理解 , 除非在上下文另 有明确指 出, 否则应该 理解 为 “一个或多个” 。 本公开 实施方式 中的多个 装置之间 所交互的 消息或者信 息的名称 仅用于 说明 性的目的 , 而并不是用于对这 些消息或 信息的范 围进行限 制。 图 1为本公开实施例 提供的一 种图片转视 频的方法 的流程 图, 本实施例 可适 用于将静 态图片转换 为动态视频 的情况 , 该方法可以由图片转 视频的装 置来 执行, 该装置可由硬件 和/或软件组成 , 并一般可集成在具有 图片转视 频 功能 的设备中 ,该设备可以是服 务器或服 务器集群 等电子设 备。如图 1所示, 该方 法具体包括 如下步骤 : 步骤 110, 对原始图片进行分割 , 获得前景区域和 背景区域 。 其中 , 原始图片可以是 由用户输入 或者选中 的图片。 前景区域可 以是人 像 区域、 动物区域及建 筑物区域 等要识别的 目标区域 , 背景区域为前景 区域 除外 的其余 区域。对原始图片分割 可以理解 为将前景 区域和 背景区域分 割开。 本实施 例中, 对原始图片 进行分割 , 获得前景区域和 背景区域 的方式可 以是 : 对原始图片中的 目标物体进 行识别; 将目标物体 所在的 区域作为前 景 区域 进行分割 , 获得前景区域和 背景区域 。 具体 的, 可以采用物体识 别模型对原 始图片 中的目标物 体进行识 别, 例 如 , 假设前景图像为人像 , 则采用人像识别模 型进行识 别, 假设前景图像是 动物 , 则采用动物识别模 型进行识 别。 本实施例对识别 的目标物体 的类型不 做限 定。 将目标物体所 在的区域从 原始图 片中抠除 出来, 将前景区域和 背景 区域 进行分 离, 获得前景区域和 背景区域 。 本实施 例中, 将目标物体 所在的 区域作为前 景区域进行 分割, 获得前景 区域 和背景 区域的方式 还可以是 : 获取前景区域的 中心点深度 ; 基于中心点 深度 对前景 区域的像素 点进行深度 平滑处理 , 对背景区域和前 景区域分 别进 行边 缘深度锐化 处理, 获得处理后 的前景区域 和背景 区域。 其中 , 获取像素点深度 的方法可 以采用调焦 方法、 明暗和光照 方法及相 对深 度或者深度 排序等 方法, 此处对深度 的获取方法 不做限定 。 基于中心点 深度 对前景 区域的像素 点进行深度 平滑处理 的过程可 以理解为 , 将前景区域 中各 像素点的 深度均调 整为中心 点的深度 , 使得前景区域的 图像处于 同一视 觉深 度。 具体 的, 对前景区域分割 后, 根据前景区域 的中心点 深度对前 景区域的 像素 点进行深度 平滑处 理, 对边缘做深度锐化 , 通过深度信息获 得非连续 闭 合的 边, 以将前景区域 抠除出来 , 保留背景区域。 步骤 120, 对背景区域进 行视觉深度 的迭代 变换, 并将每次变换得 到的 图像 存储为画 面帧, 得到多帧图像 。 其中 , 迭代变换包括至少 两次视觉深 度的变换 , 每次变换基于上 一次的 变换 结果继续进 行视觉深度 的变换。 视觉深度 的变换包括 由远到近 或者由近 到远 的变换。视觉深 度的变换可 以理解 为对图像进行 变焦处理 。本实施例 中, 首先 确定一视 觉深度的 变换范围 , 然后在该变换范围 内, 对背景区域按照 一 定步 长进行视 觉深度的迭 代变换。 本实施 例中, 对背景区域 进行视觉深 度的迭代 变换的方 式可以是 : 基于 设定 机器学 习模型, 将背景区域 中抠除前景 的区域进 行图像的 补齐; 对补齐 后的 背景区域 进行视觉深 度的迭代 变换。 其中 , 设定机器学习模型 可以是经 过大量样本 训练得到 的模型, 样本可 以是 被抠除掉 一部分的 图像, 并以完整图像 进行监督 进行训练 。 例如: 背景 区域 为一个建 筑物, 在原始图片 中, 建筑物的一部分 被前景 图像遮挡, 在抠 除掉 前景区域 中, 利用设定机器 学习模型将 背景区域 中的建筑 物图像补 齐。 本实施 例中, 对背景区域 进行视觉深 度的迭代 变换的方 式可以是 : 基于 中心 点深度 , 对背景区域的像素 点的深度按 照第一设 定步长进 行由近到 远的 变换 。 具体 的, 以中心点深度 为基准, 逐步将背景 区域像素 点的深度 变远。 示 例性 的,设定步长 为 d,则第一次 变换时,视觉深度 变远 d,获得第一帧画 面, 第二 次变换时 , 基于第一帧画面的 视觉深度 继续变远 d, 获得第二帧画 面, 这样 第二种画 面的深度相 对于原始 图片的深 度为 2d, 依次类推, 直到获得多 帧画 面。 本实施 例中, 对背景区域 进行视觉深 度的迭代 变换的方 式可以是 : 基于 中心 点深度 , 对背景区域的像素 点的深度按 照第二设 定步长进 行由远到 近的 变换 。 其中 , 第二设定步长与第 一设定步 长可以相 同或者不 同。 具体的, 以中 心点 深度为基 准, 逐步将背景区 域像素点 的深度变近 。 示例性的, 设定步长 为 d, 则第一次变换时, 视觉深度变 近 d, 获得第一帧画 面, 第二次变换时 , 基于 第一帧画 面的视觉深 度继续变 近 d, 获得第二帧画面, 这样第二种画面 的深 度相对于原 始图片 的深度为拉 近 2d, 依次类推, 直到获得多帧画面。 步骤 130, 将多帧图像进行拼接 , 获得目标视频。 本实施 例中, 将多帧图像 进行拼接 的方式可 以按照多 帧图像的时 间戳进 行拼 接。 拼接后的目标 视频为一个 具有希 区柯克效果 的影集。 可选 的, 若原始图片包括 至少两张 , 则针对每张原始图 片, 执行对原始 图片 进行分割 , 获得前景区域和 背景区域 ; 对背景区域进行视 觉深度的迭 代 变换 , 并将每次变换得到 的图像存 储为画面 帧, 得到多帧图像; 将多帧图像 进行 拼接, 获得目标视频 的操作; 获得至少两个目标视 频。 可选 的, 在获得至少两个 目标视频之 后, 还包括如下步 骤: 对至少两个 目标 视频按照设 定顺序进 行排序; 采用在相邻目标视频 间添加设定 转场特效 的方 式对排序后 的至少 两个目标视 频进行拼接 ; 对拼接后的至 少两个 目标视 频进行 渲染, 获得最终的 视频。 其中 , 设定顺序可以是用 户输入图 片的顺序 , 或者用户调整后顺序 , 此 处不做 限定。 相邻目标视 频间的设定 转场特效 可以相 同或者不 同。 设定转场 特效 可以是预 先设置好可 以任意选 择的。 本实施 例的技术 方案, 首先对原始 图片进行分 割, 获得前景区域 和背景 区域 , 然后对背景区域 进行视觉深 度的迭代 变换, 并将每次变换 得到的 图像 存储 为画面帧 , 得到多帧图像; 其中, 迭代变换包括至 少两次视 觉深度的 变 换, 最后将多帧图像进行 拼接, 获得目标视频 。 本公开实施例提供 的图片转 视频 的方法, 将由背景 区域中图像 进行视觉深 度的迭代 变换生产 的多张图像 进行拼 接,获得具有 前景图像 聚焦、背景 图像希区柯 克变换效 果的视频影 集, 无需 手动制动 , 提高影集制作的便 捷性。 本公开 实施例提 供的图 片转视频的 方法可以 作为视频 APP 的一个功能 进行 上线。该功能 可以实现视 频的 自动编辑、创作及 分享。在本应 该场景下 , 用户 选择图片转 视频的功 能, 用户选择图片, 客户端将 图片上传至服 务端, 服务 端获取到客 户端上传 的图片, 图片生成希区柯克视 频片段 , 返回给客户 端; 客户端对视频解码及 剪裁, 并渲染画面 、 加转场特效后进行 自动播放 的 预览 , 用户并可以将该视 频进行分 享或者发布 。 本申请的方案, 无需用户手 动制 动视频, 只需要将 图片上传即可 , 极大的降低了 图片生成视 频的成本 。 图 2是本公开实施例 公开的一 种图片转视 频的装置 的结构示 意图。 如图 2 所示, 该装置包括: 区域获取模块 210,视觉深度变换 模块 220和目标视频 获取模 块 230。 区域获 取模块 210, 用于对原始 图片进行分割 , 获得前景区域和 背景区 域; 视觉深 度变换模 块 220, 用于对背景区域进行 视觉深度 的迭代变换 , 并 将每 次变换得到 的图像存 储为画面 帧, 得到多帧图像; 其中, 迭代变换包括 至少 两次视觉深 度的变换 ; 目标视 频获取模 块 230, 用于将多帧图像 进行拼接 , 获得目标视频。 可选 的, 区域获取模块 210, 还用于: 对原始 图片中的 目标物体 进行识别; 将 目标物体所在 的区域作 为前景 区域进行分割 , 获得前景区域和 背景区 域; 其中, 背景区域为原始图片 中除目标物 体所在的 区域之外 的区域。 可选 的, 区域获取模块 210, 还用于: 获取前 景区域 的中心点深 度; 基于 中心点深度 对前景 区域的像素 点进行深 度平滑处 理, 对背景区域和 前景 区域分别 进行边缘深 度锐化处理 , 获得处理后的前 景区域和 背景区域 。 可选 的, 视觉深度变换模块 220, 还用于: 基于设 定机器 学习模型,将 背景区域 中抠除前景 的区域进 行图像的 补齐; 对补齐后 的背景 区域进行视 觉深度的 迭代变换 。 可选 的, 视觉深度变换模块 220, 还用于: 基于 中心点深度 , 对背景区域的像 素点的深 度按照第 一设定步 长进行由 近到 远的变换 。 可选 的, 视觉深度变换模块 220, 还用于: 基于 中心点深度 , 对背景区域的像 素点的深 度按照第 二设定步 长进行由 远到 近的变换 。 可选 的, 原始图片为用户输 入或者选 中的图片 , 若原始图片包括 至少两 张, 则针对每张原始图片 , 执行对原始图片进行 分割, 获得前景 区域和背景 区域 ; 对背景区域进行视 觉深度的 迭代变换 , 并将每次变换得到 的图像存储 为画 面帧, 得到多帧图像 ; 将多帧图像进行拼 接, 获得目标视频 的操作; 获 得至 少两个 目标视频; 可选 的, 还包括: 视频拼接模块, 用于: 对至少 两个 目标视频按照设 定顺序进 行排序; 采用在 相邻 目标视频间添加 设定转场特 效的方 式对排序后 的至少 两个目 标视频 进行拼接 ; 对拼接 后的至少 两个目标 视频进行渲 染, 获得最终的视频 。 上述装 置可执行 本公开前 述所有 实施例所提供 的方法 , 具备执行上述方 法相 应的功能模 块和有益 效果。 未在本实施例中详尽 描述的技 术细节, 可参 见本公 开前述 所有实施例 所提供 的方法。 下面参 考图 3, 其示出了适于用来 实现本公 开实施例 的电子设备 300的 结构 示意图。 本公开实施 例中的 电子设备可 以包括但不 限于诸如 移动电话 、 笔记 本电脑、 数字广播接 收器、 PDA (个人数字助理 )、 PAD(平板电脑 )、 PMP (便携式多媒体 播放器 ) 、 车载终端 (例如车载导航终端)等等 的移动 终端 以及诸如 数字 TV、 台式计算机等等 的固定终 端, 或者各种形式 的服务 器 , 如独立服务器或者 服务器集群 。 图 3示出的电子设备 仅仅是一 个示例, 不应 对本公开 实施例的功 能和使用 范围带来任 何限制 。 如图 3所示, 电子设备 300可以 包括处理装 置 (例如中央处理 器、 图形 处理 器等 ) 301 , 其可以根据存储在只读存储装 置 (ROM ) 302 中的程序或 者从 存储装置 305加载到随机 访问存储装 置 (RAM ) 303中的程序而执 行各 种适 当的动作 和处理。 在 RAM 303中 , 还存储有电子设备 300操作所需 的 各种 程序和数据 。 处理装置 301、 ROM 302以及 RAM 303通过 总线 304彼 此相 连。 输入 /输出 (I/O)接口 305也连接至总线 304 o 通常 , 以下装置可以连接 至 I/O接口 305: 包括例如触摸 屏、 触摸板、 键盘 、 鼠标、 摄像头、 麦克风、 加速度计、 陀螺仪等的输入装置 306; 包括 例如 液晶显示 器 (LCD) 、 扬声器、 振动器等的输出装置 307; 包括例如磁 带、硬盘 等的存储 装置 308; 以及通信装置 309 o 通信装置 309可以允许 电子 设备 300与其他设备 进行无线或 有线通信 以交换数据 。 虽然图 3示出了具 有 各种 装置的电 子设备 300, 但是应理解的是 , 并不要求实施或 具备所有 示出 的装 置。 可以替代地 实施或具备 更多或更 少的装置 。 特别地 , 根据本公开的 实施例, 上文参考流程 图描述 的过程可 以被实现 为计 算机软件程 序。 例如, 本公开的实施例 包括一种计 算机程序 产品, 其包 括承 载在计算机 可读介质 上的计算 机程序, 该计算机程序包含用 于执行词 语 的推 荐方法的 程序代码 。 在这样的实施例 中, 该计算机程序可 以通过通信 装 置 309从网络上被下载 和安装 ,或者从存储装置 305被安装,或者从 ROM 302 被安 装。 在该计算机程序 被处理装 置 301执行时 , 执行本公开实施例 的方法 中限 定的上述 功能。 需要说 明的是 , 本公开上述的计算机 可读介质 可以是计 算机可读 信号介 质或 者计算机 可读存储介 质或者是 上述两者 的任意组合 。 计算机可读存储 介 质例 如可以是 但 不限于 电 、 磁、 光、 电磁、 红外线、 或半导体的系 统、 装置或器件, 或者任意以上 的组合。 计算机可读 存储介质 的更具体 的例 子可 以包括但 不限于: 具有一个或多个导 线的电连接 、 便携式计算机磁盘 、 硬盘 、 随机访问存储器 (RAM ) 、 只读存储器(ROM ) 、 可擦式可编程只 读存 储器( EPROM 或闪存 )、光纤、便携式紧凑磁盘只读存 储器( CD-ROM )、 光存 储器件、 磁存储器件 、 或者上述的任 意合适的组 合。 在本公开中, 计算 机可 读存储介质 可以是任 何包含或 存储程序 的有形介 质, 该程序可以被指 令 执行 系统、 装置或者器件 使用或者 与其结合 使用。 而在本公开中, 计算机可 读信 号介质可 以包括在基 带中或者 作为载波 一部分传播 的数据信 号, 其中承 载 了计算机可读 的程序代 码。 这种传播的数据 信号可 以采用多种 形式, 包括 但不 限于电磁信 号、 光信号或上 述的任意合 适的组合 。 计算机可读信号 介质 还可 以是计算机 可读存储 介质以外 的任何计 算机可读介 质, 该计算机可读信 号介 质可以发 送、 传播或者传输用 于由指令 执行系统 、 装置或者器件使用 或 者与 其结合使 用的程序 。 计算机可读介质上 包含的程 序代码可 以用任何 适当 的介 质传输, 包括但不限于: 电线、 光缆、 RF(射频)等等, 或者上述的任 意合 适的组合 。 在一 些实施 方式中 , 客户端、 服务器可以利 用诸如 HTTP ( HyperText Transfer Protocol, 超文本传输协议)之类的任何当前已知 或未来研发 的网络 协议 进行通信 , 并且可以与任意形 式或介质 的数字数 据通信 (例如, 通信网 络 )互连。 通信网络的示例 包括局域 网 ( “LAN” ) , 广域网( “WAN” ) , 网 际网 (例如, 互联网) 以及端对端网络(例如, ad hoc端对端网络 ) , 以 及任 何当前 已知或未来 研发的网 络。 上述计 算机可读 介质可以 是上述电子 设备中所 包含的; 也可以是单独存 在 , 而未装配入该电子设 备中。 上述计 算机可读 介质承载有 一个或者 多个程序 , 当上述一个或者 多个程 序被 该电子设备 执行时, 使得该电子 设备: 对原始图片进 行分割 , 获得前景 区域 和背景 区域; 对所述背景区 域进行视 觉深度的迭 代变换, 并将每次变换 得到 的图像存储 为画面 帧, 得到多帧图像; 其中, 迭代变换包括至少两次 视 觉深 度的变换 ; 将所述多帧图像进行 拼接, 获得目标视频。 可以 以一种或 多种程序设 计语言或其 组合来编 写用于执行 本公开 的操作 的计 算机程序 代码, 上述程序设计 语言包括 但不限于 面向对象 的程序设计 语 言一 诸如 Java、 Smalltalk. C++, 还包括常规的过程式程序设计语言一诸如 “C” 语言或类似 的程序设 计语言。 程序代码 可以完全 地在用户 计算机上 执 行 、 部分地在用户计算机 上执行 、 作为一个独立的软件 包执行 、 部分在用户 计算机 上部分在 远程计算 机上执行 、或者完全在远程 计算机或服 务器上执 行。 在涉 及远程计 算机的情形 中, 远程计算机可 以通过任 意种类的 网络 — 包括 局域 网(LAN)或广域网(WAN)一连接到用 户计算机 , 或者, 可以连接到外部 计算机 (例如利用因特 网服务提供 商来通过 因特网连接 ) 。 附图 中的流程 图和框图, 图示了按照本公开各 种实施例 的系统、 方法和 计算机 程序产 品的可能 实现的体 系架构、 功能和操作 。 在这点上, 流程图或 框 图中的每个 方框可以 代表一个模 块、 程序段、 或代码的一部 分, 该模块、 程序 段、 或代码的一部 分包含一 个或多个用 于实现规 定的逻辑功 能的可执 行 指令 。 也应当注意, 在有些作为替 换的实现 中, 方框中所标注 的功能也可 以 以不 同于附 图中所标注 的顺序发生 。 例如, 两个接连地表示的 方框实际上 可 以基 本并行地 执行, 它们有时也可 以按相反 的顺序执行 , 这依所涉及的功 能 而定 。 也要注意的是 , 框图和 /或流程图中的每个方 框、 以及框图和 /或流程 图中 的方框的组 合, 可以用执行规 定的功能 或操作的 专用的基 于硬件的 系统 来 实现, 或者可以用专用 硬件与计 算机指令 的组合来 实现。 描述 于本公开 实施例中所 涉及到的 单元可以通 过软件 的方式实现 , 也可 以通 过硬件的 方式来实现 。 其中, 单元的名称在某种 情况下并 不构成对该 单 元本 身的限定 。 本文 中以上描述 的功能可 以至少部 分地由一 个或多个 硬件逻辑 部件来执 行。 例如, 非限制性地, 可以使用的示范 类型的硬件 逻辑部件 包括: 现场可 编程 门阵列 (FPGA) 、 专用集成电路( ASIC) 、 专用标准产品( ASSP) 、 片上 系统 (SOC) 、 复杂可编程逻辑设备 ( CPLD)等等。 在本公 开的上下 文中, 机器可读介 质可以是有 形的介质 , 其可以包含或 存储 以供指令执 行系统 、 装置或设备使用或 与指令执行 系统、 装置或设备 结 合地 使用的程 序。 机器可读介质可 以是机 器可读信号 介质或机 器可读储存 介 质。 机器可读介 质可以 包括但不 限于电子的 、 磁性的、 光学的、 电磁的、 红 夕卜的、 或半导体系统、 装置或设备, 或者上述内容 的任何合 适组合。 机器可 读存储 介质的更 具体示例 会包括基 于一个或 多个线的 电气连接 、 便携式计算 机盘 、 硬盘、 随机存取存储器 (RAM ) 、 只读存储器(ROM ) 、 可擦除可 编程 只读存储 器 (EPROM 或快闪存储 器) 、 光纤、 便捷式紧凑盘只读存储 器 (CD-ROM )、 光学储存设备、 磁储存设备、 或上述内容的任何 合适组合 。 根据本 公开实施 例的一个 或多个 实施例, 本公开实施例 公开一种 图片转 视频 的方法, 包括: 对原始 图片进行 分割, 获得前景区域 和背景 区域; 对所述 背景区域 进行视觉深 度的迭代 变换, 并将每次变换 得到的 图像存 储为 画面帧,得到 多帧图像 ; 其中, 迭代变换包括至少两次视 觉深度的变换; 将所述 多帧图像 进行拼接 , 获得目标视频。 进一步 地, 对原始图片进行 分割, 获得前景 区域和背景 区域, 包括: 对原始 图片中的 目标物体 进行识别; 将所述 目标物体 所在的 区域作为前 景区域进行 分割, 获得前景区域和背 景 区域; 其中, 背景区域为原始 图片中除 目标物体所 在的区域 之外的 区域。 进一步 地, 将所述目标物 体所在的 区域作为 前景区域 进行分割 , 获得前 景 区域和背景 区域, 包括: 获取所 述前景 区域的中心 点深度; 基于 所述中心点 深度对所 述前景 区域的像素 点进行深度 平滑处 理, 对所 述背 景区域和 所述前景 区域分别 进行边缘深 度锐化处理 , 获得处理后的前 景 区域 和背景 区域。 进一步 地, 对所述背景 区域进行视 觉深度的迭 代变换, 包括: 基于设 定机器 学习模型,将 背景区域 中抠除前景 的区域进 行图像的 补齐; 对补齐后 的背景 区域进行视 觉深度的 迭代变换 。 进一步 地, 对所述背景 区域进行视 觉深度的迭 代变换, 包括: 基于 所述中心点 深度, 对所述背景 区域的像 素点的深 度按照第 一设定步 长进行 由近到远 的变换。 进一步 地, 对所述背景 区域进行视 觉深度的迭 代变换, 包括: 基于 所述中心点 深度, 对所述背景 区域的像 素点的深 度按照第 二设定步 长进行 由远到近 的变换。 进一步 地, 原始图片为用 户输入或者 选中的 图片, 若原始图片包括 至少 两张 , 则针对每张原始图 片, 执行对原始图片 进行分割 , 获得前景区域和 背 景 区域; 对所述背景区 域进行视 觉深度的迭 代变换, 并将每次变换得到的 图 像存 储为画面 帧, 得到多帧图像; 将所述多帧图像进行 拼接, 获得目标视频 的操 作; 获得至少两个 目标视频; 在获得 至少两个 目标视频之 后, 还包括: 对所述 至少两个 目标视频按 照设定顺 序进行排序 ; 采用在 相邻 目标视频间添加 设定转场特 效的方 式对排序后 的至少 两个目 标视频 进行拼接 ; 对拼接 后的至少 两个目标 视频进行渲 染, 获得最终的视频 。 进一步 地, 所述前景区域 包括人像 区域。 注意 , 上述仅为本公开的 可选实施例 及所运用 技术原理 。 本领域技术人 员会 理解, 本公开不限 于这里所述 的特定 实施例, 对本领域技术 人员来说 能 够进行 各种明显 的变化、 重新调整和替代而 不会脱离本 公开的保 护范围。 因 此 , 虽然通过以上实施例 对本公开 进行了较 为详细的说 明, 但是本公开不仅 仅限 于以上实施 例, 在不脱离本公 开构思的 情况下 , 还可以包括更多其他 等 效 实施例, 而本公开的 范围由所 附的权利要 求范围决 定。