Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
MODEL TRAINING METHOD AND APPARATUS, AND ELECTRONIC DEVICE
Document Type and Number:
WIPO Patent Application WO/2024/005711
Kind Code:
A1
Abstract:
Provided in the present disclosure are a model training method and apparatus, and an electronic device. The method comprises: acquiring a first sample image, wherein the first sample image comprises a first image block, which is not covered, and a second image block, which has been covered; processing the first sample image by means of a first model, so as to obtain a first image feature corresponding to the first image block; reconstructing the second image block according to the first image feature, so as to obtain a first image; determining a fused predicted feature of the first image block and the second image block according to the first image feature; acquiring a target image feature from a target image, wherein the target image is an image obtained after the first sample image is preprocessed; and updating model parameters of the first model according to the first image, the second image block, the fused predicted feature and the target image feature. Therefore, the effect of model training is improved.

Inventors:
JIN XIAOJIE (US)
HUANG ZHICHENG (CN)
FENG JIASHI (SG)
Application Number:
PCT/SG2023/050440
Publication Date:
January 04, 2024
Filing Date:
June 22, 2023
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
LEMON INC (SG)
International Classes:
G06V10/26; G06V10/74; G06V10/80; G06V10/82; G06N3/08; G06T7/11
Foreign References:
CN114359564A2022-04-15
CN113033582A2021-06-25
CN111914812A2020-11-10
US20220101028A12022-03-31
Attorney, Agent or Firm:
POH, Chee Kian, Daniel (SG)
Download PDF:
Claims:
权利 要 求 书

1、 一种模型训练方法, 其中, 所述方法包括: 获取第 一样本图像, 所述第一样本图像中包括未遮挡的第一图像块和巳遮挡的第二 图像块; 通过第 一模型对所述第一样本图像进行处理, 得到所述第一图像块对应的第一图像 特征; 根据所述第 一图像特征, 重构所述第二图像块, 得到第一图像, 以及根据所述第一图 像特征, 确定所述第一图像块和所述第二图像块的融合预测特征; 在 目标图像中获取目标图像特征, 所述目标图像为所述第一样本图像预处理之后的 图像; 根据所述第 一图像、所述第二图像块、所述融合预测特征和所述目标图像特征, 更新 所述第一模型的模型参数。

2、 根据权利要求 1所述的方法, 其中, 根据所述第一图像、 所述第二图像块、 所述 融合预测特征和所述目标图像特征, 更新所述第一模型的模型参数, 包括: 根据所述第 一图像、 所述第二图像块, 确定所述第一模型的第一损失函数; 根据所述 融合预测特征和所述目标图像特征, 确定所述第一模型的第二损失函数; 根据所述第 一损失函数和所述第二损失函数, 更新所述第一模型的模型参数。

3、根据权利要求 2所述的方法,其中,根据所述融合预测特征和所述目标图像特征, 确定所述第一模型的第二损失函数, 包括: 获取第二样本 图像,并确定所述第二样本图像的第二图像特征,所述第二样本图像为 除所述第一样本图像之外的其它图像; 根据所述 融合预测特征、所述目标图像特征和所述第二图像特征,确定所述第二损失 函数。

4、 根据权利要求 3所述的方法, 其中, 根据所述融合预测特征、 所述目标图像特征 和所述第二图像特征, 确定所述第二损失函数, 包括: 获取所述 融合预测特征与所述目标图像特征之间的第一相似度; 获取所述 融合预测特征与所述第二图像特征之间的第二相似度; 根据所述第 一相似度和所述第二相似度, 确定所述第二损失函数。

5、 根据权利要求 2-4任一项所述的方法, 其中, 根据所述第一损失函数和所述第二 损失函数, 更新所述第一模型的模型参数, 包括: 获取所述第 一损失函数对应的第一权重和所述第二损失函数对应的第二权重; 根据所述第 一损失函数、所述第一权重、所述第二损失函数和所述第二权重, 更新所 述第一模型的模型参数。

6、 根据权利要求 1-5任一项所述的方法, 其中, 根据所述第一图像特征, 确定所述 第一图像块和所述第二图像块的融合预测特征, 包括: 获取第一 向量; 将所述第 一向量和所述第一图像特征进行融合处理, 得到融合向量; 根据所述 融合向量得到所述融合预测特征。

7、 根据权利要求 1-6任一项所述的方法, 其中, 在目标图像中获取目标图像特征, 包括: 根据所 述第二图像块在所述第一样本图像中的位置, 在所述目标图像中确定第一区 域; 对所述第 一区域进行偏移处理, 得到第二区域; 将所述 目标图像中的第二区域内的图像块对应的图像特征, 确定为所述目标图像特 征。

8、 一种图像处理方法, 其中, 所述方法包括: 通过第一模 型对多张图像进行处理,得到所述多张图像对应的多个图像特征,所述第 一模型为通过重构图像对比学习结合预测特征对比学习训练得到的模型 ; 根据所述 多个图像特征, 对所述多张图像进行分类。

9、 一种模型训练装置, 其中, 所述装置包括第一获取模块、 处理模块、 重构模块、 确定模块、 第二获取模块和更新模块, 其中: 所述第一 获取模块用于,获取第一样本图像,所述第一样本图像中包括未遮挡的第一 图像块和巳遮挡的第二图像块; 所述处理模块 用于,通过第一模型对所述第一样本图像进行处理,得到所述第一图像 块对应的第一图像特征; 所述重构模块用 于, 根据所述第一图像特征, 重构所述第二图像块,得到第一图像; 所述确定模块用 于,根据所述第一图像特征,确定所述第一图像块和所述第二图像块 的融合预测特征; 所述第二 获取模块用于,在目标图像中获取目标图像特征,所述目标图像为所述第一 样本图像预处理之后的图像; 所述更新模块 用于, 根据所述第一图像、所述第二图像块、所述融合预测特征和所述 目标图像特征, 更新所述第一模型的模型参数。

10、 一种图像处理装置, 其中, 所述装置包括处理模块和分类模块, 其中: 所述处理模块 用于,通过第一模型对多张图像进行处理,得到所述多张图像对应的多 个图像特征, 所述第一模型为通过重构图像对比学习结合预测特征对比学习训练得到的 模型; 所述分类模块 用于, 根据所述多个图像特征, 对所述多张图像进行分类。

11、 一种电子设备, 其中, 所述电子设备包括: 处理器和存储器; 所述存储器存 储计算机执行指令; 所述 处理器执行所述存储器存储的所述计算机执行指令, 使得所述处理器执行如权 利要求 1-7任一项所述的模型训练方法, 或者, 如权利要求 8所述的图像处理方法。

12、一种计算机可读存储介质, 其中, 所述计算机可读存储介质中存储有计算机执行 指令, 当处理器执行所述计算机执行指令时,实现如权利要求 1-7任一项所述的模型训练 方法, 或者, 如权利要求 8所述的图像处理方法。

13、 一种计算机程序产品, 包括计算机程序, 其中, 所述计算机程序被处理器执行时 实现如权利要求 1-7任一项所述的模型训练方法, 或者, 如权利要求 8所述的图像处理方 法。

14、 一种计算机程序, 其中, 所述计算机程序被处理器执行时实现如权利要求 1-7 任一项所述的模型训练方法, 或者, 如权利要求 8所述的图像处理方法。

19

Description:
模 型训 练方 法 、 装置及 电子 设备 相关申请的交叉引用 本公开要求于 2022年 06月 28日提交中国专利局、 申请号为 202210754292.2、 申请名称 为 “模型训练方法、装置及电子设备”的中国专 利申请的优先权, 其全部内容通过引用并入本 文。 技术领域 本公开实施例涉及图像处理技术领域, 尤其涉及一种模型训练方法、 装置及电子设备。 背景技术 自监督学习可以从无标签的数据中学习一个特 征提取器, 进而通过特征提取器获取特征 , 这样无需对训练样本进行标注, 降低模型训练的成本。 目前,可以通过对比学习的方法实现模型的自 监督学习。例如,模型可以通过当前输入的 图像与其它图像进行对比,构建当前输入的图 像与其它图像的图形之间的关系,通过学习该 关 系得到特征提取器。但是,通过上述方法训练 得到的模型未学习到图像内部各区域之间的关 联 关系, 进而导致模型训练的效果较差。 发明内容 本公开提供一种模型训练方法、 图像处理方法、装置、 电子设备、存储介质、计算机程序 产品以及计算机程序, 用于解决现有技术中模型训练的效果较差的技 术问题。 第一方面, 本公开实施例提供一种模型训练方法, 该方法包括: 获取第一样本图像, 所述第一样本图像中包括未遮挡的第一图像块 和巳遮挡的第二图像 块; 通过第一模型对所述第一样本图像进行处理, 得到所述第一图像块对应的第一图像特征; 根据所述第一图像特征,重构所述第二图像块 ,得到第一图像, 以及根据所述第一图像特 征, 确定所述第一图像块和所述第二图像块的融合 预测特征; 在 目标图像中获取目标图像特征, 所述目标图像为所述第一样本图像预处理之后 的图像; 根据所述第一图像、所述第二图像块、所述融 合预测特征和所述目标图像特征,更新所述 第一模型的模型参数。 第二方面, 本公开实施例提供一种图像处理方法, 该方法包括: 通过第一模型对多张图像进行处理,得到所述 多张图像对应的多个图像特征,所述第一模 型为通过重构图像对比学习结合预测特征对比 学习训练得到的模型;可选的,第一模型可以 为 上述第一方面所述的第一模型。 根据所述多个图像特征, 对所述多张图像进行分类。 第三方面, 本公开实施例提供一种模型训练装置, 包括第一获取模块、处理模块、重构模 块、 确定模块、 第二获取模块和更新模块, 其中: 所述第一获取模块用于,获取第一样本图像, 所述第一样本图像中包括未遮挡的第一图像 块和巳遮挡的第二图像块; 所述处理模块用于,通过第一模型对所述第一 样本图像进行处理,得到所述第一图像块对 应的第一图像特征; 所述重构模块用于, 根据所述第一图像特征, 重构所述第二图像块, 得到第一图像; 所述确定模块用于,根据所述第一图像特征, 确定所述第一图像块和所述第二图像块的融 合预测特征; 所述第二获取模块用于,在目标图像中获取目 标图像特征,所述目标图像为所述第一样本 图像预处理之后的图像; 所述更新模块用于,根据所述第一图像、所述 第二图像块、所述融合预测特征和所述目标 图像特征, 更新所述第一模型的模型参数。 第四方面, 本公开实施例提供一种图像处理装置, 包括处理模块和分类模块, 其中: 所述处理模块用于,通过第一模型对多张图像 进行处理,得到所述多张图像对应的多个图 像特征, 所述第一模型为通过重构图像对比学习结合预 测特征对比学习训练得到的模型; 所述分类模块用于, 根据所述多个图像特征, 对所述多张图像进行分类。 第五方面, 本公开实施例提供一种电子设备, 包括: 处理器和存储器; 所述存储器存储计算机执行指令; 所述处理器执行所述存储器存储的计算机执行 指令, 使得所述至少一个处理器执行如上 第一方面的所述模型训练方法, 或者如上第二方面的所述图像处理方法。 第六方面,本公开实施例提供一种计算机可读 存储介质,所述计算机可读存储介质中存储 有计算机执行指令,当处理器执行所述计算机 执行指令时,实现如上第一方面的所述模型训 练 方法, 或者如上第二方面的所述图像处理方法。 第七方面,本公开实施例提供一种计算机程序 产品,包括计算机程序,所述计算机程序被 处理器执行时实现如上第一方面的所述模型训 练方法, 或者如上第二方面的所述图像处理方 法。 第八方面,本公开实施例提供一种计算机程序 ,所述计算机程序被处理器执行时实现如上 第一方面的所述模型训练方法, 或者如上第二方面的所述图像处理方法。 本公开提供一种模型训练方法、 图像处理方法、 装置、 电子设备、 存储介质、 计算机程 序产品以及计算机程序, 电子设备获取第一样本图像, 第一样本图像中包括未遮挡的第一图 像块和巳遮挡的第二图像块,通过第一模型对 第一样本图像进行处理,得到第一图像块对应 的 第一图像特征, 根据第一图像特征, 重构第二图像块, 得到的第一图像, 以及根据第一图像特 征,确定第一图像块和第二图像块的融合预测 特征,在目标图像中获取目标图像特征, 目标图 像为第一样本图像预处理之后的图像,根据第 一图像、第二图像块、融合预测特征和目标图 像 特征,更新第一模型的模型参数。根据上述方 法, 电子设备通过重构第二图像块得到的第一图 像和巳遮挡的第一图像块,可以获取样本第一 图像内部各区域之间的关联关系,通过融合预 测 特征和目标图像特征, 可以获取图像之间的关联关系, 因此, 在对第一模型训练时, 第一模型 不仅可以学习到图像内部各区域之间的关联关 系,也可以学习到图像之间的关联关系,进而 提 高模型训练的效果。 附图说明 为了更清楚地说明本公开实施例或现有技术中 的技术方案, 下面将对实施例或现有技术 描述中所需要使用的附图作一简单地介绍,显 而易见地,下面描述中的附图是本公开的一些 实 施例,对于本领域普通技术人员来讲,在不付 出创造性劳动性的前提下,还可以根据这些附 图 获得其他的附图。 图 1为本公开实施例提供的一种应用场景示意图 图 2为本公开实施例提供的一种模型训练方法的 程示意图; 图 3为本公开实施例提供的一种第一样本图像的 意图; 图 4为本公开实施例提供的一种获取目标图像的 程示意图; 图 5为本公开实施例提供的一种获取目标图像特 的过程示意图; 图 6为本公开实施例提供的一种更新模型参数的 法流程示意图; 图 7为本公开实施例提供的一种模型训练方法的 程示意图; 图 8为本公开实施例提供的一种图像处理方法的 程示意图; 图 9为本公开实施例提供的一种模型训练装置的 构示意图; 图 10为本公开实施例提供的一种图像处理装置的 构示意图; 图 11为本公开实施例提供的一种电子设备的结构 意图。 具体实施方式 这里将详细地对示例性实施例进行说明,其示 例表示在附图中。下面的描述涉及附图时, 除非另有表示,不同附图中的相同数字表示相 同或相似的要素。以下示例性实施例中所描述 的 实施方式并不代表与本公开相一致的所有实施 方式。相反,它们仅是与如所附权利要求书中 所 详述的、 本公开的一些方面相一致的装置和方法的例子 。 为了便于理解, 下面, 对本公开实施例涉及的概念进行说明。 电子设备: 是一种具有无线收发功能的设备。电子设备可 以部署在陆地上,包括室内或室 外、手持、穿戴或车载;也可以部署在水面上 (如轮船等)。所述电子设备可以是手机 (mobile phone) 、 平板电脑 (Pad) 、 带无线收发功能的电脑、 虚拟现实 (virtual reality, VR) 电子设 备、 增强现实 (augmented reality, AR) 电子设备、 工业控制 ( industrial control) 中的无线终 端、 车载电子设备、 无人驾驶 ( self driving ) 中的无线终端、 远程医疗 (remote medical) 中的 无线电子设备、 智能电网 (smart grid) 中的无线电子设备、 运输安全 ( transportation safety ) 中的无线电子设备、 智慧城市 (smart city) 中的无线电子设备、 智慧家庭 (smarthome) 中的 无线电子设备、可穿戴电子设备等。本公开实 施例所涉及的电子设备还可以称为终端、用户 设 备 (user equipment, UE) 、 接入电子设备、 车载终端、 工业控制终端、 UE单元、 UE站、 移 动站、移动台、远方站、远程电子设备、移动 设备、 UE电子设备、无线通信设备、 UE代理或 UE 装置等。 电子设备也可以是固定的或者移动的。 在相关技术中,多数模型训练的场景无法获取 到较多的标签数据 (如,医疗图像识别领域 等),并且标签数据需要人工标注耗时较长, 自监督学习可以从无标签的图像数据中学习 个特征提取器,进而通过特征提取器提取图像 的特征,这样可以有效的降低模型训练的成本 。 目前,可以通过对比学习的方法实现模型的自 监督学习。例如,将输入的图像与该图像变换 的 图像 (如, 改变输入图像的亮度、 尺寸、 色彩等, 但是图形不变)作为正样本, 将输入的图像 与其它图像作为负样本进行自监督的训练, 进而使得模型可以学习到图像与图像之间的关 联 关系。但是, 图像内部区域之间也存在关联关系,上述模型 训练方法得到的模型未学习到图像 内部各区域之间的关联关系, 进而导致模型训练的效果较差。 为了解决相关技术中的技术问题,本公开实施 例提供一种模型训练方法,获取第一样本图 像,第一样本图像中包括未遮挡的第一图像块 巳遮挡的第二图像块,通过第一模型对第一 本图像进行处理,得到第一图像块对应的第一 图像特征,根据第一图像特征,重构第二图像 块, 得到第一图像, 以及根据第一图像特征,确定第一图像块和第 二图像块的融合预测特征,通过 图像增强、提高对比度等方式对第一样本图像 进行处理,得到目标图像,进而在目标图像中 获 取部分图像对应的目标图像特征,根据第一图 像和第二图像块得到第一损失函数,通过融合 预 测特征和目标图像特征得到第二损失函数, 通过第一损失函数和第二损失函数对第一模型 的 模型参数进行更新。这样,第一模型可以通过 第一图像和第二图像块学习到图像内部各区域 之 间的关联关系,也可以通过融合预测特征和目 标图像特征学习到图像之间的关联关系,进而 提 高模型训练的效果。 下面, 结合图 1 , 对本公开实施例的应用场景进行说明。 图 1为本公开实施例提供的一种应用场景示意图 请参见图 1 , 包括图像 A、 图像 B、 图 像 C、 图像 D和分类模型。 其中, 分类模型中设置有本公开实施例中的第一模型 (图 1中未 示出)。 向分类模型输入图像 A、 图像 B、 图像 C和图像 D, 分类模型可以获取每张图像对应 的图像特征,并根据图像特征将图像 A和图像 C分类一类图像,将图像 B和图像 D分为一类 图像。这样,由于分类模型中的第一模型学习 到图像之间的关联关系和图像内部区域的关联 关 系, 模型训练的效果较好, 因此, 分类模型可以准确的得到每张图像对应的图像 特征, 进而提 高图像分类的准确度。需要说明的是,图 1只是示例性的说明本公开实施例的一种应用 景, 并非对应用场景的限定。 下面以具体地实施例对本公开的技术方案以及 本公开的技术方案如何解决上述技术问题 进行详细说明。下面这几个具体的实施例可以 相互结合,对于相同或相似的概念或过程可能 在 某些实施例中不再赘述。 下面将结合附图, 对本公开的实施例进行描述。 图 2为本公开实施例提供的一种模型训练方法的 程示意图。请参见图 2, 该方法可以包 括:

S201、 获取第一样本图像。 本公开实施例的执行主体可以为电子设备, 也可以为设置在电子设备中的模型训练装置。 可选的,模型训练装置可以通过软件实现,模 型训练装置也可以通过软件和硬件结合的方式 实 现。 可选的,第一样本图像用于对第一模型进行训 练。可选的,第一样本图像包括多个图像块。 例如, 若第一样本图像的尺寸为 224*224, 则第一样本图像可以划分为 14*14(196)个没有重 叠区域的图像块,或者,第一样本图像也可以 划分为任意尺寸的没有重叠区域的图像块,本 公 开实施例对此不作限定。 可选的,第一样本图像中的各图像块都包括对 应的标识。例如,第一样本图像包括 196个 不重叠的图像块,每个图像块都有唯一的序号 , 电子设备通过图像块对应的序号,可以确定图 像块在第一样本图像中的位置。 可选的, 多个图像块中包括未遮挡的第一图像块和巳遮 挡的第二图像块。例如,第一样本 图像中包括图像块 A、 图像块 B和图像块 C, 若对图像块 A进行遮挡, 则第一图像块为图像 块 B和图像块 C, 第二图像块为图像块 A。 可选的, 电子设备可以通过遮挡区域对第一样本图像中 的多个图像块进行遮挡。例如,若 预设的遮挡比例为 0.5, 第一样本图像中包括 100个图像块, 则可以将遮挡掩膜的尺寸设置为 50个图像块的尺寸, 进而通过该遮挡掩膜对第一样本图像进行遮挡 。 例如, 若第一样本图像 中包括 100个不重叠的图像块, 预设的遮挡比例为 0.5, 则可以设置 50个与图像块尺寸相同 的掩膜, 进而通过 50个掩膜随机覆盖 50个图像块。 可选的, 第一样本图像中的遮挡比例可 以为任意比例, 本公开实施例对此不作限定。 下面, 结合图 3, 对第一样本图像进行说明。 图 3为本公开实施例提供的一种第一样本图像的 意图。请参见图 3, 包括图像块 A、 图 像块 B、 图像块 C和图像块 D。 其中, 图像块 A、 图像块 B、 图像块 C和图像块 D之间互不 重叠。若将图像块 A的内容和图像块 B的内容遮挡,则第一图像块包括图像块 C和图像块 D , 第二图像块包括图像块 A和图像块 B。

5202、 通过第一模型对第一样本图像进行处理, 得到第一图像块对应的第一图像特征。 可选的,第一模型可以为神经网络模型,通过 第一模型可以获取图像的图像特征。例如, 第一模型可以为卷积神经网络 (Convolutional Neural Network, CNN) , 通过调整 CNN中的 参数, 可以提高 CNN的特征提取的准确度。 可选的, 由于第一图像块为第一样本图像中未遮挡的图 像块, 因此,可以根据如下可行的 实现方式,得到第一图像块对应的第一图像特 征:对第一样本图像中的第一图像块进行特征 提 取处理, 得到第一图像块对应的第一图像特征。例如, 由于第一图像块为未遮挡的图像块, 因 此,第一模型可以直接对第一图像块中的图像 内容进行识别,进而得到第一图像块对应的第 一 图像特征。例如, 第一模型中包括在线编码器, 在线编码器接收到可识别的第一图像块时, 可 以将第一图像块映射到特征空间, 在进而得到第一图像块编码后的特征。 可选的,第一图像特征可以为向量特征。例如 ,第一图像特征可以为 768维的特征向量, 若第一样本图像中包括 100个图像块, 则通过第一模型对第一样本图像处理之后, 每个图像 块都会对应一个 768维的特征向量。

5203、 根据第一图像特征, 重构第二图像块, 得到第一图像。 可选的,电子设备可以通过未遮挡的第一图像 块对应的第一图像特征,重构巳遮挡的第二 图像块中的图像内容,进而得到第一图像。例 如, 电子设备中可以包括在线解码器, 在线解码 器接收到第一图像块对应的第一图像特征时, 可以将第一图像特征输入至像素解码器中 (巳遮 挡的第二图像块的特征可以使用占位符替代) 像素解码器可以根据第一图像特征,预测未 挡的第二图像块对应的第一图像。

5204、 根据第一图像特征, 确定第一图像块和第二图像块的融合预测特征 。 可选的,融合预测特征用于指示第一图像块和 第二图像块的融合特征。例如,第一图像块 和第二图像块可以组成一张图像,第二图像块 为巳遮挡的图像块,电子设备通过第一图像块 的 第一图像特征, 可以预测得到第一图像块和第二图像块融合之 后的融合预测特征。 可选的,电子设备可以根据如下可行的实现方 式,确定第一图像块和第二图像块的融合预 测特征:获取预设的第一向量。可选的,第一 向量可以为预测的第二图像块对应的向量。例 如, 电子设备中可以包括在线解码器,在线解码器 接收到第一图像块对应的第一图像特征时,可 以 根据第一图像特征, 预测第二图像块对应的第一向量。 将第一向量和第一图像特征进行融合,得到融 合向量。例如,在电子设备得到第一图像块 对应的第一图像特征时,电子设备可以根据第 二图像块在第一样本图像中的序号,通过占位 符 将第二图像块对应的特征补齐,在线解码器接 收到第一图像特征时,可以预测第二图像块对 应 的特征向量, 并将占位符替换为该特征向量, 进而得到融合向量。 根据融合向量得到融合预测特征。例如,在线 解码器中包括特征解码器, 电子设备中的在 线解码器得到融合向量时, 可以向特征解码器中输入融合向量, 特征解码器可以根据融合向 量, 得到第一图像块和第二图像块的融合预测特征 。

S205、 在目标图像中获取目标图像特征。 可选的, 目标图像为第一样本图像预处理之后的图像。 可选的,预处理可以为改变图像属 性的处理方法。例如, 预处理可以包括调整图像亮度、调整图像色彩 、调整图像对比度、调整 图像灰度、调整图像尺寸或者其它图像处理方 法, 本公开实施例对此不作限定。例如, 对第一 样本图像进行增强显示处理, 得到目标图像; 增加第一样本图像的亮度, 得到目标图像; 裁剪 部分第一样本图像, 得到目标图像等。 可选的, 目标图像中可以包括多个图像块。例如, 第一样本图像中包括 100个图像块, 若 对第一样本图像进行增强显示处理,得到目标 图像,则目标图像中也可以包括 100个图像块。 可选的, 目标图像中的图像块都为未遮挡的第一图像块 。 下面, 结合图 4, 对获取目标图像的过程进行说明。 图 4为本公开实施例提供的一种获取目标图像的 程示意图。请参见图 4,包括第一样本 图像和目标图像。其中, 第一样本图像中包括图像块 A、 图像块 B、 图像块 C和图像块 D。对 第一样本图像中的灰度值进行调整,进而得到 目标图像,目标图像中包括图像块 1、图像块 2、 图像块 3和图像块 4。 其中, 图像块 1为图像块 A的灰度值调整之后的图像块, 图像块 2为 图像块 B的灰度值调整之后的图像块, 图像块 3为图像块 C的灰度值调整之后的图像块, 图 像块 4为图像块 D的灰度值调整之后的图像块。 可选的, 电子设备在目标图像中获取目标图像特征, 有如下两种情况: 情况 1: 将目标图像的图像特征, 确定为目标图像特征。 可选的, 电子设备可以对目标图像进行处理,进而得到 目标图像对应的目标图像特征。例 如, 电子设备可以通过编码器对目标图像进行处理 , 进而得到目标图像对应的特征图。 情况 2: 将目标图像的部分图像的图像特征, 确定为目标图像特征。 可选的, 电子设备可以通过如下可行的实现方式,得到 目标图像特征:根据第二图像块在 第一样本图像中的位置,在目标图像中确定第 一区域。例如,若第二图像块在第一样本图像 中 的中部区域,则将目标图像中的中部区域确定 为第一区域,若第二图像块在第一样本图像中 的 上部区域,则将目标图像中的上部区域确定为 第一区域。可选的,第一区域的尺寸可以与多 个 第二图像块的尺寸的和相同。 例如, 若第一样本图像中包括 10个第二图像块, 每个第二图像 块的长为 10个像素单位, 宽为 10个像素单位, 则第一区域的长为 100个像素单位, 宽为 100 个像素单位, 第一区域的尺寸可以为其它尺寸本公开实施例 对此不作限定。 对第一区域进行偏移处理,得到第二区域。例 如, 电子设备在目标图像中将第一区域向任 意方向偏移任意距离,进而得到第二区域,这 样,第二区域中的图像内容与第一区域中的图 像 内容相似, 进而提高模型训练的效果。 获取目标图像中的第二区域内的图像块对应的 图像特征,确定为目标图像特征。例如, 目 标图像中包括多个图像块,在电子设备确定第 二区域之后,电子设备可以将第二区域内的图 像 块对应的图像特征, 确定为目标图像特征。 可选的,电子设备可以在目标图像中随机选取 部分图像区域,并将图像区域内的图像对应 的特征, 确定为目标图像特征。例如, 电子设备在目标图像中任意获取预设尺寸的图 像, 并将 该图像对应的图像特征确定为目标图像特征, 其中,预设尺寸可以与第一样本图像中巳遮挡 区 域的尺寸相同, 也可以与第一样本图像中巳遮挡区域的尺寸不 同, 本公开实施例对此不作限 定。 可选的, 电子设备可以通过目标编码器,对目标图像进 行处理,得到目标图像对应的目标 图像特征。可选的, 目标编码器用于获取目标图像中的图像特征。 例如, 电子设备中包括在线 编码器,通过在线编码器可以获取第一样本图 像中多个图像块的第一图像特征,电子设备还 可 以通过目标编码器, 得到目标图像对应的第二图像特征。 下面, 结合图 5, 对在目标图像中获取目标图像特征的过程进行 说明。 图 5为本公开实施例提供的一种获取目标图像特 的过程示意图。请参见图 5,包括目标 图像。其中, 目标图像中包括图像块 A、 图像块 B、 图像块 C和图像块 D。 目标图像中的第一 区域中包括图像块 A和图像块 B, 对第一区域向下进行偏移, 得到第二区域。 第二区域中包 括图像块 C和图像块 D。 将图像块 C和图像块 D对应的图像特征, 确定为目标图像对应的目 标图像特征。

S206、根据第一图像、第二图像块、融合预 特征和目标图像特征,更新第一模型的模型 参数。 可选的,可以根据如下可行的实现方式,更新 第一模型的模型参数:根据第一图像和第二 图像块,确定第一模型的第一损失函数。例如 , 电子设备通过第一图像和第二图像块之间的差 异, 确定第一模型的第一损失函数, 进而通过第一损失函数对第一模型进行更新。 可选的, 可以根据如下公式确定第一损失函数:

L1 =打} (& _必)2 ieM 其中, L]为第一损失函数; M为第二图像块的数量; n为第一样本图像中的图像块数量; 豹为第一图像; 丸为第二图像块; z •为第二图像块的序号。 根据融合预测特征和目标图像特征,确定第一 模型的第二损失函数。例如, 电子设备通过 第一图像块和第二图像块的融合预测特征与目 标图像中的目标图像特征之间的关系, 得到第 二损失函数, 并通过第二损失函数更新第一模型中的模型参 数。 根据第一损失函数和第二损失函数,更新第一 模型的模型参数。例如, 电子设备可以通过 第一图像与第二图像块之间的第一损失函数, 以及融合预测特征和目标图像特征之间的第二 损失函数,对第一模型进行更新,这样第一模 型不仅可以学习到图像之间的关联关系,还可 以 学习到图像内各区域之间的关联关系, 进而提高模型训练的效果。 本公开实施例提供一种模型训练方法,获取第 一样本图像,通过第一模型对第一样本图像 中的未遮挡的第一图像块进行处理, 得到第一图像块对应的第一图像特征, 根据第一图像特 征, 重构第一样本图像中巳遮挡的第二图像块, 得到第一图像, 以及根据第一图像特征, 确定 第一图像块和第二图像块的融合预测特征,通 过图像增强、提高对比度等方式对第一样本图 像 进行处理,得到目标图像,进而在目标图像中 确定对比学习所需的目标图像特征,根据第一 图 像和第二图像块得到第一损失函数,通过融合 预测特征和目标图像特征得到第二损失函数, 通 过第一损失函数和第二损失函数对第一模型的 模型参数进行更新这样, 由于第一损失函数可 以指示图像内部各区域之间的关联关系,第二 损失函数可以指示图像之间的关联关系,因此 , 第一模型可以学习到图像内部区域特征和图像 之间的特征, 进而提高模型训练的效果。 上述模型处理方法还包括更新第一模型的模型 参数的方法, 在图 2所示的实施例的基础 上, 下面, 结合图 6, 对更新第一模型的模型参数的方法进行说明。 图 6为本公开实施例提供的一种更新模型参数的 法流程示意图。 请参见图 6, 包括:

5601、 根据第一图像和第二图像块, 确定第一损失函数。 需要说明的是,步骤 S601的执行过程可以参照步骤 S205,本公开实施例对此不再进行赘 述。

5602、 根据融合预测特征和目标图像特征, 确定第二损失函数。 可选的, 可以根据如下可行的实现方式, 确定第二损失函数: 获取第二样本图像, 并确定 第二样本图像的第二图像特征。可选的,第二 样本图像为除第一样本图像之外的其它图像。 例 如, 在第一模型进行自监督学习的过程中, 第一模型的训练集合中可以包括多个训练样本 图 像, 在对其中一张训练样本图像进行学习时, 其它的训练样本图像都为第二样本图像。 可选的,可以通过编码器对第二样本图像进行 编码,得到第二样本图像对应的第二图像特 征。例如, 第二样本图像为自监督学习中的对比样本(负 样本), 电子设备可以通过目标编码 器对第二样本图像的图像特征进行编码, 得到第二图像特征。 根据融合预测特征、 目标图像特征和第二图像特征, 确定第二损失函数。可选的, 可以根 据如下可行的实现方式,确定第二损失函数: 获取融合预测特征与目标图像特征之间的第一 相 似度。例如,第一相似度可以为余弦相似度、 欧氏距离等,本公开实施例对此不作限定。例 如, 目标图像中每个图像块都对应一个 768维的向量空间, 在获取第一相似度之前, 电子设备可 以将多个图像块对应的多个 768维的向量空间合并为一个特征向量, 进而确定该特征向量与 值, 第一权重与第二权重的和为 1。 例如, 若第一权重为 0.3, 第二权重可以为 0.7, 电子设备 可以通过需求, 调整第一权重和第二权重, 进而调整第一模型学习的侧重方向(如, 偏向图像 内的关联关系, 或者,偏向图像之间的关联关系), 进而提高模型训练的灵活度和模型训练的 效果。 本公开实施例提供一种更新模型参数的方法, 根据第一图像和第一图像块,确定第一损失 函数,根据融合预测特征和目标图像特征,确 定第二损失函数,根据第一损失函数和第二损 失 函数,更新第一模型的模型参数。这样, 电子设备可以通过第一损失函数和第二损失函 数准确 的对第一模型进行训练,提高模型训练的准确 度,并且, 由于第一损失函数对应的第一权重和 第二损失函数对应的第二权重可以灵活的调整 第一模型学习的侧重点,因此,可以提高模型 训 练的灵活度, 进而提高模型训练的效果。 在上述任意一个实施例的基础上,下面,结合 图 7,对上述模型训练方法的过程进行说明。 图 7为本公开实施例提供的一种模型训练方法的 程示意图。 请参见图 7, 包括第一模 型、在线解码器和目标编码器。其中, 第一模型中包括第一样本图像, 第一样本图像中包括巳 遮挡区域。 第一模型对第一样本图像中的未遮挡区域进行 处理, 得到未遮挡区域对应的 3个 第一图像特征。 在线编码器获取 3个第一图像特征, 并对第一样本图像中的巳遮挡区域的特 征进行预测, 并将预测后的特征补入 3个第一图像特征。 通过像素解码器对补入特征之后的 第一图像特征进行处理,重构巳遮挡区域的图 像,得到第一图像,并通过第一图像和第一样 本 图像中的巳遮挡图像得到第一损失函数。 请参见图 7,目标编码器获取目标图像,目标图像为第一 本图像进行增强显示后的图像。 目标编码器生成目标图像对应的目标图像特征 。 通过特征解码器对补入特征之后的第一图像 特征进行处理,得到巳遮挡区域和未遮挡区域 的融合预测特征。通过融合预测特征和目标图 像 特征, 得到第二损失函数, 需要说明的是, 图 7所示的实施例中还可以结合负样本(第二样 图像, 图 7中未示出) 确定第二损失函数。 请参见图 7,通过第一损失函数和第二损失函数对在线解 器和第一模型进行反向梯度传 递, 进而更新第一模型中的模型参数。例如,在第 一模型训练过程中, 通过第一损失函数和第 二损失函数可以对在线解码器的参数也进行更 新(第一模型持续训练,在线解码器的参数也 持 续更新),在实际使用过程中只需要通过第一 模型提取图像特征,无需在线解码器和目标编 码 器。 可选的,在第一模型进行训练的过程中, 目标编码器中的参数也可以进行更新,可以通 过 下述公式, 对目标编码器中的参数进行更新: wf = aW^ +(1 - a)W尸 其中, 砰为目标编码器在第 k步的网络权重; 磴为在线编码器在第 k步的网络权重; a 为超参数(如, a可以为 0.9)。这样, 通过在线编码器的网络权重和目标编码器上一 次更新时 的网络权重, 可以对目标编码器中的参数进行更新, 进而提高第一模型的训练效果。 根据上述方法, 第一模型可以通过重构的遮挡区域的第一图像 和第一样本图像中遮挡区 域的图像学习到第一样本图像内部各区域之间 的关联关系, 第一模型也可以通过融合预测特 征和目标图像特征学习到图像与图像之间的关 联关系, 进而提高第一模型的模型训练效果。 本公开实施例还包括一种图像处理方法, 下面, 结合图 8, 对图像处理方法的流程进行说 明。 图 8为本公开实施例提供的一种图像处理方法的 程示意图。请参见图 8, 该方法流程包 括:

5801、 通过第一模型对多张图像进行处理, 得到多张图像对应的多个图像特征。 可选的, 所述第一模型为通过重构图像对比学习结合预 测特征对比学习训练得到的模型。 可选的, 第一模型可以为上述任意一个实施例所述的第 一模型。 例如, 第一模型可以为图 2、 图 6所示的实施例中的第一模型。

5802、 根据所述多个图像特征, 对所述多张图像进行分类。 可选的,可以根据如下可行的实现方式,对多 张图像进行分类: 获取任意两张图像对应的 两个图像特征之间的相似度,并通过相似度, 对多张图像进行分类,得到图像分类结果。例 如, 在两张图像对应的图像特征之间的相似度大于 或等于第一阈值时, 确定两张图像为同类图像, 在两张图像对应的图像特征之间的相似度小于 第一阈值时, 确定两张图像为不同类型的图像。 例如, 图像集合中包括图像 A、 图像 B、 图像 C和图像 D, 若图像 A的图像特征与图像 B的 图像特征之间的相似度大于第一阈值, 图像 C的图像特征与图像 D的图像特征之间的相似度 大于第一阈值,而图像 A或图像 B的图像特征与图像 C或图像 D的图像特征之间的相似度小 于第一阈值,则电子设备将图像 A和图像 B分为一类图像,将图像 C和图像 D分为另一类图 像。 本公开实施例提供的一种图像处理方法,通过 第一模型对多张图像进行处理,得到多张图 像对应的多个图像特征, 根据所述多个图像特征, 对所述多张图像进行分类。 由于, 所述第一 模型为通过重构图像对比学习结合预测特征对 比学习训练得到的模型,因此,第一模型可以 学 习到图像内部各区域之间的关联关系和图像之 间的关联关系, 进而提高第一模型的训练效果, 使得第一模型输出的图像特征的准确度较高, 提高图像分类的准确度。 图 9为本公开实施例提供的一种模型训练装置的 构示意图。请参见图 9, 该模型训练装 置 10包括第一获取模块 11、 处理模块 12、 重构模块 13、 确定模块 14、 第二获取模块 15和 更新模块 16, 其中: 所述第一获取模块 11用于, 获取第一样本图像, 所述第一样本图像中包括未遮挡的第一 图像块和巳遮挡的第二图像块; 所述处理模块 12用于, 通过第一模型对所述第一样本图像进行处理, 得到所述第一图像 块对应的第一图像特征; 所述重构模块 13用于, 根据所述第一图像特征, 重构所述第二图像块, 得到第一图像; 所述确定模块 14用于, 根据所述第一图像特征, 确定所述第一图像块和所述第二图像块 的融合预测特征; 所述第二获取模块 15用于, 在目标图像中获取目标图像特征, 所述目标图像为所述第一 样本图像预处理之后的图像; 所述更新模块 16用于, 根据所述第一图像、 所述第二图像块、 所述融合预测特征和所述 目标图像特征, 更新所述第一模型的模型参数。 在一种可能的实施方式中, 所述更新模块 16具体用于: 根据所述第一图像、 所述第二图像块, 确定所述第一模型的第一损失函数; 根据所述融合预测特征和所述目标图像特征, 确定所述第一模型的第二损失函数; 根据所述第一损失函数和所述第二损失函数, 更新所述第一模型的模型参数。 在一种可能的实施方式中, 所述更新模块 16具体用于: 获取第二样本图像,并确定所述第二样本图像 的第二图像特征,所述第二样本图像为除所 述第一样本图像之外的其它图像; 根据所述融合预测特征、 所述目标图像特征和所述第二图像特征, 确定所述第二损失函 数。 在一种可能的实施方式中, 所述更新模块 16具体用于: 获取所述融合预测特征与所述目标图像特征之 间的第一相似度; 获取所述融合预测特征与所述第二图像特征之 间的第二相似度; 根据所述第一相似度和所述第二相似度, 确定所述第二损失函数。 在一种可能的实施方式中, 所述更新模块 16具体用于: 获取所述第一损失函数对应的第一权重和所述 第二损失函数对应的第二权重; 根据所述第一损失函数、所述第一权重、所述 第二损失函数和所述第二权重,更新所述第 一模型的模型参数。 在一种可能的实施方式中, 所述确定模块 14具体用于: 获取第一向量; 将所述第一向量和所述第一图像特征进行融合 处理, 得到融合向量; 根据所述融合向量得到所述融合预测特征。 在一种可能的实施方式中, 所述第二获取模块 15具体用于: 根据所述第二图像块在所述第一样本图像中的 位置, 在所述目标图像中确定第一区域; 对所述第一区域进行偏移处理, 得到第二区域; 将所述目标图像中的第二区域内的图像块对应 的图像特征, 确定为所述目标图像特征。 本公开实施例提供的模型训练装置,可用于执 行上述方法实施例的技术方案,其实现原理 和技术效果类似, 本实施例此处不再赘述。 图 10为本公开实施例提供的一种图像处理装置的 构示意图。请参见图 10, 该图像处理 装置 20包括处理模块 21和分类模块 22, 其中: 所述处理模块 21用于, 通过第一模型对多张图像进行处理, 得到所述多张图像对应的多 个图像特征, 所述第一模型为通过重构图像对比学习结合预 测特征对比学习训练得到的模型; 所述分类模块 22用于, 根据所述多个图像特征, 对所述多张图像进行分类。 本公开实施例提供的图像处理装置,可用于执 行上述方法实施例的技术方案,其实现原理 和技术效果类似, 本实施例此处不再赘述。 图 11为本公开实施例提供的一种电子设备的结构 意图。请参见图 11 , 其示出了适于用 来实现本公开实施例的电子设备 1100的结构示意图, 该电子设备 1100可以为终端设备或电 子设备。其中, 终端设备可以包括但不限于诸如移动电话、 笔记本电脑、数字广播接收器、个 人数字助理 (Personal Digital Assistant, PDA)、平板电脑 ( Portable Android Device , PAD)、 便携式多媒体播放器 (Portable Media Player, PMP) 、 车载终端 (例如车载导航终端)等等的 移动终端以及诸如数字 TV、 台式计算机等等的固定终端。 图 11示出的电子设备仅仅是一个 示例, 不应对本公开实施例的功能和使用范围带来任 何限制。 如图 11所示,电子设备 1100可以包括处理装置 (例如中央处理器、图形处理器等 ) 1101 , 其可以根据存储在只读存储器( Read Only Memory, ROM ) 1102中的程序或者从存储装置 1108 加载到随机访问存储器 ( Random Access Memory , RAM) 1103中的程序而执行各种适当的动 作和处理。 在 RAM 1103中, 还存储有电子设备 1100操作所需的各种程序和数据。 处理装置 1101、 ROM 1102以及 RAM 1103通过总线 1104彼此相连。 输入 /输出 (I/O) 接口 1105也连 接至总线 1104o 通常, 以下装置可以连接至 I/O接口 1105: 包括例如触摸屏、触摸板、键盘、 鼠标、摄像 头、麦克风、加速度计、陀螺仪等的输入装置 1106;包括例如液晶显示器 (Liquid Crystal Display, LCD) 、 扬声器、 振动器等的输出装置 1107; 包括例如磁带、 硬盘等的存储装置 1108; 以及 通信装置 1109= 通信装置 1109可以允许电子设备 1100与其他设备进行无线或有线通信以交 换数据。 虽然图 11示出了具有各种装置的电子设备 1100, 但是应理解的是, 并不要求实施或 具备所有示出的装置。 可以替代地实施或具备更多或更少的装置。 特别地, 根据本公开的实施例, 上文参考流程图描述的过程可以被实现为计算 机软件程 序。例如,本公开的实施例包括一种计算机程 序产品,其包括承载在计算机可读介质上的计 算 机程序,该计算机程序包含用于执行流程图所 示的方法的程序代码。在这样的实施例中,该 计 算机程序可以通过通信装置 1109从网络上被下载和安装, 或者从存储装置 1108被安装, 或 码, 上述程序设计语言包括面向对象的程序设计语 言一诸如 Java、 Smalltalk, C++, 还包括常 规的过程式程序设计语言一诸如 “C”语言或类似的程序设计语言。程序代码 以完全地在用 户计算机上执行、部分地在用户计算机上执行 、作为一个独立的软件包执行、部分在用户计 算 机上部分在远程计算机上执行、或者完全在远 程计算机或服务器上执行。在涉及远程计算机 的 情形中, 远程计算机可以通过任意种类的网络 -包括局域网 (Local Area Network, LAN) 或广域网 (Wide Area Network, WAN) 一连接到用户计算机, 或者, 可以连接到外部计算机 (例如利用因特网服务提供商来通过因特网连 ) 。 附图中的流程图和框图,图示了按照本公开各 种实施例的系统、方法和计算机程序产品的 可能实现的体系架构、功能和操作。在这点上 ,流程图或框图中的每个方框可以代表一个模 块、 程序段、或代码的一部分, 该模块、程序段、或代码的一部分包含一个或 多个用于实现规定的 逻辑功能的可执行指令。也应当注意,在有些 作为替换的实现中,方框中所标注的功能也可 以 以不同于附图中所标注的顺序发生。 例如, 两个接连地表示的方框实际上可以基本并行地 执 行, 它们有时也可以按相反的顺序执行, 这依所涉及的功能而定。 也要注意的是, 框图和 /或 流程图中的每个方框、 以及框图和 /或流程图中的方框的组合, 可以用执行规定的功能或操作 的专用的基于硬件的系统来实现, 或者可以用专用硬件与计算机指令的组合来实 现。 描述于本公开实施例中所涉及到的单元可以通 过软件的方式实现, 也可以通过硬件的方 式来实现。其中, 单元的名称在某种情况下并不构成对该单元本 身的限定, 例如, 第一获取单 元还可以被描述为 “获取至少两个网际协议地址的单元” 。 本文中以上描述的功能可以至少部分地由一个 或多个硬件逻辑部件来执行。例如,非限制 性地,可以使用的示范类型的硬件逻辑部件包 括:现场可编程门阵列 (Field Programmable Gate Array, FPGA) 、 专用集成电路 (Application-specific Integrated Circuit, ASIC) 、 专用标准产 品 (Application Specific Standard Product, ASSP) 、 片上系统 (System on Chip, SOC) 、 复杂 可编程逻辑设备 ( Complex Programmable Logic Device , CPLD) 等等。 在本公开的上下文中,机器可读介质可以是有 形的介质,其可以包含或存储以供指令执行 系统、装置或设备使用或与指令执行系统、装 置或设备结合地使用的程序。机器可读介质可 以 是机器可读信号介质或机器可读储存介质。机 器可读介质可以包括但不限于电子的、磁性的 、 光学的、 电磁的、 红外的、 或半导体系统、 装置或设备, 或者上述内容的任何合适组合。机器 可读存储介质的更具体示例会包括基于一个或 多个线的电气连接、便携式计算机盘、硬盘、 随 机存取存储器 (RAM)、只读存储器 (ROM)、可擦除可编程只读存储器 (Erasable Programmable ROM, EPROM或快闪存储器) 、 光纤、 便捷式紧凑盘只读存储器 (Compact disk ROM, CD- ROM) , 光学储存设备、 磁储存设备、 或上述内容的任何合适组合。 第一方面, 本公开实施例提供一种模型训练方法, 该方法包括: 获取第一样本图像, 所述第一样本图像中包括未遮挡的第一图像块 和巳遮挡的第二图像 块; 通过第一模型对所述第一样本图像进行处理, 得到所述第一图像块对应的第一图像特征; 根据所述第一图像特征,重构所述第二图像块 ,得到第一图像, 以及根据所述第一图像特 征, 确定所述第一图像块和所述第二图像块的融合 预测特征; 在 目标图像中获取目标图像特征, 所述目标图像为所述第一样本图像预处理之后 的图像; 根据所述第一图像、所述第二图像块、所述融 合预测特征和所述目标图像特征,更新所述 第一模型的模型参数。 根据本公开一个或多个实施例,根据所述第一 图像、所述第二图像块、所述融合预测特征 和所述目标图像特征, 更新所述第一模型的模型参数, 包括: 根据所述第一图像、 所述第二图像块, 确定所述第一模型的第一损失函数; 根据所述融合预测特征和所述目标图像特征, 确定所述第一模型的第二损失函数; 根据所述第一损失函数和所述第二损失函数, 更新所述第一模型的模型参数。 根据本公开一个或多个实施例,根据所述融合 预测特征和所述目标图像特征,确定所述第 一模型的第二损失函数, 包括: 获取第二样本图像,并确定所述第二样本图像 的第二图像特征,所述第二样本图像为除所 述第一样本图像之外的其它图像; 根据所述融合预测特征、 所述目标图像特征和所述第二图像特征, 确定所述第二损失函 数。 根据本公开一个或多个实施例,根据所述融合 预测特征、所述目标图像特征和所述第二图 像特征, 确定所述第二损失函数, 包括: 获取所述融合预测特征与所述目标图像特征之 间的第一相似度; 获取所述融合预测特征与所述第二图像特征之 间的第二相似度; 根据所述第一相似度和所述第二相似度, 确定所述第二损失函数。 根据本公开一个或多个实施例,根据所述第一 损失函数和所述第二损失函数,更新所述第 一模型的模型参数, 包括: 获取所述第一损失函数对应的第一权重和所述 第二损失函数对应的第二权重; 根据所述第一损失函数、所述第一权重、所述 第二损失函数和所述第二权重,更新所述第 一模型的模型参数。 根据本公开一个或多个实施例,根据所述第一 图像特征,确定所述第一图像块和所述第二 图像块的融合预测特征, 包括: 获取第一向量; 将所述第一向量和所述第一图像特征进行融合 处理, 得到融合向量; 根据所述融合向量得到所述融合预测特征。 根据本公开一个或多个实施例, 在目标图像中获取目标图像特征, 包括: 根据所述第二图像块在所述第一样本图像中的 位置, 在所述目标图像中确定第一区域; 对所述第一区域进行偏移处理, 得到第二区域; 将所述目标图像中的第二区域内的图像块对应 的图像特征, 确定为所述目标图像特征。 第二方面, 本公开实施例提供一种图像处理方法, 该方法包括: 通过第一模型对多张图像进行处理,得到所述 多张图像对应的多个图像特征,所述第一模 型为通过重构图像对比学习结合预测特征对比 学习训练得到的模型;可选的,第一模型为第 一 方面任一项所述的第一模型。 根据所述多个图像特征, 对所述多张图像进行分类。 第三方面,本公开实施例提供一种模型训练装 置,该模型训练装置包括第一获取模块、处 理模块、 重构模块、 确定模块、 第二获取模块和更新模块, 其中: 所述第一获取模块用于,获取第一样本图像, 所述第一样本图像中包括未遮挡的第一图像 块和巳遮挡的第二图像块; 所述处理模块用于,通过第一模型对所述第一 样本图像进行处理,得到所述第一图像块对 应的第一图像特征; 所述重构模块用于, 根据所述第一图像特征, 重构所述第二图像块, 得到第一图像; 所述确定模块用于,根据所述第一图像特征, 确定所述第一图像块和所述第二图像块的融 合预测特征; 所述第二获取模块用于,在目标图像中获取目 标图像特征,所述目标图像为所述第一样本 图像预处理之后的图像; 所述更新模块用于,根据所述第一图像、所述 第二图像块、所述融合预测特征和所述目标 图像特征, 更新所述第一模型的模型参数。 在一种可能的实施方式中, 所述更新模块具体用于: 根据所述第一图像、 所述第二图像块, 确定所述第一模型的第一损失函数; 根据所述融合预测特征和所述目标图像特征, 确定所述第一模型的第二损失函数; 根据所述第一损失函数和所述第二损失函数, 更新所述第一模型的模型参数。 在一种可能的实施方式中, 所述更新模块具体用于: 获取第二样本图像,并确定所述第二样本图像 的第二图像特征,所述第二样本图像为除所 述第一样本图像之外的其它图像; 根据所述融合预测特征、 所述目标图像特征和所述第二图像特征, 确定所述第二损失函 数。 在一种可能的实施方式中, 所述更新模块具体用于: 获取所述融合预测特征与所述目标图像特征之 间的第一相似度; 获取所述融合预测特征与所述第二图像特征之 间的第二相似度; 根据所述第一相似度和所述第二相似度, 确定所述第二损失函数。 在一种可能的实施方式中, 所述更新模块具体用于: 获取所述第一损失函数对应的第一权重和所述 第二损失函数对应的第二权重; 根据所述第一损失函数、所述第一权重、所述 第二损失函数和所述第二权重,更新所述第 一模型的模型参数。 在一种可能的实施方式中, 所述确定模块具体用于: 获取第一向量; 将所述第一向量和所述第一图像特征进行融合 处理, 得到融合向量; 根据所述融合向量得到所述融合预测特征。 在一种可能的实施方式中, 所述第二获取模块具体用于: 根据所述第二图像块在所述第一样本图像中的 位置, 在所述目标图像中确定第一区域; 对所述第一区域进行偏移处理, 得到第二区域; 将所述目标图像中的第二区域内的图像块对应 的图像特征, 确定为所述目标图像特征。 第四方面,本公开实施例提供一种图像处理装 置,该图像处理装置包括处理模块和分类模 块, 其中: 所述处理模块用于,通过第一模型对多张图像 进行处理,得到所述多张图像对应的多个图 像特征, 所述第一模型为通过重构图像对比学习结合预 测特征对比学习训练得到的模型; 所述分类模块用于, 根据所述多个图像特征, 对所述多张图像进行分类。 第五方面, 本公开实施例提供一种电子设备, 包括: 处理器和存储器; 所述存储器存储计算机执行指令; 所述处理器执行所述存储器存储的计算机执行 指令, 使得所述至少一个处理器执行如上 第一方面以及第一方面各种可能涉及的所述模 型训练方法, 或者如上第二方面以及第二方面 各种可能涉及的所述图像处理方法。 第六方面,本公开实施例提供一种计算机可读 存储介质,所述计算机可读存储介质中存储 有计算机执行指令,当处理器执行所述计算机 执行指令时,实现如上第一方面以及第一方面 各 种可能涉及的所述模型训练方法, 或者如上第二方面以及第二方面各种可能涉及 的所述图像 处理方法。 第七方面,本公开实施例提供一种计算机程序 产品,包括计算机程序,所述计算机程序被 处理器执行时实现如上第一方面以及第一方面 各种可能涉及的所述模型训练方法, 或者如上 第二方面以及第二方面各种可能涉及的所述图 像处理方法。 第八方面,本公开实施例提供一种计算机程序 ,所述计算机程序被处理器执行时实现如上 第一方面以及第一方面各种可能涉及的所述模 型训练方法, 或者如上第二方面以及第二方面 各种可能涉及的所述图像处理方法。 以上描述仅为本公开的较佳实施例以及对所运 用技术原理的说明。 本领域技术人员应当 理解,本公开中所涉及的公开范围,并不限于 上述技术特征的特定组合而成的技术方案, 同时 也应涵盖在不脱离上述公开构思的情况下, 由上述技术特征或其等同特征进行任意组合而 形 成的其它技术方案。例如上述特征与本公开中 公开的(但不限于)具有类似功能的技术特征 进 行互相替换而形成的技术方案。 此外,虽然采用特定次序描绘了各操作,但是 这不应当理解为要求这些操作以所示出的特 定次序或以顺序次序执行来执行。在一定环境 下, 多任务和并行处理可能是有利的。同样地, 虽然在上面论述中包含了若干具体实现细节, 但是这些不应当被解释为对本公开的范围的限 制。在单独的实施例的上下文中描述的某些特 征还可以组合地实现在单个实施例中。相反地 , 在单个实施例的上下文中描述的各种特征也可 以单独地或以任何合适的子组合的方式实现在 多个实施例中。 尽管巳经采用特定于结构特征和 /或方法逻辑动作的语言描述了本主题, 但是应当理解所 附权利要求书中所限定的主题未必局限于上面 描述的特定特征或动作。相反,上面所描述的 特 定特征和动作仅仅是实现权利要求书的示例形 式。