Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
MEDICATION PURCHASE QUANTITY PREDICTION MODEL CONSTRUCTION METHOD AND APPARATUS, MEDIUM, AND ELECTRONIC DEVICE
Document Type and Number:
WIPO Patent Application WO/2024/018264
Kind Code:
A1
Abstract:
The present invention discloses a medication purchase quantity prediction model construction method and apparatus, a medium and an electronic device. The method comprises: obtaining sample information for a target medication within a preset time period, the sample information comprising the purchase times and medication utilization amounts of the target medicine; according to the purchase times of the target medication, and according to a time window, dividing the sample information into a plurality of sample data sets, each sample data set comprising a training set and a test set; constructing an initial model for predicting a medication purchase quantity; respectively using the training set in each sample data set to train the initial model, obtaining a plurality of prediction models corresponding to each of the training sets, and according to the test set corresponding to each training set, verifying the plurality of prediction models to obtain a target prediction model. The method of the present invention yields high-accuracy medication purchase quantity prediction.

Inventors:
YU SUE (SG)
WEI CHIAN TAN (SG)
JIN WEI (SG)
Application Number:
PCT/IB2022/056736
Publication Date:
January 25, 2024
Filing Date:
July 21, 2022
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
EVYD TECH LIMITED (SG)
International Classes:
G06N3/08; G16H70/40; G06N20/00; G06Q10/04; G06Q30/0202
Domestic Patent References:
WO2022039588A12022-02-24
Foreign References:
CN114066021A2022-02-18
CN112036795A2020-12-04
CN113361961A2021-09-07
Download PDF:
Claims:
权 利 要 求 书

1、一种 药品 采购 量预测 模型 的构建 方法 ,其特征 在于 ,该方法包 括: 获 取预 设时长 内 目标药 品的样 本信 息, 所述样 本信 息包括 所述 目标 药 品的采 购时 间和药 品使 用量 ; 根 据所 述 目标药 品的 采购 时间 及预 设滑 动窗 口将 所述 样本 信息 分 为 多组样 本数 据集 , 每一组样 本数据 集包 括训练 集和 测试 集; 构 建用 于预测 药品 采购量 的初 始模 型; 分 别利 用每 一组样 本数 据集 中的 训练 集对所 述初 始模 型进 行训 练, 得 到多个 与每 一训练 集对 应的 预测模 型, 并根据与每 一训 练集对 应的 测 试集 , 对多个 所述预 测模 型进 行验证 , 以得到 目标预 测模 型。

2、 根据权利要 求 1所述的 方法 , 其特征在 于, 每 一组样 本数 据集 的采购 时间 包括 第一时 间段 和第 二时间 段, 所述 第 一时间 段和 第二时 间段 组成所 述预 设滑 动窗 口的长 度; 每 个第 一时间 段对 应的样 本信 息组 成训练 集, 每个第二时 间段 对应 的样 本信 息组 成测试 集。

3、根据权 利要 求 2所述的 方法 ,其特征在于 ,所述样 本信息 还包 括: 药 品新增 使用 的用户 数量 。

4、根 据权 利要 求 1所述的方 法, 其特征在 于, 所述获 取预设 时长 内 目 标药 品的样 本信 息后 , 该方法还 包括 : 对所述 样本信 息进 行预 处理, 所述 预处 理包 括: 补 全所述 预设 时长 内所述 目标 药品 缺失 的样本 信息 ; 将 所述样 本信 息按 照设定 周期 进行 聚合 , 确定每个设 定周 期内 样本 信 息的汇 总值 ; 根 据每 个设 定周 期内 所述 样本 信息 的汇 总值 确定 每个 设定 周期 内 样本 信息 的对 应值 , 所述对应 值为包 括本 设定周 期在 内的 前设定 数量 个 设 定周期 的汇 总值 的平均 值。 5、根 据权 利要 求 2所述 的方 法, 其特征在 于, 所述根 据与每 一训 练 集对 应的 测试 集,对多 个所 述预测 模型 进行验 证, 以得到 目标预 测模 型, 包括 : 根 据与 每一所 述训 练集对 应的 测试 集中 的药品 使用 量, 确定与 所述 训练 集对 应的 预测模 型的 误差 ; 将 误差 最小的 预测 模型确 定为 目标 预测模 型。

6、根 据权 利要 求 5所述 的方 法, 其特征在 于, 所述根 据与每 一所 述 训练 集对 应的 测试集 中的 药品 使用量 , 确定与所 述训 练集对 应的 预测 模 型 的误差 , 包括: 将 所述 测试集 对应 的第 二时 间段 内的 药品使 用量 确定 为 目标结 果; 根 据所述 测试 集和 所述预 测模 型进 行预测 , 得到预 测结果 , 所述预 测 结果为 所述 测试集 对应 的第 二时间 段内 的药 品预测 量; 根 据所 述 目标结 果与 所述 预测 结果 确定 所述 测试 集关 联的 所述 预 测模 型的 误差 。

7、根 据权 利要 求 6所述 的方 法, 其特征在 于, 所述根 据所述 目标 结 果 和所述 预测 结果 确定 所述测 试集 关联 的所 述预 测模型 的误 差, 包括: 确 定相 同单位 时间 的药 品预测 量与 药品使 用量 的差值 ; 将 所有 单位 时间 对应 的所 述差 值的 平均 值确 定为 所述 预测 模型 的 误差 。

8、根据权 利要 求 3所述的 方法 ,其特征在于 ,得到目 标预测 模型 后, 该方 法还 包括 : 获 取历 史时间 段内 所述 目标药 品的 样本信 息, 所述样本信 息包 括目 标药 品使 用量 和 /或目标药品 新增 使用的 用户 数量 ; 将 所述样 本信 息输 入所述 目标 预测 模型进 行预 测, 得到所述 目标药 品在 预测 时间 段的采 购量 ; 其 中, 所述历 史时 间段 的时长 与所 述第一 时间 段相 同, 所述预 测时 间段 的时 长与 所述第 二时 间段 相同 。

9、 一种药 品采购 量预 测模 型的构 建装 置, 其特征在 于, 所述装 置包 括 : 获 取模 块, 用于获 取预设 时长 内目 标药 品的样 本信 息, 所述样 本信 息包 括所 述目 标药 品的采 购时 间和药 品使 用量 ; 划 分模 块, 用于根 据所述 目标 药品 的采购 时间 及预 设滑动 窗口 将所 述样 本信 息分 为多组 样本 数据集 , 每一组 样本数 据集 包括 训练集 和测 试 集 ; 构 建模块 , 用于构 建用于 预测 药品采 购量 的初 始模型 ; 训 练模 块, 用于分 别利用 每一 组样 本数据 集中 的训 练集对 所述 初始 模 型进行 训练 , 得到多个 与每 一训练 集对 应的预 测模 型, 并根据与每 一 训练 集对 应的 测试集 , 对多个所 述预 测模 型进行 验证 , 以得到 目标预 测 模 型。

10 、 一种计算 机可 读存 储介质 , 所述存 储介 质存储 有计 算机 程序, 所述 计算 机程 序用于 执行 上述权 利要 求 1-8任一项 所述 的药品 采购 量预 测模 型的 构建 方法 。

11、 一种电子 设备, 包括: 处 理器 ; 用 于存储 所述 处理 器可执 行指 令的 存储器 ; 所 述处 理器, 用于从所述 存储 器中 读取所 述可 执行 指令, 并执行所 述指 令 以实现 上述权 利要 求 1-8任一项 所述 的药品 采购 量预测 模型 的构 建方 法 。

Description:
药 品 采购 量 预测 模 型的 构 建方 法 、 装置 、 介质及 电 子设 备 技术 领域 本 发明 涉及大 数据 的技术 领域 , 尤其涉及 一种 药品采 购量 预测 模型 的构 建方 法、 装置、 介质及电子 设备 。 背景 技术 卫 生部 门或医 疗机 构在预 测未 来药 品采购 量时 , 普遍采用 方式 是将 上 一年度 或 者上 半年度 采购 药 品使用 量 的月平 均数 量作 为 目标月 采购 量 , 目标月采 购量乘 以所 需采购 的月 数, 以此来预计 未来 几个月 所需 的 采购 量 。 但 是药 品采购 量往 往受到 多种 因素 的干扰 , 导致药 品采购 量预 测不 准确 。 若药品 采购量 预测 过多 , 因药品的 保质期 问题 等, 有可能导致 药 品 的浪费 ; 若药品采 购量 预测 过少, 造成药品库 存不 充分 , 可能导致 卫 生部 门或 医疗 机构无 法得 到充足 的药 品数 量。 发 明内容 本 发明 提供一 种药 品采购 量预 测模 型的构 建方 法、 装置、 介质及电 子 设备, 以至少解决 现有 技术 中存在 的以 上技术 问题 。 本 发明 一方面 提供 一种药 品采 购量 预测模 型的 构建方 法, 该方法包 括 : 采 集预 设时长 内 目标药 品的样 本信 息, 所述样 本信 息包括 所述 目标 药 品的采 购时 间和药 品使 用量 ; 根 据所 述 目标药 品的 采购 时间 及预 设滑 动窗 口将 所述 样本 信息 分 为 多组样 本数 据集 , 每一组样 本数据 集包 括训练 集和 测试 集; 构 建用 于预测 药品 采购量 的初 始模 型; 利 用每 一组样 本数 据集 中的训 练集 对所述 初始 模型进 行训 练, 得到 多个 与每 一训 练集对 应的 预测模 型, 并根据与每 一训 练集 对应 的测试 集, 对 多个所 述预 测模型 进行 验证 , 以得到 目标预测 模型 。 在 一可 实施方 式中 , 每一组样 本数 据集 的采购 时间包 括第 一时 间段 和第 二时 间段 , 所述第一 时间段 和第 二时 间段组 成所 述预 设滑动 窗口 的 长度 ; 每 个第 一时间 段对 应的样 本信 息组 成训练 集, 每个第二时 间段 对应 的样 本信 息组 成测试 集。 在 一可 实施方 式中 , 所述样本 信息 还包括 : 药品新 增使用 的用 户数 量 。 在 一可 实施 方式 中, 所述获 取预 设时 长的 目标药 品的 样本 信息 后, 该方 法还 包括 : 对所述样 本信 息进行 预处 理, 所述预 处理 包括 : 补 全所述 预设 时长 内所述 目标 药品 缺失 的样本 信息 ; 将 所述样 本信 息按 照设定 周期 进行 聚合 , 确定每个设 定周 期内 样本 信 息的汇 总值 ; 根 据每 个设 定周 期内 所述 样本 信息 的汇 总值 确定 每个 设定 周期 内 样本 信息 的对 应值 , 所述对应值 为包 括本 设定周 期在 内的 前设定 数量 个 设 定周期 的汇 总值 的平均 值。 在 一可 实施方 式中 , 所述根据 与每 一训练 集对 应的 测试集 , 对多个 所述 预测 模型 进行验 证, 以得到目标 预测 模型 , 包括: 根 据与 每一所 述训 练集对 应的 测试 集中 的药品 使用 量, 确定与 所述 训练 集对 应的 预测模 型的 误差 ; 将 误差 最小的 预测 模型确 定为 目标 预测模 型。 在 一可 实施方 式中 , 所述根据 与每 一所述 训练 集对应 的测 试集 中的 药 品使用 量, 确定与所述 训练集 对应 的预 测模型 的误 差, 包括: 将 所述 测试 集对 应的 第二 时间 段内 每个 单位 时间 的药 品使 用量 确 定为 目标 结果 ; 根 据所述 测试 集和 所述预 测模 型进 行预测 , 得到预 测结果 , 所述预 测 结果为 所述 测试集 对应 的第 二时间 段内 的药 品预测 量; 根 据所述 目标 结果 与所述 预测 结果 确定所 述测 试集关 联的 所述 预 测模 型的 误差 。 在 一可 实施方 式中 , 所述根据 所述 目标结 果和 所述预 测结 果确 定所 述测 试集 关联 的所述 预测 模型 的误差 , 包括: 确 定相 同单位 时间 的药 品预测 量与 药品使 用量 的差值 ; 将 所有 单位 时间 对应 的所 述差 值的 平均 值确 定为 所述 预测 模型 的 误差 。 在 一可 实施方 式中 , 得到目标 预测 模型后 , 该方法 还包括 : 获 取历 史时间 段内 所述 目标药 品的 样本信 息, 所述样本信 息包 括目 标药 品使 用量 和 /或目标药品 新增 使用的 用户 数量 ; 将 所述样 本信 息输 入所述 目标 预测 模型进 行预 测, 得到所 述目 标药 品在 预测 时间 段的采 购量 。 本 发明 另一方 面提 供药 品采购 量预 测模型 的构 建装置 , 所述装置 包 括 : 获 取模 块, 用于获 取预设 时长 内目 标药 品的样 本信 息, 所述样 本信 息包 括所 述目 标药 品的采 购时 间和药 品使 用量 ; 划 分模 块, 用于根 据所述 目标 药品 的采购 时间 及预 设滑动 窗口 将所 述样 本信 息分 为多组 样本 数据集 , 每一组 样本数 据集 包括 训练集 和测 试 集 ; 构 建模块 , 用于构 建用于 预测 药品采 购量 的初 始模型 ; 训 练模 块, 用于分 别利用 每一 组样 本数据 集中 的训练 集对 所述 初始 模 型进行 训练 , 得到多个 与每 一训练 集对 应的预 测模 型, 并根据与每 一 训练 集对 应的 测试集 , 对多个所 述预 测模 型进行 验证 , 以得到 目标预 测 模 型。 本 发明 再一方 面提 供一种 计算 机可 读存储 介质 , 所述存储 介质 存储 有计 算机 程序 , 所述计算 机程序 用于 执行 本发 明所述 的药 品采购 量预 测 模 型的构 建方 法。 本 发明 还一方 面提 供一种 电子 设备 , 包括: 处 理器 ; 用 于存储 所述 处理 器可执 行指 令的 存储器 ; 所 述处 理器, 用于从所述 存储 器中 读取所 述可 执行 指令, 并执行所 述指 令 以实现 本发 明所述 的药 品采购 量预 测模型 的构 建方 法。 在 本发 明的上 述方 案中 , 通过获取 预设时 长内 目标药 品的 样本 信息, 然 后根据 目 标药 品的采 购 时间及 预设 滑动 窗 口将样 本信 息分 为多 组样 本数 据集 , 每一组样 本数 据集包 括训 练集 和测试 集, 再分别利用 每一 组 样本 数据 集中 的训练 集对 初始模 型进 行训 练, 得到多 个与 每一训 练集 对 应 的预测 模型 , 并根据与 每一 训练集 对应 的测试 集, 对多个所述 预测 模 型进 行验 证, 以得到目标 预测模 型 。 本发明通过 根据 预设 滑动窗 口, 将 样本 信息 划分 为多个 训练 集和 多个测 试集 , 有利于提 高初 始模型 训练 的 效 果,进一 步确定 出最 优的 目标预 测模 型。相较 于现 有技术 的预 测方 法, 本 发明根 据目 标药 品的样 本数据 进行 模型 训练 、 筛选, 最后根据 目标 预 测模 型进 行预 测, 有利于 提高 目标药 品采 购量预 测的 准确度 。 附 图说明 图 1示出 了本发 明一 实施 例提供 的一 种药 品采购 量预 测模型 的构 建 方法 的流 程示 意图 ; 图 2示出 了本发 明又 一实 施例提 供的 一种药 品采 购量 预测模 型的 构 建方 法的 流程 示意 图; 图 3示出 本发 明一实 施例 提供 的一种 药品采 购量 预测 模型 的构建 装 置 的示意 图; 图 4示示 出本发 明又 一实 施例提 供的 一种药 品采 购量 预测模 型的 构 建装 置的 示意 图。 具体 实施 方式 为 使本 发明的 目的 、 特征、 优点能 够更加 的明 显和 易懂, 下面将结 合本 发 明实施 例中 的附图 , 对本发 明实施 例中 的技术 方案 进行清 楚、 完 整地 描述 , 显然, 所描述 的实施 例仅 仅是 本发 明一部 分实 施例 , 而非全 部 实施例 。 基于本发 明中 的实施 例, 本领域技术 人员 在没 有做 出创造 性 劳动 前提 下所 获得 的所有 其他 实施例 , 都属于本 发明 保护 的范 围。 如 图 1示出了本 发明 一实 施例提 供的 一种 药品采 购量 预测模 型的 构 建方 法的 流程 示意 图, 该方法包 括: 步 骤 S101、 获取预设时长 内目标 药品 的样 本信息 , 所述样本 信息包 括所 述 目标药 品的采 购时 间和 药品使 用量 。 获 取预 设时长 内的 目标药 品的 样本 信息 , 例如从卫生 部 门或医 疗机 构 的药品 数据 库中获 取样 本信 息, 卫生部 门或医 疗机 构的药 品数 据库 中 记录 有多 种药 品的采 购时 间、 药品采购量 、 每日药品 出库 记录 、 药品库 存数 量等 信息 。 药品采购 量为特 定时 间药 品的购 买数 量, 药品使用量 为 药 品在预 设时 长内 的使用 数量 , 根据药品 在预设 时长 内的 使用数 量预 测 药 品在未 来时 间所需 的药 品采购 量 。 药品使用量 可以 根据 每日药 品出 库 记录 确定 , 也可以根 据相 邻日期 药品 库存 数量确 定, 例如前一天 药品 库 存量 为 50, 当天药品 库存 量为 30, 则说明前 一天 药品 使用量 为 20。 样 本信 息除 了目标 药品 的采购 时间 和药 品使用 量外 , 还包括药 品编 码 和药 品名称 。 药品编 码用 于表征 药品 的唯 一性 , 对于药 品名称 相同, 但是 生产 厂家 可能不 同的 药品 , 本方案通 过获取 表征 药品 唯一性 的药 品 编码 后, 能够针对具 体的 目标 药品的 采购 量进行 预测 。 预 设时 长为当 前 日期以前 的时 间, 获取样本信 息可 以是 以天为 单位 、 以周 为单 位或 者月为 单位 , 本发明对 此不 做限制 。 例如采 集目标 药品 A 在预 设时 长内 每一天 的样 本信 息, 则样本 信息 中的药 品使 用量是 指当 天 的使 用量 , 或者采集 目标药 品 A在预 设时 长内每 一周 的样本 数据 , 则样 本数 据 中的药 品使用 量是 指本 周的使 用量 。 另外, 药品使用 量的 单位 为 盒 、 箱、 剂等常用药 品数 量单位 , 本发明 对此不 做限 制。 假 设预 设时长 为 2020年 1月 1 日至 2022年 1月 31 日, 单位时间 为 天, 获取目 标药 品 A在 2020年 1月 1 日至 2022年 1月 31 日每一天 的药 品使 用量 。 步 骤 S102、根据所述 目标药 品的采 购时 间及 预设滑 动窗 口将所 述样 本 信息分 为多 组样 本数 据集 , 每一组样 本数 据集 包括 训练集 和测 试集 。 其 中, 每一组样本 数据集 的采 购时 间包括 第一 时间段 和第 二时 间段, 所述 第一 时间 段和第 二时 间段 组成所 述预 设滑动 窗 口的长度 ; 每 个第 一时间 段对 应的样 本信 息组 成训练 集, 每个第二时 间段 对应 的样 本信 息组 成测试 集。 按 照预 设滑 动窗 口将 预设 时间 内采 集的 样本 信息 分作 多组 样本 数 据集 , 其中滑 动窗 口的长 度小 于预设 时长 的长度 , 每一个滑 动窗 口的 长 度 可以根 据设 定比 例划 分为第 一时 间段 和第 二时 间段 。 承接上述 示例 , 预 设时长 为 2020年 1月 1 日至 2022年 1月 31 日, 假设滑动窗 口长度 为 15个月 , 设定比例为 4: 1 , 即第一时间段的长度为 12个月 , 第二时间 段 的长度 为 3个月。 2020年 11月 1 日至 2022年 1月 31为 第一个 时间 窗 口, 其中 2020年 11月 1 日至 2021年 10月 31 日为第一 时间段 (即 组成 训练 集), 2021年 11月 1 日至 2022年 1月 31 日为第二 时间段 (即 组成 测试 集) 。 2020年 10月 1 日至 2021年 12月 31 日为第二个 时间 窗 口 , 其中 2020年 10月 1 日至 2021年 9月 30日为第 一时 间段 (即组成 训 练集 ) , 2021年 10月 1 日至 2021年 12月 31 日为第二 时间段 (即组 成 测试集 ) - 2020年 9月 1 日至 2021年 11月 30日为 第三个 时间 窗口 , 其 中 2020年 9月 1 日至 2021年 8月 31 日为第一时 间段 (即组成训 练 集 ) , 2021年 9月 1 日至 2021年 11月 30日为 第二 时间段 (即组成 测 试 集) 。 依此类推, 按照预设 滑动窗 口, 将预设时长 内的 样本信 息分 为 多 组样本 数据 集。 本发明按 照预 设滑动 窗 口对预 设时 长进行 切点 划分, 即 对预设 时长 内获取 的样 本信 息进行 多组 训练集 和测 试集 的划分 , 通过 这 种划分 方式 更有利 于后 续步 骤中模 型的 训练 和筛选 , 提高模型 的鲁 棒 性 。 步 骤 S103、 构建用于预测 药品 采购 量的初 始模 型。 为 了确 定最优 的 目标预测 模型 , 本方案构 建至 少一个 初始 模型 , 例 如 初始模 型可 包括 LSTM (Long Short-Term Memory) 模型和 ARIMA (Autoregressive Integrated Moving Average model)模型, LSTM模型与 ARIMA 模 型为本 实施 例的 示例性 说明 , 本发明 的初始 模型 并不 限于这 两种 。 步 骤 S104、分别利用每 一组 样本 数据集 中的 训练集 对所 述初 始模型 进 行训练 , 得到多个 与每 一训 练集对 应的 预测模 型, 并根据与每 一训 练 集 对应 的测试 集,对多 个所 述预测 模型 进行 验证 , 以得到目标预 测模 型。 假 设将 预设时 长划 分为 三个时 间窗 口,则可以 得到 3个样本 数据 集, 即 3组训 练集和 测试 集, 为了方便描 述, 第一组 训练 集用 Ml表 示, 第 一 组测试 集用 N1表 示; 第二组 训练 集用 M2表 示, 第二组测试 集用 N2 表 示; 第三组训 练集用 M3 表示 , 第三组测试 集用 N3表 示。假 设上一 步 骤 S102共构 建 2种初始模 型, 分别记为初 始模 型 1和初始模 型 2 o 用 训练 集 Ml 对初 始模 型 1进行训 练, 可以得 到与初 始模 型 1关联 的 训练集 Ml 对应 的预测 模型 Y11; 用 训练 集 Ml 对初 始模 型 2进行训 练, 可以得 到与初 始模 型 2关联 的训 练集 Ml 对应 的预测 模型 Y12; 用 训练集 M2 对初 始模 型 1进行训 练, 可以得 到与初 始模 型 1关联 的训 练集 M2 对应 的预测 模型 Y21; 用 训练集 M2 对初 始模 型 2进行训 练, 可以得 到与初 始模 型 2关联 的训 练集 M2 对应 的预测 模型 Y22; 用 训练集 M3 对初 始模 型 1进行训 练, 可以得 到与初 始模 型 1关联 的训 练集 M3 对应 的预测 模型 Y31; 用 训练集 M3 对初 始模 型 2进行训 练, 可以得 到与初 始模 型 2关联 的训 练集 M3 对应 的预测 模型 Y32。 使 用相 同初始 模型 , 但是由于 训练 集不 同, 得到的 预测模 型中 各参 数值 可能 会存 在差异 , 因此,预测模 型的个 数=初 始模 型的 数量 X训练集 的个 数 。 根 据测 试集 N1、 测试集 N2、 测试集 N3 , 对所有预 测模 型 Y11、 Y12 、 Y21、 Y22、 Y31、 Y32进行验证 , 以得到 目标预测 模型 , 即从所有 预测 模型 中筛 选出预 测精 度最 高的模 型作 为目标 预测 模型 。 在 本发 明的上 述方 案中 , 通过获取 预设时 长内 目标药 品的 样本 信息, 然 后根据 目 标药 品的采 购 时间及 预设 滑动 窗 口将样 本信 息分 为多 组样 本数 据集 , 每一组样 本数 据集包 括训 练集 和测试 集, 再分别利用 每一 组 样本 数据 集中 的训练 集对 初始模 型进 行训 练, 得到多 个与 每一训 练集 对 应 的预测 模型 , 并根据与 每一 训练集 对应 的测试 集, 对多个所述 预测 模 型进 行验 证, 以得到目标 预测模 型; 本发明通过 根据 预设 滑动窗 口, 将 样本 信息 划分 为多个 样本 数据集 , 即多个 训练集 和多 个测 试集 , 有利于 提 高初始 模型 训练 的效果 , 进一步筛 选出 最优 的目标 预测 模型 。 相较于 现 有技术 的预 测方 法, 本发明根据 目标 药品 的样 本数据 进行 模型 训练 、 筛选 , 最后根 据目标 预测 模型进 行预 测, 有利于提高 目标 药品采 购量 预 测 的准确 度。 在 一个 示例 中, 所述样 本信 息还 包括 : 药品新增 使用 的用 户数 量。 由 于药 品新增 使用 的用户 数量 对于 药品的 需求 量有影 响, 因此获取 样本 数据 时, 还要获 取药 品新增 使用 的用户 数量 。 假设目标药 品 A针对 新 型冠状 病毒 肺炎患 者使 用, 则要采集单 位时 间内新 增的新 型冠 状病 毒 肺炎 患确 诊病 例数量 , 例如根据 相关 单位 对于新 型冠 状病毒 肺炎 每日 的 新增 确诊 病例 的统计 , 获取预设 时长 内每 日新增 新型 冠状病 毒肺 炎确诊 病例 数量 。 当某地 区出现特 定传染病或 者存在影 响目标药 品采购量 的环境因素 时, 导 致在 未来时间段 与特定传 染病相关 联的药物 的使用量会 增加, 预测与特定传 染 病关 联的药物时 , 综合药品新增 使用 的用户 数量 和药 品使用 量这 两个 因素 对初 始模 型进 行训练 , 有利于 提高 目标预 测模型 的准 确度 。 预测与特 定 传染 病没 有关 联的药 物时 , 则仅用该 药品 在预设 时长 内的 药品使 用量 对 初始 模型 进行 训练 即可。 假 设某 地区 出现新 冠肺炎 疫情 ,预设时长 为 2020年 1月 1 日至 2022 年 1月 31 日, 目标药品 A与 新冠 肺炎有 关联 , 预测目标 药品 A未 来时 间段 的药 品采 购量时 , 获取的样 本信 息包 括目标 药品 A在 2020年 1月 1 日至 2022年 1月 31 日每一天的药 品使 用量及 每一 天药 品新增 使用 的 用户 数量 即每 日确诊 病例 人数 。 假设目标药 品 B与新冠 肺炎 无关 联, 预 测 目标药 品 B未来 时间段 的药 品采购 量时 , 获取的样本 信息 包括 目标药 品 B在 2020年 1月 1 日至 2022年 1月 31 日每一天 的药品 使用 量。 在 一个 示例 中, 所述获取 预设 时长 内目标 药品 的样 本信息 后, 该方 法还 包括 : 对所述样 本信 息进 行预处 理, 所述预处理 包括 : 补 全所述 预设 时长 内所述 目标 药品 缺失 的样本 信息 ; 将 所述样 本信 息按 照设定 周期 进行 聚合 , 确定每个设 定周 期内 样本 信 息的汇 总值 ; 根 据每 个设 定周 期内 所述 样本 信息 的汇 总值 确定 每个 设定 周期 内 样 本信 息的对 应值 , 所述对应 值为包 括本 设定 周期在 内的 前设 定数量 个 设 定周期 的汇 总值 的平均 值。 例 如在 预设 时长 内获取 的样本 信息 存在 缺失, 例如缺失某 一天 目标 药 品 A的 药品使 用量 或目 标药品 A 的采 购时 间, 或者缺 失某 一天药 品 新 增使用 的用 户数量 , 需要对 缺失 的数据 进行补 全 。 例如通过从 药品 数 据 库查 阅, 缺失日期 当天 目标药 品 A有没 有出库 记录 , 或者与缺 失日期 前 一天相 比, 目标药品 A 的库存 量有 没有减 少等 , 确定目标药 品 A在缺 失 日期 的使用 量。 若目标 药品 A在缺 失 日期当 天没有 出库 记录 , 或者与 缺 失日期 前一 天相 比, 目标药品 A的 库存量 没有 减少 , 则目标药品 A在 缺 失日期 的药 品使 用量为 0, 将 0补全 至样 本数 据中 。 若标药品 A在缺 失 日期 当天的 出库 记录为 5盒, 或者与缺失 日期 前一 天相 比, 目标药品 A 的 库存量 减少 5盒, 则将目标药 品 A在缺 失日 期当天 的药 品使用 量 5 补 全至样 本信 息中 。 将 样本 信息按 照设 定周 期进行 聚合 , 确定每个 设定 周期 内样本 信息 的 汇总值 。假设单 位时 间为天 ,设定周 期为 1个月,则确 定预 设时长 2020 年 1月 1 日至 2022年 1月 31 日, 共计 25个月, 每个月的样 本信 息汇 总 值, 即当月 目标药 品 A每天 的样本 信息 之和 。 样本信息 以目标 药品 A 的 药品使 用量 为例进 行说 明, 每个设定周 期内 样本信 息的 汇总值 如下 表 1 所示 : 表 1设定周 期内 样本 数据 的汇总 值

根 据每 个设 定周 期 内样本 信息 的汇 总值 确定 每个 设定 周期 内样 本 信 息的对 应值 , 对应值为 包括 本设定 周期 在内 的前设 定数 量个 设定周 期 的 汇总值 的平 均值 。 假设设定 数量为 3 , 则 2020年 1月和 2020年 2月 的 对应值 , 还为其 实际汇 总值 。 2020年 3月的对 应值 为 2020年 1月至 2020 年 3月的汇 总值 的平均 值, 即 (85+74+75) /3=78, 2020年 4月的 对 应值为 2020年 2月至 2020年 4月 的汇总 值的 平均值 ,即(74+75+90) /3=80, 依次类推 , 本实施 例不再 赘述 。 第 一时 间段 内每个 设定 周期 的对应 值组 成训练 集, 第二时间段 内每 个 设定周 期的 对应 值组成 测试 集。 承接上 述示 例, 其中一 组样 本数据 集 为 : 2020年 11月至 2021年 10月 , 这 12个月 的对 应值组 成训 练集 ; 2021 年 11月至 2022年 1月, 这 3个月的对 应值 组成 测试集 。 另一组样 本 数据集 为: 2020年 10月至 2021年 9月 , 这 12个月 的对应 值组成 训 练 集; 2021年 10月至 2021年 12月, 这 3个月 的对应 值组 成测 试集 。 在 一个 示例 中, 所述根 据与每 一训 练集对 应的 测试 集, 对多个 所述 预 测模型 进行 验证 , 以得到 目标预测 模型 , 包括: 根 据与 每一所 述训 练集 对应 的测试 集中 的药品 使用 量, 确定与 所述 训 练集对 应的 预测模 型的 误差 ; 将 误差 最小 的预测 模型 确定为 目标 预测模 型。 根 据测 试集和 训练 集的对 应关 系, 对由训练集 训练得 到的 预测 模型 进行 误差 计算 ,例如测 试集 N1与 训练集 Ml 对应 , 由训练集 Ml训 练得 到 的预测 模型 为 Y11 和 Y12,根 据测 试集 N1 ,确定预测 模型 Y11和 Y12 的误 差 。 同理, 根据测试 集 N2, 确定预 测模型 Y21 和 Y22的误 差; 根 据测 试集 N3 , 确定预测模 型 Y31和 Y32的 误差 。 误 差可 以为平 均绝 对百 分比误 差 (MAPE )、 平均绝对误差 (MAE ) 中 的一种 或多 种。 误差越 小, 说明模型精 确度越 高, 预测越准确 , 因此 将误 差结 果最 小的预 测模 型确 定为 目标预 测模型 。 在 一个 示例 中, 所述根据 与每 一所 述训练 集对 应的测 试集 中的 药品 使用 量, 确定与所述 训练 集对应 的预 测模 型的误 差, 包括: 将 所述 测试集 对应 的第 二时 间段 内的 药品使 用量 确定 为 目标结 果; 根 据所述 测试 集和 所述预 测模 型进 行预测 , 得到预 测结果 , 所述预 测 结果为 所述 测试集 对应 的第 二时间 段内 的药 品预测 量; 根 据所述 目标 结果 与所述 预测 结果 确定所 述测 试集关 联的 所述 预 测模 型的 误差 。 以 确定预 测模 型 Y11的误 差为例 进行 说明 ,预测模型 Y11对 应的 训 练集 为 Ml , 与训练集 Ml 对应 的测试 集为 N1。 确定测 试集 N1 中的药 品使 用量 为目 标结果 , 假设测 试集 N1对 应的 第二 时间段 为 2021 年 11 月至 2022年 1月, 根据表 1示例 , 计算测试集 N1 中各月 份的对 应值 为 各 月份的 药品 使用量 , 如下表 2所示 : 表 2: 测试集 N1中的 药品使 用量 因 此, 测试集 N1对 应的 目标结 果为 {98, 90, 86}; 将训练集 Ml输入 至预 测模 型 Yl l中, 假设得到的 药品 预测量 如下 表 3所示: 表 3: 预测模型 Y11预测 的药品 预测 量 测 试集 N1输入 至预测 模型 Y11后,得到 的预测 结果 为{100,92,85}。 在 一个 示例 中, 所述根据 所述 目标 结果和 所述 预测 结果确 定所 述测 试集 关联 的所 述预测 模型 的误 差, 包括: 确 定相 同单位 时间 的药 品预测 量与 药品使 用量 的差值 ; 将 所有 单位 时间 对应 的所 述差 值的 平均 值确 定为 所述 预测 模型 的 误差 。 以 平均 绝对误 差 (MAE) 为例说 明, 预测模 型的误 差根 据以 下公式 进行 计算 : 其 中 n表示测试 集中 的数 据总数 , a为目 标结果 , 即药品使 用量 , f 为预 测结 果, 即药品预测 量。 结 合表 2和表 3计算预 测模 型 Y11的误 差, 即:

MAE= (2+2+1) /3=5/3 o 同 理, 计算出其它 预测模 型 Y12、 Y21、 Y22、 Y31、 Y32 的误差, 确定 误差 最小 的预测 模型 为目标 预测 模型 。 如 图 2所示, 本发明 又一 实施例 提供 一种 药品采 购量 预测模 型的 构 建方 法的 流程 示意 图, 得到目 标预测 模型 后, 该方法 还包 括: 步 骤 S105、 获取历史时间 段内所 述 目标药 品的样 本信 息, 所述样本 信 息包括 目标 药品使 用量 和 /或目标药 品新增 使用 的用户 数量 ;将所述 样 本信 息输 入所 述目标 预测 模型 进行预 测, 得到所述 目标药 品在预 测时 间 段 的采购 量; 其中, 所述历史 时间段 的时 长与所 述第 一时 间段相 同, 所 述 预测时 间段 的时长 与所 述第 二时 间段相 同。 若 预测 的目标 药品 与当 前环境 因素 或特定 传染 病相 关联 , 则获取目 标 药品在 历史 时间段 内的 样本 信息后 , 将目标药 品使 用量 和目标 药品 新 增使 用的 用户 数量输 入至 目标 预测模 型, 即可以预测 得到 该目标 药品 在 预 测时 间段的 采购量 。 若 预测 的目标 药品 与当 前环境 因素 或特定 传染 病没 有关联 , 则获取 目 标药 品在历 史时 间段内 的样 本信息 后, 将目标药品 使用 量输入 至 目标 预 测模型 , 即可以预 测得 到该 目标药 品在 预测 时间段 的采 购量 。 假 设最 终确定 的 目标预测 模型 为 Y31 , 预测 2022年 7月至 2022年 9 月 目标药 品 D 的采购量, 若目标 药品 D 与当 前疫情 没有 关联 , 则将 2021 年 7月至 2022年 6月的药 品使 用量输 入 目标预 测模型 Y31 , 则可 以输 出 2022年 7月至 2022年 9月 目标药 品 D 的采购 量。 若 目标 药品 D与当 前疫 情有关 联, 预测目标药 品 D在 2022年 7月 至 2022年 9月的采 购量 , 需要将 2021年 7月至 2022年 6月的药 品使 用 量及 目标药 品新增 使用 数量输 入 目标预 测模型 Y31 , 则可以输出 2022 年 7月至 2022年 9月目 标药 品 D 的采购 量。 其中目标药 品新 增使用 数 量 即 2021年 7月至 2022年 6月每月 的新增 确诊 病例数 量。 如 图 3示出了 本发明 又一 实施例 提供 的一 种药品 采购 量预测 模型 的 构建 装置 的示 意图 , 该装置包括 : 获 取模 块 10, 用于获取预 设时长 内 目标药 品的样 本信 息, 所述样本 信 息包括 所述 目标药 品的 采购 时间和 药品 使用量 ; 划 分模 块 20,用 于根据 所述 目标 药品 的采购 时间及 预设 滑动 窗口将 所述 样本 信息 分为 多组样 本数 据集 , 每一组样本 数据 集包 括训练 集和 测 试集 ; 构 建模块 30, 用于构建用 于预测 药品 采购 量的初 始模 型; 训 练模 块 40,用 于分别 利用 每一 组样本 数据 集中 的训练 集对所 述初 始模 型进 行训 练, 得到多 个与 每一训 练集 对应 的预测 模型 , 并根据与 每 一训 练集 对应 的测试 集, 对多个所述 预测 模型进 行验 证, 以得到目标 预 测模 型 。 在 一个 示例 中, 每一组样 本数 据集 的采购 时间 包括第 一时 间段 和第 二 时间段 , 所述第一 时间 段和第 二时 间段 组成所 述预 设滑 动窗 口的长 度。 在 一个 示例 中, 所述样 本信 息还 包括 : 药品新增 使用 的用 户数 量。 在 一个 示例 中, 该装置还 包括 : 预 处理 模块 , 用于对所 述样 本信 息进 行预 处理 , 所述预处 理包 括: 补 全所述 预设 时间 内所述 目标 药品 缺失 的样本 信息 ; 将 所述样 本信 息按 照设定 周期 进行 聚合 , 确定每个设 定周 期内 样本 信 息的汇 总值 ; 根 据每 个设 定周 期内 所述 样本 信息 的汇 总值 确定 每个 设定 周期 内 样本 信息 的对 应值 , 所述对应值 为包 括本 设定周 期在 内的 前设定 数量 个 设 定周期 的汇 总值 的平均 值。 在 一个 示例 中, 所述训练 模块 40, 包括: 误 差确 定单元 401、 根据与 每一所 述训 练集 对应 的测试 集中 的药品 使用 量, 确定与所述 训练 集对应 的预 测模 型的误 差; 确 定单元 402, 用于将误差 最小 的预测 模型 确定 为目标 预测 模型 。 在 一个 示例 中, 所述误差 确定 单元 401 , 具体用于: 将 所述 测试集 对应 的第 二时 间段 内的 药品使 用量 确定 为 目标结 果; 根 据所述 测试 集和 所述预 测模 型进 行预测 , 得到预 测结果 , 所述预 测 结果为 所述 测试集 对应 的第 二时间 段内 的药 品预测 量; 根 据所述 目标 结果 与所述 预测 结果 确定所 述测 试集关 联的 所述 预 测模 型的 误差 。 在 一个 示例 中, 所述根据 所述 目标 结果和 所述 预测 结果所 述测 试集 关联 的确 定所 述预测 模型 的误差 , 包括: 确 定相 同单位 时间 的药 品预测 量与 药品使 用量 的差值 ; 将 所有 单位 时间 对应 的所 述差 值的 平均 值确 定为 所述 预测 模型 的 误差 。 如 图 4所示, 本发明 又一 实施例 提供 一种 药品采 购量 预测模 型的 构 建装 置的 示意 图, 该装置 还包括 : 预 测模 块 50, 用于根 据历史 时间 段内 所述 目标药 品的 样本信 息, 通 过所 述 目标预 测模型 进行 预测 , 得到所述 目标药 品在 预测 时间段 的采 购 量 ; 其中, 所述历史 时间 段的 时长与 所述 第一 时间段 相同 , 所述预测 时 间段 的时 长与 所述第 二时 间段 相同 。 本 发明 再一方 面提 供一种 计算 机可 读存储 介质 , 所述存储 介质 存储 有计 算机 程序 , 所述计算 机程序 用于 执行 本发 明所述 的药 品采购 量预 测 模 型的构 建方 法。 本 发明 还一方 面提 供一种 电子 设备 , 包括: 处 理器 ; 用 于存储 所述 处理 器可执 行指 令的 存储器 ; 所 述处 理器, 用于从所述 存储 器中 读取所 述可 执行 指令, 并执行所 述指 令 以实现 本发 明所述 的药 品采购 量预 测模型 的构 建方 法。 除 了上述 方法 和设 备以外 , 本申请 的实施 例还 可以是 计算 机程 序产 品 , 其包括计 算机程 序指 令, 所述计 算机 程序指 令在 被处 理器运 行时 使 得所 述处 理器 执行本 说明 书上述 “示例 性方 法” 部分中 描述的 根据 本申 请各 种实 施例 的方法 中的 步骤 。 所 述计 算机 程序 产品 可以 以一 种或 多种 程序 设计 语言 的任 意组 合 来编 写用 于执 行本 申请实 施例 操作的 程序 代码 , 所述程序 设计语 言包 括 面 向对象 的程 序设计 语言 , 诸如 Java、 C++等, 还包括常规 的过 程式程 序 设计语 言, 诸如 “C”语言 或类 似的程 序设 计语 言。程序 代码 可以 完全 地在 用户 计算 设备上 执行 、 部分地在 用户 设备上 执行 、 作为一个 独立 的 软件 包执 行、 部分在用户 计算 设备上 部分 在远程 计算 设备 上执行 、 或者 完全 在远 程计 算设备 或服 务器 上执行 。 此 外, 本申请的实 施例还 可以 是计 算机可 读存 储介 质, 其上存 储有 计算 机程 序指 令, 所述计 算机程 序指 令在 被处理 器运 行时使 得所 述处 理 器执 行本 说明 书上述 “示例 性方 法” 部 分中描 述的 根据本 申请 各种 实施 例 的方法 中的 步骤 。 所 述计 算机 可读 存储 介质 可以 采用 一个 或多 个可 读介 质的 任意 组 合 。 可读介质 可以是 可读 信号 介质或 者可 读存储 介质 。 可读存储 介质 例 如可 以包 括但 不限于 电、 磁、 光、 电磁、 红外线、 或半导 体的系 统、 系 统或 器件 , 或者任意 以上 的组 合。 可读存 储介质 的更 具体 的例子 (非穷 举 的列表 ) 包括: 具有一 个或 多个导 线的 电连接 、 便携式 盘、 硬盘、 随 机存 取存 储器 (RAM )、 只读存储器 (ROM )、 可擦式可编 程只读 存储 器 (EPROM 或 闪存 )、 光纤、 便携式紧凑盘只 读存 储器 (CD-ROM )、 光存 储器 件、 磁存储器件 、 或者上述 的任 意合 适的组 合。 以 上结 合具体 实施 例描述 了本 申请 的基本 原理 , 但是, 需要指 出的 是 , 在本申请 中提及 的优 点、 优势、 效果等仅是 示例 而非 限制 , 不能认 为 这些优 点、 优势、 效果等 是本 申请的 各个 实施 例必 须具备 的 。 另外, 上述 公开 的具 体细节 仅是 为了 示例的 作用 和便于 理解 的作 用, 而非限 制, 上述 细节 并不 限制本 申请 为必 须采用 上述 具体 的细节 来实 现。 本 申请 中涉及 的器 件、 系统、 设备、 系统的方 框图仅 作为 例示 性的 例子 并且 不意 图要求 或暗 示必 须按照 方框 图示 出的方 式进 行连接 、 布置、 配置 。 如本领 域技术 人员 将认 识到的 , 可以按任 意方 式连 接、 布置、 配 置这 些器 件、 系统、 设备、 系统。 诸如 “包括”、 “包含” 、 “具有” 等等 的词 语是 开放 性词汇 , 指 “包括但 不限于” , 且可与其 互换使 用 。 这里所 使用 的词 汇 “或 ”和 “和” 指词 汇 “和 /或”, 且可与其互换使 用, 除非上 下文 明确 指示 不是如 此。 这里所使用 的词 汇 “诸如 ”指词 组 “如但不 限 于” , 且可与其 互换使 用。 还 需要 指出的 是, 在本申请的 系统 、 设备和方 法中 , 各部件或 各步 骤 是可 以分解 和 /或重新组 合的 。 这些分解 和 /或重新组 合应 视为本 申请 的等 效方 案。 提 供所 公开 的方 面的 以上 描述 以使 本领 域的 任何 技术 人员 能够 做 出或 者使 用本 申请 。 对这些方面 的各 种修 改对于 本领 域技 术人员 而言 是 非 常显而 易见 的, 并且在 此定义 的一 般原 理可 以应用 于其 他方面 而不 脱 离本 申请 的范 围。 因此, 本申请不意 图被 限制到 在此 示出 的方面 , 而是 按 照与在 此公 开的原 理和 新颖 的特征 一致 的最 宽范围 。 为 了例 示和描 述的 目的 已经给 出了 以上描 述。 此外, 此描述不 意图 将本 申请 的实 施例 限制到 在此 公开的 形式 。 尽管以上 已经 讨论 了多个 示 例方 面和 实施 例, 但是本 领域 技术人 员将 认识到 其某 些变 型、 修改、 改 变 、 添加和子 组合 。