Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
DIAGNOSIS OF SIGNS OF BRONCHOPULMONARY DISEASES ACCOMPANYING ILLNESS WITH COVID-19 VIRUS
Document Type and Number:
WIPO Patent Application WO/2022/191740
Kind Code:
A1
Abstract:
The invention relates to medicine and can be used in practical medicine for noninvasive diagnosis of diseases of the bronchopulmonary system. Three types of audio recordings of a patient are taken: cough, breathing and speech; a discrete integral transformation of the audio recordings is performed, the result of which is the obtaining of a set of spectrograms of those audio recordings; the spectrograms are additionally segmented into separate fragments with overlaps with respect to time; signal preprocessing methods using ultraprecise linear layers are applied to the resulting spectrogram fragments and produce a set of attribute vectors that are fed into the input of an ultraprecise neural network for classification, producing at the outlet a formed attribute vector; the resultant attribute vectors from the three initial audio recordings are combined, the combinations of the resultant vectors are transformed using a linear layer; and based on the results obtained, a conclusion regarding the patient's health is formed. The invention provides automation and simplification of the techological process for diagnosing COVID using in-deep machine learning methods.

Inventors:
SAMSONOV PAVEL ROMANOVICH (RU)
MIKHAILOV DMITRY MIKHAILOVICH (RU)
CHUMANSKAYA VERA VASILYEVNA (RU)
Application Number:
PCT/RU2022/050056
Publication Date:
September 15, 2022
Filing Date:
February 21, 2022
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
CARDIO MARKER LLC (RU)
International Classes:
A61B5/08; G10L25/18; G10L25/30; G10L25/66
Foreign References:
US20190088367A12019-03-21
TW201934082A2019-09-01
US20070118054A12007-05-24
US20100179438A12010-07-15
Attorney, Agent or Firm:
OOO ONLINE PATENT (RU)
Download PDF:
Claims:
ФОРМУЛА ИЗОБРЕТЕНИЯ

1. Способ диагностики признаков бронхолегочных заболеваний, сопутствующих заболеванию вирусом COVID-19, отличающийся тем, что осуществляют регистрацию трёх типов аудиозаписей от пациента: кашля, дыхания, речи, осуществляют дискретное интегральное преобразование аудиозаписей, результатом которого является получение набора спектрограмм этих аудиозаписей, проводят дополнительную сегментацию спектрограмм на отдельные фрагменты с пересечениями по времени, применяют к полученным фрагментам спектрограмм методы предобработки сигнала с применением сверхточных линейных слоев и получением набора векторов признаков, которые подают на вход сверточной нейронной сети для классификации с получение на выходе сформированного вектора признаков, проводят объединение полученных векторов признаков от трех исходных аудиозаписей, преобразуют объединения полученных векторов с применением линейного слоя и по полученным результатам формируют заключение о здоровье пациента.

2. Способ по п.1, отличающийся тем, что после регистрации трёх типов аудиозаписей от пациента: кашля, дыхания, речи, осуществляют извлечение спектральных характеристик аудиозаписи и передачу их на вход классических алгоритмов машинного обучения.

3. Способ по п. 1, отличающийся тем, что для получения спектрограмм используют оконное преобразование Фурье или вейвлет-преобразования.

4. Способ по п.1, отличающийся тем, что после предобработки фрагментов спектрограмм и получения векторов признаков, вектор подают на вход рекуррентной нейронной сети

5. Способ по п.1, отличающийся тем, что классификация признаков нейронной сетью осуществляют с применением механизма внимания.

Description:
ДИАГНОСТИКА ПРИЗНАКОВ БРОНХОЛЕГОЧНЫХ ЗАБОЛЕВАНИЙ, СОПУТСТВУЮЩИХ ЗАБОЛЕВАНИЮ ВИРУСОМ COVID-19

Изобретение относится к медицине и может быть использовано в практической медицине для неинвазивной диагностики заболеваний бронхолегочной системы.

Разработанное техническое решение характеризует способ диагностирования акустических признаков вызванных изменениями в дыхательном тракте, сопутствующих заболеванию Covid . Методами глубокого обучения решена задача регрессии, определения вероятности по записям кашля, дыхания и речи наличия у человека заражения вирусными заболеваниями, оказывающими влияние на дыхательный тракт человека, в частности вызванных вирусом COVID-19.

Известен (RU, патент 2304928, опубл. 27.08.2007) способ акустической диагностики очаговых изменений в легких человека , включающий регистрацию и вычисление спектра акустических сигналов проведенного звука голоса на поверхности грудной клетки в симметрично расположенных справа и слева точках обследования, измерение и сравнительную оценку их амплитуд. Спектр зарегистрированного сигнала вычисляют в полосе частот от 80 до 2000 Гц в логарифмическом масштабе по амплитуде в каждой точке обследования, измеряют амплитуды и частоты первого (А1, fl), второго (А2, f2), третьего (АЗ, f3) спектральных максимумов, расположенных на гармонически связанных частотах и имеющих уровень не ниже 60 дБ от уровня первого максимума, вычисляют отношения A12/f21, равное отношению (А1-А2) к (f2-fl), А23 32, равное (А2-АЗ) к (f3-f2), разность DA12 величин А1 и А2 над симметричными точками справа (D) и слева (S), при этом сравнение полученных величин проводят с соответствующими пороговыми значениями для данного типа заболевания, а патологическое снижение пневмотизации в точке обследования фиксируют, если выполняется, по крайней мере, одно из условий: A12/f21 меньше первого порогового значения данного параметра (A12/f21) ni , A23/f32 меньше первого порогового значения данного параметра (A23/f32) ni , fl больше порогового значения данного параметра (fl) n , DA12 меньше первого порогового значения данного параметра (DA12) для точек обследования правого легкого , DA12 больше второго порогового значения данного параметра (АА12) п2 для точек обследования левого легкого, а патологическое увеличение пневмотизации в точке обследования фиксируют, если A12/f21 больше второго порогового значения данного параметра (A12/f21) n2 и/или A23/f32 больше второго порогового значения данного параметра (A23/f32) n2 , причем величины первого и второго пороговых значений вычисляют как 5% и 95% персентили распределения данных параметров по группе здоровых.

Известен также (RU, патент2354285, опубл. 10.05.2009) способ диагностики обструктивных нарушений функций внешнего дыхания путем проведения бронхофонографии и регистрации респираторного цикла, причем оценивают следующие параметры: акустический эквивалент работы дыхательных мышц (АРД) в различных частотных диапазонах: АРД0 - 200-1200 Гц, АРД1 - 1200-12600 Гц, АРД2 - 5000-12600 Гц, АРДЗ - 1200-5000 Гц; вычисляют коэффициенты К1, К2, КЗ: К1=АРД1/АРД0х100, К2=АРД2/АРД0х100, КЗ=АРДЗ/АРД0х100; DK, соответствующий приросту показателей коэффициентов К, а именно АК=К форсированного выдоха - К спокойного дыхания/К спокойного дыхания c 100; индекс прироста коэффициента (ИПК)=АК2/АКЗ и при значениях в режиме спокойного дыхания: АРД1 и АРДЗ более 100 мДж; К1 и КЗ более 15; DK1 и DK3 менее 200% и ИПК 2 и более диагностируют обструктивные нарушения функций внешнего дыхания.

Также известен (RU, патент 2598051, опубл. 20.09.2016) Способ определения изменений голосовой функции человека при ХОБЛ, включающий измерения параметров изменения голосообразующей функции на основе акустического анализа с помощью компьютерной программы Specta PLUS, отличающийся тем, что проводят определение характеристик частоты основного тона, максимального времени фонации и участков голосового шума, последовательно в динамике и при увеличении на 10-й день лечения частоты основного тона до 142,6±15,2, максимального времени фонации до 20,5±2,9, участков голосового шума до "+" определяют улучшение голосовой функции человека.

Недостатком всех перечисленных технически решений следует признать их неприменимость к диагностике заболеваний, вызванных вирусом COVID-19.

Техническая проблема, решаемая использованием разработанного способа, состоит в расширении арсенала средств диагностики заболеваний, вызванных вирусом СО VID- 19.

Технический результат, достигаемый при реализации разработанного способа, состоит в автоматизации и упрощении технологического процесса по диагностике COVID методами глубокого машинного обучения.

Для достижения указанного технического результата предложено использовать разработанный способ диагностики признаков бронхолегочных заболеваний, сопутствующих заболеванию вирусом COVID-19. При реализации разработанного способа осуществляют регистрацию трёх типов аудиозаписей от пациента: кашля, дыхания, речи, осуществляют дискретное интегральное преобразование аудиозаписей, результатом которого является получение набора спектрограмм этих аудиозаписей, проводят дополнительную сегментацию спектрограмм на отдельные фрагменты с пересечениями по времени, применяют к полученным фрагментам спектрограмм методы предобработки сигнала с применением сверхточных линейных слоев и получением набора векторов признаков, которые подают на вход сверточной нейронной сети для классификации с получение на выходе сформированного вектора признаков, проводят объединение полученных векторов признаков от трех исходных аудиозаписей, преобразуют объединения полученных векторов с применением линейного слоя и по полученным результатам формируют заключение о здоровье пациента.

В некоторых вариантах реализации разработанного способа после регистрации трёх типов аудиозаписей от пациента: кашля, дыхания, речи, осуществляют извлечение спектральных характеристик аудиозаписи и передачу их на вход классических алгоритмов машинного обучения.

Для получения спектрограмм можно использовать оконное преобразование Фурье или вейвлет-преобразования.

В некоторых вариантах разработанного способа после предобработки фрагментов спектрограмм и получения векторов признаков, вектор подается на вход рекуррентной нейронной сети

Классификация признаков нейронной сетью осуществляют с применением механизма внимания.

Разработанное техническое решение характеризует способ диагностирования акустических признаков, вызванных изменениями в дыхательном тракте сопутствующих заболеванию Covid . Методами глубокого обучения решается задача регрессии, определения вероятности по записям кашля, дыхания и речи наличия у человека заражения вирусными заболеваниями, оказывающими влияние на дыхательный тракт человека. Способ включает конвертирование, подготовку, предобработку и анализ данных методами глубокого обучения. Для классификации заболеваний предложено использовать рекуррентная сеть со сверточной нейронной сетью в качестве энкодера и механизмом внимания.

Представленная технология представляет из себя серверное приложение для анализа медицинских акустических данных пациентов для выявления и классификации респираторных заболеваний, а также осложнений и отклонений вызванных наличием вирусов, в частности, COVID-19.

Коронавирусная инфекция стала настоящим испытанием для общественности. Невозможно не оценить труд врачей, столкнувшихся с огромным количеством пациентов. Однако, вспышка коронавируса обнажила некоторые проблемы в области здравоохранения, в частности, недостаток медицинских работников. В век высоких технологий стоит задуматься о снабжении больниц специальным программным обеспечением, способным помочь доктору в диагностировании заболевания. В связи с растущей популярностью методов машинного и глубокого обучения становится очевидным обращение к этой области для поиска решения.

На сегодняшний день существует несколько подходов, посвященных диагностированию респираторных и вирусных заболеваний. Основная идея большей части из них основана на обработке аудиосигналов человеческого тела: кашля, дыхания, звуков грудной клетки. По результатам исследования исследовательских групп простые бинарные классификаторы данных, в основе которых лежит логистическая регрессия (logit model), градиентный бустинг (gradient boosting) и метод опорных векторов (support vector machines) дают точность (precision) до 82%. Подход, использующий random forest получил точность (accuracy) классификации на тестовых данных достигла 66.74%. Некоторые исследователи идут по пути разработки классификатора, представленного тремя ветками и медиатором, аналогично с независимыми мнениями нескольких врачей.

В предложенной реализации положительный или отрицательный результат Covid-19 ставится только при совпадении решений трёх веток, что снижает вероятность ошибки до 6.147 - 10 ~4 . В классификации использовались сверточные сети и метод опорных векторов.

Помимо обработки звуков тела человека, для диагностирования Covid методами глубокого обучения также можно использовать снимки рентгена и компьютерной томографии грудной клетки.

Разработанное техническое решение представляет из себя способ анализа анализа акустических данных кашля, дыхания и речи пациента для выявления и классификации респираторных заболеваний или сопутствующих признаков наличия вирусного заболевания. Модель для диагностики заболеваний представляет собой ансамбль рекуррентных нейронных сетей с энкодером, механизмом внимания и линейными слоями, следующими за ней.

Изобретение представляет собой метод отработки записей поступающих от пользователей. Архитектура метода представлена ансамблем нейронных сетей, которые представлены тремя независимыми ветками с последующей конкретизацией результатов Fully connected слоями.

На фиг. 1 приведена общая архитектура используемой при реализации способа системы для диагностики COVID.

Для анализа на вход системы подаются три аудиозаписи: речь, кашель, дыхание. Каждая аудиозапись имеет одинаковый процесс обработки. Схема процесса обработки каждой записи представлена в параллельно обрабатывается в отдельной ветке. Схема каждой ветки одинакова и представлена на фиг. 1.

Последовательность обработки аудиозаписями включает следующие этапы:

• проверка и конвертация параметров аудиозаписи;

• нарезка и экстракция признаков для каждого отдельного окна аудиозаписи;

• получение вектора признаков с помощью RNN (рекурентной нейронной сети) для полной аудиозаписи.

Затем проводят проверку и конвертацию аудиозаписи, при этом аудиозаписи от пользователей поступают в блок обработки. Блок проверит аудиофайл на соответствие требованиям системы по формату данных, частоте дискретизации, битрейту, количеству каналов. При несовпадении параметров происходит конвертация данных к требуемым параметрам системы.

• Перевод аудиодорожки в числовой массив

• Перевод из стерео- в моно- режим

• Ресемплинг к частоте дискретизации 44.1 кГц При невозможности конвертации к требуемым параметрам блок генерирует ошибку с указанием невалидных параметров аудиофайла.

Далее проходит стадия нарезки и экстракции признаков. На этапе экстракции признаков выделяют наиболее значимые признаки в аудиофайлах для последующей подачи их в рекуррентную нейронную сеть для извлечения закономерностей и паттернов. Экстракция признаков может быть проведена разными способами, такими как:

• интегральные преобразования (оконное преобразование Фурье, вейвлет- преобразование, и другие);

• извлечение i-vectors;

• скрытые марковские модели;

• другие.

Затем проходит стадия непрерывных интегральных преобразований анализа временных сигналов. Существуют различные семейства интегральных преобразования нестационарных временных сигалов. Предполагают, что временной сигнал переводится в область частот, где удобнее проводить анализ поведения динамики процесса и проще извлекать числовые характеристики. При этом, существуют различные виды частотно-временных (time-frequency) интегральных преобразований, осуществляющих перевод сигнала в частотную область. Помимо Fourier Transform (FT) в приложениях анализа сигналов применяют также Short-time Fourier Transform (STFT), Gabor Transform (GT), Wavelet Transform (WT), Wigner Distribution Function (WDF), etc.

STFT

По определению, непрерывное оконное преобразование Фурье представимо в виде интеграла где w(·) —оконная функция, позволяющая выполнять селекцию интересующего отрезка времени, и проводить дополнительную обработку внутри него. В случае, когда в качестве оконной функции выбирают функцию Гаусса, оконное преобразование Фурье (STFT) называют преобразованием Габора (GT).

WT

Обобщением STFT является вейвлет преобразование. В общем случае, интегральное вейвлет-преобразование (2) записывается в виде где ядром преобразования является вейвлет функция ф(·), а в самом преобразовании используется её комплексное сопряжение i G(·). В то время как оконная функция в STFT зависит от одного параметра т, определяющего сдвиг во времени, вейвлет в CWT зависит от двух параметров а, b которые отвечают за масштаб (сжатие или растяжение ядра преобразования) и сдвиг (трансляцию), соответственно. Например, в качестве ядра i / (·) в медицинских приложениях применяют вейвлет Морле (Morlet wavelet или Gabor wavelet), фиг. 2.на котором приведен Вейвлет Морле и его первая производная, то есть, функцию вида

Кроме того, вейвлет функция должна удовлетворять следующим свойствам 1. Конечность энергии

2. Условие допустимости

3. Для комплексных вейвлет функций преобразование Фурье должно быть действительным и обращаться в нуль для отрицательных частот. Отметим, что существуют различные способы построения вейвлет-систем как ортогональных, так и неортогональных. Так, в качестве аппроксимационного базиса для построения различных систем вейвлет функций могут быть использованы бесконечно-дифференцируемые сплайны или атомарные функции. Примеры вычисления количественных характеристик временных сигналов с помощью подобных синтезированных систем вейвлет функций также представлены в. Пример простейшей атомарной функции, совпадающей с функцией Фабиуса на отрезке [0; 2] показан на фиг. 3., на котором приведен вид функции Фабиуса и ее первой производной

Отметим, что существуют библиотека визуализации вейвлет систем на Python и библиотека вейвлет-преобразований на Python.

Затем начинается стадия дискретных интегральных преобразований анализа временных сигналов .В силу дискретности входных данных, возникает необходимость учёта конечности числа отсчётов, и, как следствие, появляются дискретные аналоги непрерывных интегральных преобразований, указанных выше.

DWFT

Дискретный вариант непрерывного оконного преобразования принимает вид где X(k ) —дискретная частоты временной последовательности х(п), п —временной индекс, к — частотный индекс, N —количество отсчётов, w(n ) —отсчёты оконной функции. При этом, оконная функция может быть выбрана различными способами. Так, в практических приложениях используется окно Ханна (Hann windows), которое определяется следующим образом извлечения i- vectors.

Метод i-vectors или identity-vectors представляет собой метод выделения и использования вспомогательных признаков. На настоящий момент, класс методов i-vectors является сравнительно новым способом решения задач распознавания объектов различной природы. Первоначально метод i-vectors возник для решения задачи распознавания речи. Идея метода основана на представлении моделей выражений гауссовой смеси Я = 2)}(6)

При этом, изображение этого выражения также применяется в качестве вектора признаков в языковом классификаторе.

Применение оконного преобразования Фурье

Для примера рассмотрим схему извлечения признаков методом дискретного оконного преобразования Фурье. Стандартная схема применения DWFT состоит в следующем. Из полного сигнала с данными выделяется область интереса для анализа, фиг. 4.

Та часть сигнала, которая попала в область интереса скалярно умножается на некую оконную функцию (window function), т.е. происходит “взвешивание (weighting), фиг. 5 - фиг. 6) .

При этом, сумма сдвигов оконной функции Ханна обеспечивает разложение единицы, (фиг.7- фиг. 8). Однако, в качестве оконных функций можно также использовать вейвлеты и атомарные функции, сумма сдвигов (shifts) которых также удовлетворяет разложению единицы (partition of unity). b)

В настоящем изобретении данный подход позволяет получить спектрограмму, после чего она разбивается на фрагменты длительности 1 секунда с шагом 0.5 секунд, которые подаются на вход CNN энко деров.

В таком случае, CNN энкодеры служат для извлечения (экстракции) репрезентативных (значимых) признаков и уменьшения размерности входных данных в LSTM слои. Энко дер состоит из четырех блоков, включающих в себя операцию свертки с ядром 3x3, слой активации с функцией Leaky ReLu, метод прореживания с вероятностью исключения нейрона 0.7 для предотвращения переобучения и батчнормализацию. Энкодеры обрабатывают поступившие в качестве входных данных окна спектрограммы и полученные признаки, подаются на вход LSTM слоев, фиг.9.

Рекуррентная нейронная сеть с LSTM устроена по принципу many-to-many. Каждый отдельный фрагмент аудиозаписи после прохождения через экстракторы признаков попадает на отдельный слой LSTM размерностью внутренних гейтов 512.

Выход с каждого слоя рекуррентной сети передается далее в блок attention. Attention

Выходные данные каждого LSTM слоя, представляющие собой вектор размерности 512, проходят через линейный слой с гиперболическим тангенсом в качестве его функции активации.

Полученные вектора после линейного слоя скалярно перемножаются с вектором весов, который в процессе обучения модели, корректирует веса методом градиентного спуска. и сформированные признаки передаются в softmax для нормализации.

Нормализованные значения перемножаются с исходными признаками полученными на LSTM слоях и полученные значения взвешенно суммируются с выходами всех других слоев. Архитектура предлагаемого алгоритма глубокого обучения представлена на фиг.10.

Полученые вектора взвешенных сумм всех трех аудиозаписей подаются на вход блока конкатенации и последующего линейного преобразования и на выходе получаем вероятность заражения пациента COVID-19.

При обучении модели используется оптимизационный алгоритм adam и происходит снижение скорости обучения алгоритма в 10 раз каждые 100 шагов.

Описанный метод может быть применен с использованием любого устройства, имеющего микрофон и способного использовать его на запись (включая, но не ограничиваясь: диктофон, кнопочный мобильный телефон, смартфон, умные часы, терминал, умная колонка и т.п.). Специализированное программное обеспечение, адаптированное под указанное устройство помогает пользователю выполнить необходимую последовательность шагов для подготовки и записи звуковых файлов. Записанные в файлы данные передаются на сервер с развернутой на нем системой обработки файлов через любые каналы передачи данных. Система на сервере обрабатывает звуковые файлы в соответствии с методом описанным выше и передает результат пользователю (или иному адресату (как человеку, так и другой системе, определенному настройкой системы) с использованием адаптируемых форматов и любых доступных каналов связи.