Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR RECEIVING SPEECH SIGNALS
Document Type and Number:
WIPO Patent Application WO/2020/130872
Kind Code:
A1
Abstract:
The invention relates to processing and converting acoustic signals into electrical signals in a robot. Interference and the level of an audio signal from the external speakers of a robot are reduced by calibrating the working microphones of the robot in two steps. In the first step, a pulsed audio signal is supplied, which is broadcast by the speakers of the robot and received by the working microphones. The propagation time of the pulsed audio signal from each speaker of the robot to each working microphone is determined, and the obtained time delay values are transmitted to the memory of a control device. In the second calibration step, an audio signal is successively supplied in different frequency ranges and broadcast by the speakers of the robot. Then, the sound level at each frequency is determined for each working microphone, the attenuation rate of the audio signal is determined for each working microphone, and the obtained attenuation rate values are transmitted to the memory of the control device. In operating mode, when speech signals transmitted by the speakers of the robot are received simultaneously with external speech signals, the signal from the speakers of the robot is delayed in a buffer. The magnitude of the external speech signal of each working microphone is adjusted by subtracting the time delay value determined in the first calibration step, taking into account the attenuation rate determined in the second calibration step. The obtained external voice signal values are transmitted to the control device.

Inventors:
YANGURAZOV ARTEM OLEGOVICH (RU)
DUBROVSKIKH DMITRII IOSIFOVICH (RU)
EREMEEV IGOR MIKHAILOVICH (RU)
Application Number:
PCT/RU2019/000317
Publication Date:
June 25, 2020
Filing Date:
May 07, 2019
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
OBSHCHESTVO S OGRANICHENNOJ OTVETSTVENNOSTYU PROMOBOT (RU)
International Classes:
H04R29/00; G10L17/22
Domestic Patent References:
WO2003061344A22003-07-24
Foreign References:
RU2456701C22012-07-20
US20100174546A12010-07-08
US20040193411A12004-09-30
RU2012146419A2014-05-10
Other References:
ANONYMOUS: "GOST 31295.1-2005 Noise. Attenuation of sound during propagation outdoors. Part 1. Calculation of the absorption of sound by the atmosphere", 9 December 2005 (2005-12-09), Russia, pages 1 - 34, XP009522243, Retrieved from the Internet
Attorney, Agent or Firm:
BUTOLINA, Alla Valentinovna (RU)
Download PDF:
Claims:
ФОРМУЛА ИЗОБРЕТЕНИЯ

Способ приема речевых сигналов, включающий прием микрофонами робота внешних речевых сигналов и звуковых сигналов робота, корректировку величин внешних речевых сигналов с учетом величин звуковых сигналов робота, передачу полученных значений речевых сигналов робота на управляющее устройство, отличающийся тем, что проводят калибровку рабочих микрофонов робота в два этапа, на первом этапе подают импульсный звуковой сигнал, который транслируют динамиками робота и принимают рабочими микрофонами, определяют время прохождения импульсного звукового сигнала от каждого динамика робота до каждого рабочего микрофона, передают полученные значения временных задержек в память управляющего устройства, на втором этапе калибровки подают звуковой сигнал последовательно в разных диапазонах частот, транслируют его динамиками робота, определяют величину уровня звука на каждой частоте для каждого рабочего микрофона, определяют коэффициент затухания звукового сигнала для каждого рабочего микрофона, передают полученные значения коэффициентов затухания в память управляющего устройства, далее в рабочем режиме при одновременном приеме речевых сигналов, передаваемых через динамики робота и приеме внешних речевых сигналов, сигнал от динамиков робота задерживают в буфере, величину внешнего речевого сигнала каждого рабочего микрофона корректируют путем вычитания значения временной задержки, определенной на первом этапе калибровки, с учетом коэффициента затухания, определенного на втором этапе калибровки, полученные значения внешних речевых сигналов передают на управляющее устройство.

Description:
Способ приема речевых сигналов

Изобретение относится к области обработки звука, а именно к обработке и преобразованию акустических сигналов в электрические в роботе. Позволяет выделять источники звука и определять направление их расположения, а также позволяет минимизировать помехи от внешних динамиков.

Известно изобретение по патенту США US2003139851 «Акустическое устройство и акустическая система робота» G10L21/02, 2003. Изобретение представляет собой роботизированный слуховой аппарат и систему, которые сделаны для достижения активного восприятия при сборе звука от внешнего источника звука без влияния, получаемого от шумов, создаваемых внутри робота, таких как излучаемые из элементов движения робота. Устройство и система предназначены для робота, имеющего источник генерации шума в своей внутренней части, и включают в себя: звукоизолирующую оболочку, которой покрыта часть робота; внешние микрофоны, расположенные вне оболочки для сбора внешнего звука в первую очередь; внутренний микрофон, расположенный внутри оболочки для первичного сбора шумов от источника генерации шума во внутренней части робота; секцию обработки, реагирующую на сигналы от внешнего и внутреннего микрофонов для отделения звуковых сигналов принимаемых внешними микрофонами от сигналов шумов от источника генерации внутреннего шума и затем выдача левого и правого звукового сигнала; секцию выделения направленной информации, реагирующую на левый и правый звуковые сигналы от обрабатывающей секции для определения направления, из которого испускается внешний звук. Блок обработки выполнен с возможностью обнаружения всплесков из-за источника генерации шума из сигнала внутреннего микрофона для удаления участков сигнала из звуковых сигналов для полос, содержащих всплески. Недостатком является невозможность минимизировать помехи от внешних динамиков.

Наиболее близким аналогом заявляемого изобретения является изобретение по патенту Китая CN 105825862 «Система эхоподавления в диалоге человек-машина» G10L21/02, 2016. Система эхоподавления в диалоге человек-робот, содержащая: основной модуль управления, модуль эхоподавления, модуль деления голосового напряжения, микрофон и динамик, второй модуль деления голосового напряжения, сконфигурированный для установки отношения деления напряжения потенциометра и эхо-сигнала. Интенсивность передается модулю эхоподавления; динамик используется для воспроизведения тестового звука, испускаемого роботом; микрофон используется для сбора звукового сигнала; модуль эхоподавления подключается к модулю разделения голосового давления для устранения эхо-сигнала; основной модуль управления используется для регулировки коэффициента делителя напряжения потенциометра для управления процессом устранения эха. Недостатком является сложность снижения помех, так как перед каждым диалогом необходимо настраивать/регулировать коэффициент делителя напряжения потенциометра в ручном режиме.

Техническим результатом заявляемого изобретения является снижение помех и уменьшение уровня звукового сигнала от громкоговорителей робота.

Технический результат достигается за счет того, что в способе приема речевых сигналов, включающий прием микрофонами робота внешних речевых сигналов и звуковых сигналов робота, корректировку величин внешних речевых сигналов с учетом величин звуковых сигналов робота, передачу полученных значений речевых сигналов робота на управляющее устройство, согласно изобретению проводят калибровку рабочих микрофонов робота в два этапа, на первом этапе подают импульсный звуковой сигнал, который транслируют динамиками робота и принимают рабочими микрофонами, определяют время прохождения импульсного звукового сигнала от каждого динамика робота до каждого рабочего микрофона, передают полученные значения временных задержек в память управляющего устройства, на втором этапе калибровки подают звуковой сигнал последовательно в разных диапазонах частот, транслируют его динамиками робота, определяют величину уровня звука на каждой частоте для каждого рабочего микрофона, определяют коэффициент затухания звукового сигнала для каждого рабочего микрофона, передают полученные значения коэффициентов затухания в память управляющего устройства, далее в рабочем режиме при одновременном приеме речевых сигналов передаваемых через динамики робота и приеме внешних речевых сигналов, сигнал от динамиков робота задерживают в буфере, величину внешнего речевого сигнала каждого рабочего микрофона корректируют путем вычитания значения временной задержки, определенной на первом этапе калибровки, с учетом коэффициента затухания, определенного на втором этапе калибровки, полученные значения внешних речевых сигналов передают на управляющее устройство.

Технический результат обеспечивается за счет того что, работа микрофонного массива совмещена с алгоритмом подавления местного эффекта - АЕС. Сигнал от динамиков робота, принимаемый двумя калибровочными микрофонами, расположенными близко от динамиков робота, задерживается в буфере и вычитается из входного сигнала каждого микрофонного массива в соответствии с временной задержкой, измеренной на первом этапе калибровки и с учетом коэффициента затухания, определенного на втором этапе калибровки. Калибровка происходит единожды при включении питания. Вырабатываются сигналы, которые транслируются через динамики робота. Эти сигналы позволяют определить временные задержки с помощью импульсного сигнала и частотные коэффициенты затухания для правильной работы алгоритмов. После калибровки массив работает автоматически. Встроенный алгоритм АЕС позволяет минимизировать помехи от внешних динамиков робота.

На фигуре 1 изображена структурная схема комплекса микрофонного массива.

На фигуре 2 представлен вид спереди печатной платы MCU.

На фигуре 3 представлен вид спереди печатной платы рабочего микрофона и калибровочного микрофона АЕС.

Комплекс микрофонного массива состоит из платы MCU 1, восьми плат рабочих микрофонов 2, двух плат калибровочных микрофонов АЕС 2.1, встроенного программного обеспечения. Плата калибровочного микрофона 2.1 отличается от платы рабочего микрофона 2 заниженным коэффициентом усиления. Плата MCU 1 включает в себя микроконтроллер 3. В микроконтроллере используются 10 каналов 4 для оцифровки звука, стэк USB 5 для передачи данных в персональный компьютер PC 6 или другое управляющее устройство. Питание платы осуществляется от USB шины. Плата рабочего микрофона 2 содержит аналоговый микрофон 7 выполненный по Mems технологии, дифференциальный микрофонный усилитель 8 и буферный выходной усилитель 9. Плата калибровочного микрофона 2.1 содержит калибровочный микрофон 11. Для трансляции звукового сигнала используют динамики робота 10. Уровень выходного сигнала при номинальном звуковом давлении ~500 мВ. Питание микрофонов 7 и 11 (3.3 вольта) осуществляется от платы MCU 1. Встроенное программное обеспечение обеспечивает под держку USB стэка 5, обработку оцифрованных аудиоданных и реализацию алгоритма подавления местного эффекта АЕС. Платы микрофонов расположены на роботе в соответствии с заданной в HARK конфигурацией. Точность расположения микрофонов - 5 мм. Со стороны персонального компьютера PC 6, устройство определяется, как стандартный акустический массив. Дополнительные драйверы для работы устройств не нужны. В способе приема речевых сигналов в качестве микроконтроллера 3 используют микроконтроллер STM32H7. В качестве каналов для оцифровки звука используются 10 каналов ADC 16 бит.

Способ приема речевых сигналов осуществляют следующим образом.

Сначала, с помощью платы MCU 1 вырабатывают кратковременный импульсный сигнал. Этот сигнал усиливают и транслируют через динамики робота 10. Рабочие микрофоны 11 принимают этот сигнал с разной временной задержкой, определяемой конкретным положением каждого рабочего микрофона 11 относительно каждого динамика 10. Данные временных задержек записывают в память MCU 1, которая является внутренней памятью чипа stm32H7, и потом используют совместно с буфером задержек, являющимся частью внутренней памяти чипа, для вычитания сигнала от динамика 10 из всех принятых звуковых сигналов. Вторым этапом производят калибровку уровня звука в четырех частотных диапазонах: 250Гц, 500Гц, 1000Гц, 2000Гц. С помощью платы MCU 1 вырабатывают последовательно набор четырех частот, через динамики робота 10 транслируют их, затем каждым рабочим микрофоном 7 измеряют уровень звука на каждой частоте и с помощью платы MCU 1 сохраняют значения в памяти управляющего устройства. При втором включении этого же калибровочного сигнала измеренные уровни звука используют для проверки работы компенсатора местного эффекта и вычисляют коэффициенты затухания сигнала для каждого рабочего микрофона 7, как отношение принятого уровня сигнала каждого рабочего микрофона к уровню сигнала калибровочного микрофона. После калибровки система работает автоматически, принимая акустические сигналы с восьми рабочих микрофонов 7 и пересылая данные в персональный компьютер PC 6 через USB порт. После того как определены временные задержки и частотные коэффициенты затухания система готова к работе. Звуковой сигнал от динамиков робота 10, принимают двумя калибровочными микрофонами 11, расположенными близко от динамиков робота 10, задерживают в буфере и вычитают из входного сигнала каждого рабочего микрофона 7 в соответствии с временной задержкой, измеренной на первом этапе калибровке и с учетом коэффициента затухания, определенного на втором этапе калибровки. Основная задача способа приема речевых сигналов — уменьшить уровень звукового сигнала от динамиков робота 10. В способе приема речевых сигналов человек может задавать вопросы роботу, прерывая его речь. Это приводит к комфортному общению человек-робот. Таким образом, предлагаемый способ приема речевых сигналов позволяет снизить помехи и уменьшить уровень звукового сигнала от внешних динамиков робота.