(19)
(11)EP 4 086 751 A1

(12)DEMANDE DE BREVET EUROPEEN

(43)Date de publication:
09.11.2022  Bulletin  2022/45

(21)Numéro de dépôt: 22170136.0

(22)Date de dépôt:  26.04.2022
(51)Int. Cl.: 
G06F 3/16(2006.01)
G06F 3/0488(2022.01)
(52)Classification Coopérative des Brevets (CPC) :
G06F 3/0488; G06F 3/165; G06F 3/167
(84)Etats contractants désignés:
AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR
Etats d'extension désignés:
BA ME
Etats de validation désignés:
KH MA MD TN

(30)Priorité: 30.04.2021 FR 2104552

(71)Demandeur: SAGEMCOM BROADBAND SAS
92500 Rueil-Malmaison (FR)

(72)Inventeur:
  • BOUVIGNE, Gabriel
    92500 RUEIL MALMAISON (FR)

(74)Mandataire: Lavaud, Thomas et al
Cabinet Boettcher 16, rue Médéric
75017 Paris
75017 Paris (FR)

  


(54)COMMANDE PAR GLISSEMENT SUR DES BOUTONS VIRTUELS


(57) Equipement de restitution audio (1) comprenant des microphones (10), un haut-parleur (6), des moyens d'émission agencés pour émettre un signal sonore de détection, et au moins un composant de traitement (12) agencé pour :
o acquérir des signaux audio de détection produits par les microphones (10) à partir d'une capture du signal sonore de détection ;
o détecter à partir des signaux audio de détection une succession d'occultations d'au moins deux microphones distincts ;
o analyser la succession d'occultations de manière à détecter un glissement de commande réalisé sur le boîtier par un utilisateur entre au moins deux microphones distincts ;
o commander au moins une action prédéterminée suite à la détection dudit glissement de commande.




Description


[0001] L'invention concerne le domaine des équipements de restitution audio comprenant au moins un haut-parleur et des microphones.

ARRIERE PLAN DE L'INVENTION



[0002] Certains équipements électroniques récents intègrent non seulement un ou des haut-parleurs pour restituer des signaux audio, mais aussi un ou des microphones pour capturer des signaux sonores, et sont capables d'interagir avec l'utilisateur par la voix. Ces équipements peuvent ainsi acquérir des commandes émises oralement par l'utilisateur, et répondre en émettant des signaux sonores à destination de l'utilisateur.

[0003] On connaît par exemple des enceintes connectées qui peuvent être utilisées pour mettre en œuvre le procédé de reconnaissance vocale d'un assistant personnel virtuel. On connaît aussi par exemple des boîtiers décodeurs (ou set-top boxes en anglais) qui intègrent un dispositif d'assistance vocale.

[0004] Un tel équipement réalise classiquement un procédé de formation de voies qui lui permet de focaliser la direction dans laquelle il écoute et d'ignorer les sons provenant d'une direction autre que celle de l'utilisateur (on parle de « beamforming » en anglais) . Le procédé de formation de voies nécessite plusieurs microphones.

[0005] Un tel équipement comporte aussi généralement un ou des boutons permettant un accès rapide à certaines fonctionnalités : démarrage d'une interaction vocale avec l'utilisateur, activation ou désactivation d'un mode de veille, marche/arrêt, réglage du volume, appairage Bluetooth, etc.

OBJET DE L'INVENTION



[0006] L'invention a pour objet de réduire le coût d'un équipement de restitution audio tel que précédemment décrit et d'améliorer les interactions de l'utilisateur avec ledit équipement de restitution audio.

RESUME DE L'INVENTION



[0007] En vue de la réalisation de ce but, on propose un équipement de restitution audio comprenant :
  • un boîtier sur lequel sont formés des trous, et des microphones positionnés à l'intérieur du boîtier, chaque microphone étant en communication acoustique avec l'extérieur via l'un des trous ;
  • un haut-parleur ;
  • des moyens d'émission agencés pour émettre via le haut-parleur un signal sonore de détection ;
  • au moins un composant de traitement agencé pour :

    o acquérir des signaux audio de détection produits par les microphones à partir d'une capture du signal sonore de détection ;

    o détecter à partir des signaux audio de détection une succession d'occultations d'au moins deux microphones distincts ;

    o analyser la succession d'occultations de manière à détecter un glissement de commande réalisé sur le boîtier par un utilisateur entre au moins deux microphones distincts ;

    o commander au moins une action prédéterminée suite à la détection dudit glissement de commande.



[0008] L'équipement de restitution audio selon l'invention comporte donc des « boutons virtuels », qui comprennent chacun un microphone et un trou via lequel le microphone communique avec l'extérieur.

[0009] Les boutons virtuels permettent à l'utilisateur de commander des actions prédéterminées en faisant glisser son doigt sur le boîtier de l'équipement de restitution audio.

[0010] Lorsque l'équipement est équipé de microphones et d'un haut-parleur qui sont utilisés pour une autre fonction, comme c'est le cas pour une enceinte connectée pouvant être utilisée pour réaliser le procédé de reconnaissance vocale d'un assistant personnel virtuel, la mise en œuvre de ces boutons virtuels est très peu onéreuse puisque les boutons virtuels peuvent utiliser les microphones et le haut-parleur « préexistants ». On réduit donc de manière importante le coût de fabrication de l'équipement.

[0011] Il est aussi possible d'ajouter « a posteriori » des boutons virtuels supplémentaires sur des équipements déjà conçus voire même déjà déployés.

[0012] Comme la commande nécessite de faire glisser le doigt sur le boîtier, il n'est pas nécessaire de taper sur le boîtier. Ainsi, la détection réalisée ne dépend ni des caractéristiques du doigt (et notamment de la longueur de l'ongle du doigt) ni d'une force avec laquelle le doigt taperait sur le boîtier.

[0013] Par ailleurs, la détection ne nécessite pas un niveau de bruit ambiant particulier, et fonctionne donc même si l'environnement est complètement silencieux.

[0014] On note de plus que la commande par glissement est particulièrement adaptée pour des actions à réponse progressive, comme par exemple le réglage du volume de restitution sonore. Les interactions entre l'utilisateur et l'équipement de restitution audio sont donc améliorées.

[0015] On propose aussi un équipement de restitution audio tel que précédemment décrit, le composant de traitement étant agencé pour :
  • détecter une première occultation d'un premier microphone ;
  • si une première durée de la première occultation est inférieure à une première durée prédéfinie, détecter une deuxième occultation d'un deuxième microphone distinct du premier microphone ;
  • si une deuxième durée entre une fin de la première occultation et un début de la deuxième occultation est inférieure à une deuxième durée prédéfinie, détecter le glissement de commande.


[0016] On propose aussi un équipement de restitution audio tel que précédemment décrit, le composant de traitement étant agencé pour comparer le glissement de commande avec au moins un glissement prédéfini d'une liste prédéfinie, pour déterminer un glissement prédéfini particulier auquel correspond le glissement de commande, et pour commander au moins une action prédéterminée associée au glissement prédéfini particulier.

[0017] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel chaque glissement prédéfini correspond à une succession d'occultations prédéfinie de microphones disposés successivement.

[0018] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel les microphones sont alignés, les glissements prédéfinis étant des glissements linéaires.

[0019] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel les microphones sont disposés de manière circulaire, les glissements prédéfinis étant des glissements circulaires.

[0020] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel au moins un glissement prédéfini associé à une action prédéterminée particulière est défini de manière à débuter nécessairement par une occultation d'un microphone initial prédéfini et/ou de manière à s'achever nécessairement par une occultation d'un microphone final prédéfini.

[0021] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel la liste prédéfinie comprend plusieurs glissements prédéfinis dans un même sens mais de longueurs différentes.

[0022] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel l'action prédéterminée associée à l'un au moins des glissements prédéfinis est une action à réponse progressive.

[0023] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel un niveau de réponse de l'action à réponse progressive dépend de la longueur dudit glissement prédéfini.

[0024] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel les glissements prédéfinis comprennent des glissements prédéfinis dans un premier sens et des glissements prédéfinis dans un deuxième sens, un glissement prédéfini dans le premier sens étant associé à une augmentation d'un niveau de réponse de l'action à réponse progressive alors qu'un glissement prédéfini dans le deuxième sens est associé à une réduction du niveau de réponse de l'action à réponse progressive.

[0025] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel une variation d'un niveau de réponse de l'action à réponse progressive est plus importante si le glissement prédéfini est suivi d'une occultation maintenue d'un microphone à la fin du glissement prédéfini.

[0026] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel l'action à réponse progressive est un réglage d'un volume de restitution sonore de l'équipement de restitution audio.

[0027] On propose aussi un équipement de restitution audio tel que précédemment décrit, comprenant un émetteur sensoriel agencé pour fournir à l'utilisateur un retour sensoriel représentatif du glissement de commande et/ou d'un niveau de réponse de l'action prédéterminée.

[0028] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel l'émetteur sensoriel est agencé pour émettre un signal sensoriel de retour lorsque le niveau de réponse de l'action prédéterminée franchit un palier prédéfini ou atteint une butée maximale ou minimale.

[0029] On propose aussi un équipement de restitution audio tel que précédemment décrit, dans lequel l'émetteur sensoriel est agencé pour émettre un signal sensoriel de retour qui dépend d'un parcours sur le boîtier d'un doigt de l'utilisateur lors du glissement de commande.

[0030] On propose aussi un équipement de restitution audio tel que précédemment décrit, l'émetteur sensoriel étant un émetteur lumineux.

[0031] On propose aussi un équipement de restitution audio tel que précédemment décrit, l'émetteur sensoriel étant un émetteur sonore.

[0032] On propose aussi un équipement de restitution audio tel que précédemment décrit, l'équipement de restitution audio étant une enceinte connectée.

[0033] On propose de plus un procédé de commande d'un équipement de restitution audio tel que précédemment décrit, comprenant les étapes de :
  • émettre via le haut-parleur le signal sonore de détection ;
  • acquérir les signaux audio de détection produits par les microphones ;
  • détecter à partir des signaux audio de détection la succession d'occultations d'au moins deux microphones distincts ;
  • analyser la succession d'occultations de manière à détecter le glissement de commande réalisé sur le boîtier par l'utilisateur entre les au moins deux microphones distincts ;
  • commander l'action prédéterminée suite à la détection du glissement de commande.


[0034] On propose aussi un programme d'ordinateur comprenant des instructions qui conduisent le composant de traitement de l'équipement de restitution audio tel que précédemment décrit à exécuter les étapes du procédé de commande tel que précédemment décrit.

[0035] On propose en outre un support d'enregistrement lisible par ordinateur, sur lequel est enregistré le programme d'ordinateur qui vient d'être décrit.

[0036] L'invention sera mieux comprise à la lumière de la description qui suit de modes de mise en œuvre particuliers non limitatifs de l'invention.

BREVE DESCRIPTION DES DESSINS



[0037] Il sera fait référence aux dessins annexés parmi lesquels :

[Fig. 1] la figure 1 représente une enceinte connectée selon l'invention ;

[Fig. 2] la figure 2 représente un graphique comprenant une courbe du seuil d'audition minimal ;

[Fig. 3] la figure 3 représente des étapes d'un procédé de traitement d'un signal audio de détection produit par un microphone ;

[Fig. 4] la figure 4 représente des étapes d'un procédé de détection d'un glissement de commande ;

[Fig. 5] la figure 5 représente une face supérieure du boîtier d'une enceinte connectée comprenant deux microphones, et le doigt d'un utilisateur qui effectue un glissement de commande ;

[Fig. 6] la figure 6 représente une face supérieure du boîtier d'une enceinte connectée comprenant trois microphones alignés ;

[Fig. 7] la figure 7 représente une face supérieure du boîtier d'une enceinte connectée comprenant six microphones disposés de manière circulaire, dont deux positionnés sur un axe central ;

[Fig. 8] la figure 8 est une figure similaire à la figure 7, mais sans microphone sur l'axe central ;

[Fig. 9] la figure 9 représente une face supérieure du boîtier d'une enceinte connectée comprenant six microphones disposés de manière circulaire, ainsi qu'une couronne de segments lumineux.


DESCRIPTION DETAILLEE DE L'INVENTION



[0038] En référence à la figure 1, l'équipement de restitution audio selon l'invention est ici une enceinte connectée 1 qui est utilisée pour mettre en œuvre le procédé de reconnaissance vocale d'un assistant personnel virtuel.

[0039] L'enceinte connectée 1 comprend tout d'abord un boîtier 2. Par « boîtier », on entend ici l'enveloppe physique à l'intérieur de laquelle sont intégrés les composants fonctionnels de l'enceinte connectée 1 qui vont être décrits. Le boîtier 2 peut comporter plusieurs parties et éventuellement un ou des capots possiblement amovibles. Le boîtier 2 peut comprendre une ou des parties rigides, flexibles, en métal, en plastique, en tissu, en mousse, etc.

[0040] Le boîtier 2 comporte de plus des pieds 3 qui reposent sur un support quelconque (par exemple une table ou un meuble quelconque) lorsque l'enceinte connectée 1 se trouve dans sa position de fonctionnement nominal, comme c'est le cas sur la figure 1.

[0041] L'enceinte connectée 1 comporte aussi un châssis interne (non représenté sur les figures) intégré à l'intérieur du boîtier 2.

[0042] L'enceinte connectée 1 comporte de plus une carte électrique 4. La carte électrique 4 est intégrée dans le boîtier 2 en étant fixée au châssis interne. La carte électrique 4 est positionnée parallèlement à la face supérieure 5 du boîtier 2 et à proximité de celle-ci. La distance entre la carte électrique 4 et la face supérieure 5 du boîtier 2 est par exemple comprise entre 5mm et 1,5cm.

[0043] L'enceinte connectée 1 comprend de plus un haut-parleur 6 intégré dans le boîtier 2 en étant fixé au châssis interne. Ici, le haut-parleur 6 « pointe vers le bas », c'est-à-dire qu'il présente un diagramme de directivité qui, lorsque l'enceinte connectée 1 se trouve dans sa position de fonctionnement nominal, est orienté vers le bas.

[0044] Une pluralité de trous 7 (ou perçages) sont formés sur la face supérieure 5 du boîtier 2 (un seul trou est représenté sur la figure 1). Chaque trou 7 traverse le boîtier 2.

[0045] On note que les trous 7 pourraient aussi être formés sur des faces latérales du boîtier 2, c'est-à-dire sur les côtés du boîtier 2, et sur des parties quelconques du boîtier 2 (par exemple sur un capot amovible).

[0046] L'enceinte connectée 1 comprend de plus une pluralité de microphones 10 (un seul microphone 10 est représenté sur la figure 1) qui sont ici des composants montés en surface (CMS). Les microphones 10 sont montés sur le circuit imprimé de la carte électrique 4. Chaque microphone 10 est positionné à l'intérieur du boîtier 2 et se trouve à proximité d'un trou 7 (distinct), de sorte que la partie sensible dudit microphone 10 est en communication acoustique avec l'extérieur via ledit trou 7. Ici, chaque microphone 10 est positionné en regard d'un trou 7 de sorte que l'axe du trou 7 passe par le centre du microphone 10.

[0047] On note que le diagramme de directivité du haut-parleur 6 est orienté vers une zone ne comprenant pas de microphone 10 : les microphones 10 sont en effet positionnés ici dans une partie supérieure de l'enceinte connectée 1.

[0048] Un matériau isolant phonique est placé autour de chaque microphone 10 entre la carte électrique 4 et le boîtier 2. Le matériau isolant phonique est ici une mousse 11. La mousse 11 permet de limiter les perturbations sonores perçues par le microphone 10 et provenant de l'intérieur de l'enceinte connectée 1. Ces perturbations sonores comprennent par exemple les signaux sonores émis par le haut-parleur 6 et les résonnances parasites à l'intérieur de l'enceinte connectée 1.

[0049] Les microphones 10 sont isolés acoustiquement les uns des autres.

[0050] De même, la carte électrique 4 est fixée au châssis interne de l'enceinte connectée 1 via une pièce de fixation (non représentée) comprenant un matériau souple. La pièce de fixation est par exemple un « silentbloc », qui est une pièce comprenant par exemple du caoutchouc naturel ou un élastomère, et qui permet d'absorber les vibrations et les bruits.

[0051] La pièce de fixation permet de limiter la transmission directe de vibrations depuis le haut-parleur 6 vers les microphones 10 au travers du châssis interne.

[0052] L'enceinte connectée 1 comprend de plus des moyens d'émission et des moyens de traitement.

[0053] Les moyens d'émission comprennent des composants électroniques comportant par exemple un amplificateur.

[0054] Les moyens de traitement comprennent au moins un composant de traitement 12 adapté à exécuter des instructions de programmes pour mettre en œuvre les différentes étapes du procédé de traitement, du procédé de détection et du procédé de commande qui vont être décrits ci-après. Le composant de traitement 12 est relié à au moins une mémoire dans laquelle sont stockés les programmes. Le composant de traitement 12 est par exemple un processeur « généraliste », un processeur spécialisé dans le traitement du signal (ou DSP, pour Digital Signal Processor), un microcontrôleur, ou bien un circuit logique programmable tel qu'un FPGA (pour Field Programmable Gate Arrays) ou un ASIC (pour Application Specific Integrated Circuit). Ici, le composant de traitement 12 est monté sur la carte électrique 4.

[0055] L'enceinte connectée 1 comporte une pluralité de boutons virtuels, situés sur la face supérieure 5 du boîtier 2 : chaque bouton virtuel comporte un microphone 10 et le trou 7 associé.

[0056] Les boutons virtuels permettent à l'utilisateur de l'enceinte connectée 1 de commander des actions prédéterminées en effectuant des gestes de commande.

[0057] Un geste de commande peut être un appui de commande ou un glissement de commande (ou une succession d'appuis de commande et de glissements de commande).

[0058] Un appui de commande consiste, pour l'utilisateur, à occulter un microphone 10 en positionnant l'un de ses doigts sur ou à proximité immédiate du trou 7 associé au microphone 10.

[0059] Par « sur ou à proximité immédiate », on entend que le doigt est posé sur le trou 7 et le recouvre entièrement ou partiellement, ou bien que le doigt est approché au-dessus du trou 7 à une faible distance de celui-ci, comprise par exemple entre 0 et 10mm.

[0060] Un glissement de commande consiste, pour l'utilisateur, à faire glisser son doigt sur le boîtier 2 entre plusieurs microphones 10 distincts. Un glissement de commande produit donc une succession d'occultations d'au moins deux microphones 10 distincts.

[0061] On décrit tout d'abord le fonctionnement d'un bouton virtuel, et la détection d'un appui de commande sur ledit bouton virtuel.

[0062] Les moyens d'émission émettent en permanence (c'est-à-dire tant que l'enceinte connectée 1 est activée) un signal sonore de détection via le haut-parleur 6. Le microphone 10 du bouton virtuel capture le signal sonore de détection et produit à partir de la capture du signal sonore de détection un signal audio de détection.

[0063] Le composant de traitement 12 acquiert le signal audio de détection et détecte en temps réel, à partir du signal audio de détection, si le microphone 10 est occulté ou non.

[0064] En effet, lorsqu'un doigt (ou un objet quelconque) est positionné sur le trou 7 ou à proximité immédiate de celui-ci, le signal sonore de détection capturé par le microphone 10 est fortement atténué, c'est-à-dire que l'énergie ou la puissance instantanée du signal sonore de détection capturé a diminué fortement. La détection de cette atténuation par le composant de traitement 12 permet de détecter la présence du doigt de l'utilisateur.

[0065] L'utilisation de la mousse 11 et du silentbloc, et le fait que le diagramme de directivité du haut-parleur 6 soit orienté vers une zone ne contenant pas le microphone 10, permettent d'assurer que le microphone 10 ne capte pas le signal sonore de détection suite à une propagation de celui-ci via l'intérieur du boîtier 2, mais uniquement suite à une propagation de celui-ci par l'extérieur du boîtier 2. Le niveau et la variation de l'énergie du signal sonore de détection capturé (et donc du signal audio de détection) dépendent uniquement de la position ou non d'un objet sur ou à proximité immédiate du trou 7.

[0066] Le signal sonore de détection est un signal sonore prédéterminé, par exemple un signal sinusoïdal de fréquence et d'amplitude constantes.

[0067] Le signal sonore de détection est un signal normalement inaudible par un être humain. La fréquence du signal sonore de détection est comprise dans la plage de fonctionnement du haut-parleur 6 et du microphone 10.

[0068] La fréquence du signal sonore de détection est par exemple égale à 22kHz. En effet, la gamme de fréquences de l'audition humaine s'étend typiquement entre 20 Hz et 20kHz de sorte qu'une fréquence de 22kHz est inaudible. En outre, les appareils de traitement audio grand public (comme l'enceinte connectée 1) ont typiquement une fréquence d'échantillonnage de 48kHz et peuvent donc traiter les signaux de fréquences inférieures à 24kHz.

[0069] Dans le cas où l'enceinte connectée 1 n'est pas capable de reproduire (via le haut-parleur 6) ou de capter (via le microphone 10) des fréquences situées au-dessus de 20kHz, le signal peut également être situé dans la plage de fréquences audibles pour un humain, mais à un niveau trop faible pour être entendu.

[0070] La courbe du seuil d'audition minimal (ATH, pour Absolute Threshold of Hearing) d'un humain (âgé de 20 ans, avec une audition non dégradée) peut être modélisée par l'équation suivante, utilisée par exemple par plusieurs encodeurs audionumériques :

où f est la fréquence (en kHz), et ATH le seuil d'audition minimal, en dB.

[0071] L'équation suivante est équivalente :



[0072] La courbe C du seuil d'audition minimal est visible sur la figure 2.

[0073] On constate que la sensibilité de l'oreille humaine décroit fortement dans les hautes fréquences. Par exemple, un signal d'une fréquence de 17kHz demandera une puissance d'environ 55dB au-dessus du niveau minimal pour atteindre le seuil d'audition. Un signal sonore de détection ayant une fréquence égale à 17kHz et un niveau égal à 20dB peut donc parfaitement être utilisé : un tel signal sonore de détection peut en effet être capturé par le microphone 10 tout en étant bien en dessous de la courbe du seuil d'audition minimal.

[0074] Avantageusement, le signal sonore de détection est modulé afin d'être facilement distingué du bruit de fond. Par exemple, le signal sonore de détection comprend une succession de signaux d'amplitude non nulle et de signaux d'amplitude nulle. Les durées des intervalles comprenant les signaux d'amplitude non nulle et des intervalles comprenant les signaux d'amplitude nulle peuvent être variables.

[0075] Le signal sonore de détection est par exemple composé de la séquence suivante, répétée « indéfiniment » :
  • sinusoïde à 22 kHz pendant 5ms (appartenant donc aux signaux d'amplitude non nulle) ;
  • silence pendant 5ms (appartenant donc aux silences) ;
  • sinusoïde à 22 kHz pendant 5ms (appartenant donc aux signaux d'amplitude non nulle) ;
  • silence pendant 10ms (appartenant donc aux silences).


[0076] Le microphone 10 échantillonne le signal sonore de détection qu'il capture et produit le signal audio de détection. Le composant de traitement 12 acquiert en permanence le signal audio de détection.

[0077] Dans tous les cas, le signal est identifié selon son empreinte fréquentielle (qui est modulée ou non).

[0078] En référence à la figure 3, le composant de traitement 12 met alors en œuvre un procédé de traitement sur le signal audio de détection afin de détecter si l'utilisateur a placé ou non son doigt sur ou à proximité immédiate du trou 7, et donc si le microphone 10 est occulté ou non.

[0079] Tout d'abord, le composant de traitement 12 applique un filtre passe-bande, relativement étroit et sélectif, autour de la fréquence du signal sonore de détection (étape E1).

[0080] Par exemple, dans le cas où le signal sonore de détection a une fréquence de 22kHz, le microphone 10 échantillonne le signal sonore de détection capturé à une fréquence de 48kHz pour produire un signal audio de détection échantillonné. Le composant de traitement 12 applique par exemple le filtre suivant sur le signal échantillonné pour obtenir un signal filtré :

où x(t) représente le signal échantillonné à l'instant t et y(t) représente le signal filtré à l'instant t.

[0081] Puis, le composant de traitement 12 calcule la puissance instantanée du signal audio de détection en calculant la moyenne de y(t)2 sur un temps court (par exemple 1 ms) - étape E2.

[0082] Le composant de traitement 12 évalue ainsi au temps t une puissance instantanée présente P(t) du signal audio de détection produit par le microphone 10.

[0083] Le composant de traitement 12 compare alors la puissance instantanée présente P(t) avec une puissance instantanée passée P(t-T0). T0 est compris entre 1ms et 500ms. Ici, T0 est égal à 25ms.

[0084] Si le rapport entre la puissance instantanée présente et la puissance instantanée passée est inférieur à un seuil de puissance prédéterminé, le composant de traitement 12 en déduit que l'accès au trou 7 vient d'être au moins partiellement obturé, et donc que le doigt est positionné sur ou à proximité immédiate du trou 7 et que le microphone 10 est occulté (étape E3).

[0085] Le seuil de puissance prédéterminé est ici égal à 25%, c'est-à-dire que si la puissance instantanée présente est inférieure à 25% de la puissance instantanée passée, alors le composant de traitement 12 considère que le doigt est positionné sur ou à proximité immédiate du trou 7.

[0086] Le composant de traitement 12 détecte ici un appui de commande lorsque le microphone 10 a été occulté puis que le microphone 10 a été libéré. Cela n'est pas obligatoire : le composant de traitement 12 pourrait détecter un appui de commande dès la détection de l'occultation du microphone 10.

[0087] Lorsque le composant de traitement 12 a détecté un appui de commande, le composant de traitement 12 commande la mise en œuvre de l'action prédéterminée associée au bouton virtuel sur lequel l'appui de commande a été effectué.

[0088] L'action prédéterminée peut consister à démarrer une interaction vocale avec l'utilisateur : dès que le composant de traitement 12 détecte que l'utilisateur a réalisé un appui de commande, il déclenche un processus de reconnaissance vocale et de dialogue avec l'utilisateur. L'action prédéterminée peut aussi consister à désactiver l'interaction vocale.

[0089] L'action prédéterminée peut aussi consister à activer ou à désactiver un mode de veille. Dans ce cas, en fonctionnement normal, l'enceinte connectée 1 écoute en permanence afin de détecter un mot-clef pour démarrer une interaction avec l'utilisateur. Les fonctions de l'enceinte connectée 1 permettant de mettre en œuvre le bouton virtuel sont elles aussi activées. Par contre, en fonctionnement dans le mode de veille, toutes les fonctions de l'enceinte connectée 1 sont désactivées sauf celles permettant de mettre en œuvre le bouton virtuel. Ainsi, chaque fois que le composant de traitement 12 détecte que l'utilisateur a posé le doigt sur ou à proximité immédiate du trou 7, le composant de traitement 12 fait basculer alternativement l'enceinte connectée 1 entre le fonctionnement normal et le fonctionnement en veille.

[0090] L'action prédéterminée peut aussi être le démarrage de la lecture d'un contenu (musical par exemple), ou bien la mise en pause de la lecture.

[0091] On note qu'il est possible d'utiliser, comme signal sonore de détection, le signal sonore émis par le haut-parleur 6 lorsque l'enceinte connectée 1 diffuse en utilisation nominale un signal sonore audible, par exemple de la musique.

[0092] Le composant de traitement 12 évalue alors, sur une bande de fréquence donnée, le rapport entre la puissance émise par le haut-parleur 6 et la puissance captée par le microphone 10. Un changement de ce rapport permet de conclure à une occultation du microphone 10. Cette méthode est cependant plus complexe à mettre en œuvre, car elle nécessite que le haut-parleur 6 soit en train de jouer des sons audibles par l'utilisateur et, même dans ce cas, il peut arriver que la musique restituée présente des absences temporaires de signal sur une bande de fréquence donnée. Avantageusement, pour pallier ce problème, le rapport entre la puissance émise et la puissance captée sera calculé par le composant de traitement 12 sur une large bande de fréquence.

[0093] Comme on l'a vu plus tôt, l'enceinte connectée 1 peut être commandée par un appui de commande sur un bouton virtuel, mais aussi par un glissement de commande sur le boîtier 2.

[0094] L'action prédéterminée associée à un glissement de commande peut bien sûr être différente de celle associée à un appui de commande.

[0095] Il convient donc de distinguer un glissement de commande d'un appui de commande.

[0096] Bien sûr, il est possible que l'utilisateur réalise une pluralité d'appuis de commande successifs sur des boutons virtuels différents, et il convient donc aussi de distinguer un glissement de commande d'une succession d'appuis de commande.

[0097] On met donc en œuvre, en référence à la figure 4, un procédé de détection d'un glissement de commande.

[0098] Le procédé de détection démarre à l'étape E10 et débute par une première phase de détection Pl.

[0099] Le composant de traitement 12 tente de détecter une première occultation d'un premier microphone (étape E11). Tant que la première occultation n'est pas détectée, le procédé de détection reste à l'étape E11.

[0100] Lorsque le composant de traitement 12 a détecté la première occultation du premier microphone, le composant de traitement 12 démarre un premier timer (ou « chronomètre ») qui expire après une première durée prédéfinie (étape E12).

[0101] La première durée prédéfinie correspond à la durée maximale de la première occultation du premier microphone qui peut correspondre à un glissement de commande volontaire. La première durée prédéfinie est par exemple égale à ls ou 0,5s.

[0102] Le composant de traitement 12 détecte alors la fin de la première occultation, c'est-à-dire un relâchement de l'appui, et vérifie si la fin de la première occultation a eu lieu avant l'expiration du premier timer, c'est-à-dire si une première durée de la première occultation est inférieure à la première durée prédéfinie (étape E13).

[0103] Si ce n'est pas le cas, le procédé de détection repasse à l'étape E11.

[0104] Si le relâchement se produit avant l'expiration du premier timer, alors un geste de commande est bien détecté. Il n'est cependant pas encore possible de déterminer s'il s'agit d'un appui de commande ou d'un glissement de commande. Le procédé de détection comprend donc une seconde phase de détection P2 qui permet de catégoriser le geste de commande en un appui de commande ou en un glissement de commande.

[0105] Ainsi, suite à l'étape E13, le composant de traitement 12 tente de détecter une deuxième occultation d'un deuxième microphone distinct du premier microphone (étape E14). Simultanément, à la fin de la première occultation, le composant de traitement 12 démarre un deuxième timer qui expire après une deuxième durée prédéfinie (étape E15). La deuxième durée prédéfinie correspond à la durée maximale souhaitée pour que le doigt passe d'un microphone à un autre au cours du glissement. La deuxième durée prédéfinie est par exemple égale à 0,5s ou à 0,25s.

[0106] Avantageusement, on prévoit que la deuxième durée prédéfinie dépend de la distance entre les microphones 10 sur le boîtier 2 de l'enceinte connectée 1 : la deuxième durée prédéfinie est plus importante lorsque les microphones 10 sont plus espacés, et plus faible lorsque les microphones 10 sont moins espacés.

[0107] Si la deuxième occultation du deuxième microphone se produit après l'expiration de la deuxième durée prédéfinie (ou bien ne se produit pas), alors le composant de traitement 12 détecte que la première occultation et la deuxième occultation (ou bien la première occultation seulement) constituent deux appuis de commande distincts (ou un appui de commande seulement) - étape E16.

[0108] Par contre, si la deuxième occultation du deuxième microphone se produit avant l'expiration de la deuxième durée prédéfinie, c'est-à-dire si une deuxième durée entre la fin de la première occultation et le début de la deuxième occultation est inférieure à la deuxième durée prédéfinie, alors le composant de traitement 12 détecte un glissement de commande réalisé sur le boîtier 2 par l'utilisateur entre le premier microphone et le deuxième microphone (étape E17).

[0109] Le composant de traitement 12 poursuit éventuellement la détection si l'enceinte connectée 1 intègre plus de deux microphones 10. Dans ce cas, la détection de l'étape E11 sera directement validée, car la deuxième occultation du deuxième microphone a déjà été détectée à l'étape E14.

[0110] Si le composant de traitement 12 a détecté un ou des appuis de commande sur des boutons virtuels, alors le composant de traitement 12 met en œuvre des actions prédéterminées correspondant audit ou auxdits boutons virtuels (comme ci-dessus).

[0111] Si le composant de traitement 12 a détecté un glissement de commande, le composant de traitement 12 compare le glissement de commande avec au moins un glissement prédéfini d'une liste prédéfinie (stockée par exemple dans la mémoire reliée au composant de traitement 12), détermine un glissement prédéfini particulier auquel correspond le glissement de commande, et pilote l'enceinte connectée 1 pour que celle-ci réalise au moins une action prédéterminée associée au glissement prédéfini particulier.

[0112] Ici, chaque glissement prédéfini de la liste prédéfinie correspond à une succession d'occultations prédéfinie de microphones 10 disposés successivement. Ainsi, dans chaque glissement prédéfini, l'occultation d'un premier microphone est suivie par l'occultation d'un deuxième microphone adjacent au premier microphone.

[0113] Les glissements entre des microphones 10 qui ne sont pas disposés successivement ne sont donc pas admis, c'est-à-dire qu'ils ne correspondent pas à des glissements prédéfinis de la liste prédéfinie.

[0114] Lorsque les microphones 10 sont alignés, les glissements prédéfinis sont des glissements linéaires.

[0115] En référence à la figure 5, une enceinte connectée 1 selon un premier mode de réalisation comporte deux microphones 10a, 10b (et donc deux trous) formant deux boutons virtuels sur la face supérieure 5 du boîtier 2.

[0116] Sur les figures 5 à 9, on assimile chaque microphone 10 au trou 7 associé - mais bien sûr, en réalité, seul le trou 7 est apparent sur le boîtier 2, le microphone 10 étant positionné à l'intérieur du boîtier 2.

[0117] Pour détecter un glissement du doigt de l'utilisateur selon l'axe X, le composant de traitement 12 va détecter des occultations successives des microphones 10a puis 10b (glissement vers la droite), ou des microphones 10b puis 10a (glissement vers la gauche), le tout dans un intervalle de temps réduit (par exemple inférieur à 1 seconde).

[0118] La liste prédéfinie de glissements prédéfinis comprend ici un glissement dans un premier sens, de la gauche vers la droite, c'est-à-dire la succession d'occultations suivante :

10a ; 10b,

et un glissement dans un deuxième sens, de la droite vers la gauche, c'est-à-dire la succession d'occultations suivante :
10b ; 10a.



[0119] En référence à la figure 6, une enceinte connectée 1 selon un deuxième mode de réalisation comporte trois microphones 10a, 10b, 10c alignés selon l'axe X.

[0120] La liste prédéfinie de glissements prédéfinis comprend des glissements dans un premier sens, de la gauche vers la droite, formés par les successions d'occultations suivantes :

10a ; 10b,

10a ; 10b ; 10c,

10b ; 10c,

et des glissements dans un deuxième sens, de la droite vers la gauche, formés par les successions d'occultations suivantes :

10c ; 10b,

10c ; 10b ; 10a,

10b ; 10a.



[0121] L'action prédéterminée commandée par le glissement de commande peut être une action à réponse progressive, et notamment une action à réponse graduelle. Par « action à réponse progressive », on entend une action dont le niveau de réponse varie en fonction du glissement de commande (longueur, durée d'occultations de certains microphones, durée du glissement, etc.) et/ou du nombre de glissements de commande.

[0122] Un glissement prédéfini dans le premier sens peut être associé à une augmentation d'un niveau de réponse de l'action à réponse progressive, alors qu'un glissement prédéfini dans le deuxième sens peut être associé à une réduction du niveau de réponse de l'action à réponse progressive.

[0123] L'action à réponse progressive est par exemple le réglage du volume de restitution sonore de l'enceinte connectée 1.

[0124] Ainsi, un glissement de commande de la gauche vers la droite commande ici une augmentation du volume, alors qu'un glissement de commande de la droite vers la gauche commande ici une réduction du volume.

[0125] La liste de glissements prédéfinis peut comprendre plusieurs glissements prédéfinis dans un même sens mais de longueurs différentes. La longueur d'un glissement prédéfini est égale au nombre de microphones 10 occultés dans la succession d'occultations formant le glissement prédéfini.

[0126] Si l'action prédéterminée associée à un glissement prédéfini est une action à réponse progressive, le niveau de réponse de l'action à réponse progressive peut dépendre de la longueur dudit glissement prédéfini.

[0127] Par exemple, dans la configuration de la figure 6, on peut prévoir qu'un glissement de commande qui débuterait par une occultation du microphone 10a et s'achèverait par une occultation du microphone 10b commanderait une faible augmentation du volume, alors qu'un glissement de commande qui débuterait par une occultation du microphone 10a et s'achèverait par une occultation du microphone 10c commanderait une forte augmentation du volume.

[0128] Dans le cas d'une action à réponse progressive, il pourrait être pertinent de ne pas nécessairement proposer une réponse permettant de passer de 0% à 100%, mais de proposer à la place un ajustement partiel. Par exemple, on pourra définir qu'un glissement de commande augmente ou diminue le volume de 20% maximum.

[0129] On peut prévoir qu'une variation du niveau de réponse de l'action à réponse progressive est plus importante si le glissement prédéfini est suivi d'une occultation maintenue d'un microphone à la fin du glissement prédéfini. La variation du niveau de réponse peut aussi dépendre de la durée de l'occultation maintenue.

[0130] Ainsi, l'augmentation ou la réduction du volume pourrait être de 10% - voire même de 0% - dans le cas d'un simple glissement de commande, mais être égale à 20% par seconde pendant la durée d'une occultation maintenue à la fin du glissement de commande.

[0131] Bien sûr, l'augmentation du nombre de microphones 10 sur l'axe X permet d'avoir des « graduations » d'amplitude plus réduite et donc une réponse de l'action à réponse progressive plus fine et plus précise.

[0132] On note qu'il est très avantageux de positionner les microphones 10 sur la périphérie du boîtier 2 de l'enceinte connectée 1, afin de pouvoir effectuer lors de la capture des signaux sonores des traitements de type procédé de formation de voies dans plusieurs directions.

[0133] Les glissements de commande (et donc les glissements prédéfinis) sont alors des glissements circulaires.

[0134] Pour pouvoir détecter le sens du mouvement, il faut que l'enceinte connectée 1 comprenne au moins trois microphones 10 positionnés en périphérie. Si l'enceinte connectée 1 comprend trois microphones 10, ceux-ci sont disposés en triangle.

[0135] Un faible nombre de microphones 10 entraîne une granularité grossière dans la réponse aux gestes de l'utilisateur, et il est donc préférable, pour détecter des glissements circulaires, de munir l'enceinte connectée 1 d'un plus grand nombre de microphones 10 situés en périphérie, par exemple de six ou huit microphones 10.

[0136] L'enceinte connectée 1 pourra potentiellement comprendre à la fois des microphones 10 positionnés en périphérie, et un microphone central. Il est alors possible de détecter à la fois des glissements linéaires selon un axe, et des glissements circulaires sur la périphérie.

[0137] En référence à la figure 7, une enceinte connectée 1 selon un troisième mode de réalisation comporte six microphones 10a, 10b, 10c, 10d, 10e, 10f disposés de manière circulaire et formant une couronne de microphones en périphérie de la face supérieure 5 du boîtier 2 de l'enceinte connectée 1. Les glissements prédéfinis sont donc des glissements circulaires.

[0138] L'action prédéterminée particulière est à nouveau le réglage du volume de restitution sonore : un glissement dans le sens horaire commande une augmentation du volume, alors qu'un glissement dans le sens anti-horaire commande une réduction du volume.

[0139] Avec une telle configuration de microphones 10, il est possible de détecter des glissements de commande dans un premier sens, c'est-à-dire selon une rotation dans le sens horaire (tel que le glissement de commande 14), ou des glissements de commande dans un deuxième sens, c'est-à-dire selon une rotation dans le sens anti-horaire.

[0140] On peut prévoir qu'au moins un glissement prédéfini associé à une action prédéterminée particulière est défini de manière à débuter nécessairement par une occultation d'un microphone initial prédéfini et/ou de manière à s'achever nécessairement par une occultation d'un microphone final prédéfini.

[0141] Le microphone initial prédéfini est par exemple le microphone 10a et le microphone final prédéfini le microphone 10d pour le glissement de commande 14 selon le sens horaire dans la partie gauche de la couronne de microphones (augmentation du volume). Le microphone initial prédéfini est par exemple le microphone 10d et le microphone final prédéfini le microphone 10a pour le glissement de commande selon le sens horaire dans la partie droite de la couronne de microphones (augmentation du volume).

[0142] Inversement, le microphone initial prédéfini est par exemple le microphone 10d et le microphone final prédéfini le microphone 10a pour le glissement de commande selon le sens anti-horaire dans la partie gauche de la couronne de microphones (réduction du volume). Le microphone initial prédéfini est par exemple le microphone 10a et le microphone final prédéfini le microphone 10d pour le glissement de commande selon le sens anti-horaire dans la partie droite de la couronne de microphones (réduction du volume).

[0143] Les autres glissements de commande (par exemple du microphone 10c vers le microphone 10e) ne sont alors pas admissibles (tout au moins pour régler le volume).

[0144] En référence à la figure 8, une enceinte connectée 1 selon un quatrième mode de réalisation comporte à nouveau six microphones 10a, 10b, 10c, 10d, 10e, 10f disposés de manière circulaire. Cette fois, il n'y a pas de microphone dans l'axe central Y.

[0145] Le microphone initial prédéfini est par exemple le microphone 10a et le microphone final prédéfini le microphone 10c pour le glissement de commande 15 selon le sens horaire dans la partie gauche de la couronne de microphones. Le microphone initial prédéfini est par exemple le microphone 10d et le microphone final prédéfini le microphone 10f pour le glissement de commande selon le sens horaire dans la partie droite de la couronne de microphones.

[0146] La configuration de la figure 7 permet d'obtenir un nombre de pas de commande (quatre pas) plus important que la configuration de la figure 8 (trois pas) pour un demi-tour, et d'effectuer un réglage plus fin dans le cas où l'action prédéterminée associée au glissement de commande est une action à réponse progressive (comme pour le réglage du volume).

[0147] Le point de départ et le point d'arrivée des glissements de commande peuvent aussi être indifférents, l'important étant alors uniquement l'arc de la rotation effectuée par l'utilisateur.

[0148] La longueur maximale des glissements de commande peut être limitée, par exemple à un demi-tour.

[0149] Dans ce cas, en référence à nouveau à la figure 7, les glissements prédéfinis comprennent toutes les successions d'occultations appartenant aux listes suivantes :
  • dans le premier sens (horaire), pour la partie gauche de la couronne :
    [10a ; 10b ; 10c ; 10d] ;
  • dans le premier sens (horaire), pour la partie droite de la couronne :
    [10d ; 10e ; 10f ; 10a] ;
  • dans le deuxième sens (anti-horaire), pour la partie gauche de la couronne :
    [10d ; 10c ; 10b ; 10a] ;
  • dans le deuxième sens (anti-horaire), pour la partie droite de la couronne :
    [10a ; 10f ; 10e ; 10d].


[0150] La longueur des glissements de commande peut ne pas être limitée aux demi-tours, et dans ce cas, les glissements prédéfinis comprennent toutes les successions d'occultations appartenant aux listes suivantes :
  • dans le premier sens (horaire) :
    [10a ; 10b ; 10c ; 10d ; 10e ; 10f] ;
  • dans le deuxième sens (anti-horaire) :
    [10f ; 10e ; 10d ; 10c ; 10b ; 10a].


[0151] Afin de permettre de démarrer le glissement de commande circulaire depuis n'importe quel endroit de la couronne de microphones, on considèrera ces deux dernières listes comme des listes circulaires. Pour permettre la prise en compte de glissements de plus d'un tour, on acceptera également que ces deux dernières listes soient répétées (autant de fois que l'on accepte de tours lors d'un glissement de commande).

[0152] Comme les boutons virtuels ne sont pas visuels et ne sont pas des boutons poussoirs, l'utilisateur se trouve privé de la perception visuelle ou tactile de l'appui ou du glissement sur les boutons. Pour compenser cette absence, l'enceinte connectée 1 comprend un émetteur sensoriel agencé pour fournir à l'utilisateur un retour sensoriel, représentatif du glissement de commande et/ou d'un niveau de réponse de l'action prédéterminée qui est commandée suite à la détection du glissement de commande.

[0153] L'émetteur sensoriel est par exemple un émetteur sonore, qui comprend ici le haut-parleur 6 et les moyens d'émission de l'enceinte connecté 1. Le retour sensoriel est donc un retour sonore.

[0154] L'émetteur sonore peut par exemple émettre un signal sonore de retour lorsque le niveau de réponse de l'action prédéterminée franchit (en augmentant ou en diminuant) un palier prédéfini.

[0155] L'émetteur sonore émet ici un premier signal sonore de retour, par exemple un « tick », à chaque fois que le volume sonore franchit un palier de 20%.

[0156] L'émetteur sonore peut aussi émettre un signal sonore de retour lorsque le niveau de réponse de l'action prédéterminée atteint une butée maximale (ou minimale) associée au sens du glissement de commande, c'est-à-dire que le niveau de réponse atteint une valeur maximale (ou minimale) et n'augmente (ou ne diminue) plus, même si l'utilisateur effectue d'autres glissements de commande dans le même sens.

[0157] L'émetteur sonore produit ici un deuxième signal sonore de retour, différent du premier signal sonore de retour, lorsque la butée maximale (volume maximal) est atteinte et un troisième signal sonore de retour, différent des premier et deuxième signaux sonores de retour, lorsque la butée minimale (volume minimal) est atteinte.

[0158] L'intensité du ou des signaux sonores de retour pourra être constante (par exemple dans le cas de défilement de stations de radio), ou modulée en intensité (par exemple dans le cas du réglage du volume de restitution sonore).

[0159] L'émetteur sensoriel peut aussi être un émetteur lumineux qui comporte des indicateurs lumineux. Les indicateurs lumineux comprennent par exemple des diodes électroluminescentes (LEDs). L'émetteur lumineux comporte aussi des composants pour piloter les indicateurs lumineux (driver).

[0160] Le retour visuel pourra consister en l'allumage d'un ou de plusieurs indicateurs lumineux, dont l'intensité et/ou la couleur peuvent être variables. L'enceinte connectée 1 commande ces indicateurs lumineux en fonction du glissement de commande et/ou du niveau de réponse de l'action prédéterminée. L'enceinte connectée peut par exemple allumer les indicateurs lumineux, ou bien faire varier leur intensité ou leur couleur lors de passages de paliers du niveau de réponse de l'action prédéterminée commandée.

[0161] En référence à la figure 9, l'enceinte connectée 1 comporte une pluralité de sources lumineuses comprenant chacune une ou plusieurs LEDs. Chaque source lumineuse présente la forme d'un segment lumineux 20 formant un secteur angulaire d'une couronne de segments lumineux 20. La couronne de segments lumineux 20 est située à l'intérieur de la couronne de microphones 10.

[0162] Certains des segments lumineux 20 sont associés à des microphones 10 avec lesquels ils sont alignés radialement : le segment lumineux 20a est associé au microphone 10a, le segment lumineux 20b est associé au microphone 10b, le segment lumineux 20c est associé au microphone 10c, etc.

[0163] L'émetteur lumineux émet un signal lumineux de retour qui dépend en temps réel du parcours sur le boîtier 2 du doigt de l'utilisateur lors du glissement de commande.

[0164] Sur la figure 9, on voit que l'utilisateur a tout d'abord posé son doigt sur le microphone 10a, puis, en passant par le microphone 10b, l'a fait glisser jusqu'au microphone 10c.

[0165] Ici, les segments lumineux 20 devant lesquels le doigt de l'utilisateur est passé lors du glissement de commande restent allumés, alors que le segment lumineux 20c associé au microphone 10c, où se situe le doigt de l'utilisateur, clignote.

[0166] Bien sûr, d'autres configurations de retour visuel sont possibles. Par exemple, on peut prévoir de faire clignoter plusieurs segments lumineux 20, ou bien d'utiliser une couleur différente lorsque le niveau de réponse de l'action prédéterminée atteint une butée maximale ou une butée minimale.

[0167] L'émetteur sensoriel pourrait produire un signal sensoriel de retour différent de ceux décrits ici, par exemple un signal vibratoire. Ce signal vibratoire pourrait par exemple être produit au moyen d'un dispositif dédié (dispositif de type vibreur), ou être produit, hors du spectre audible (infrasons), au moyen d'un haut-parleur (6) de l'appareil.

[0168] Bien entendu, l'invention n'est pas limitée aux modes de réalisation décrits mais englobe toute variante entrant dans le champ de l'invention telle que définie par les revendications.

[0169] Les actions prédéterminées commandées par les glissements de commande pourraient différer de celles décrites ici.

[0170] Les actions prédéterminées pourraient par exemple consister à faire défiler des stations radio, à faire avancer ou reculer la lecture d'un contenu audio, etc.

[0171] L'invention peut être mise en œuvre dans tout équipement électronique comprenant des microphones et au moins un haut-parleur : assistant vocal, boîtier décodeur, tablette, smartphone, etc.


Revendications

1. Equipement de restitution audio (1) comprenant :

- un boîtier (2) sur lequel sont formés des trous (7), et des microphones (10) positionnés à l'intérieur du boîtier, chaque microphone étant en communication acoustique avec l'extérieur via l'un des trous ;

- un haut-parleur (6) ;

- des moyens d'émission agencés pour émettre via le haut-parleur un signal sonore de détection, le signal sonore de détection étant un signal sonore prédéterminé ;

- au moins un composant de traitement (12) agencé pour :

o acquérir des signaux audio de détection produits par les microphones (10) à partir d'une capture du signal sonore de détection ;

o détecter à partir des signaux audio de détection une succession d'occultations d'au moins deux microphones distincts ;

o analyser la succession d'occultations de manière à détecter un glissement de commande (14 ; 15) réalisé sur le boîtier par un utilisateur entre au moins deux microphones distincts ;

o commander au moins une action prédéterminée suite à la détection dudit glissement de commande.


 
2. Equipement de restitution audio selon la revendication 1, le composant de traitement (12) étant agencé pour :

- détecter une première occultation d'un premier microphone ;

- si une première durée de la première occultation est inférieure à une première durée prédéfinie, détecter une deuxième occultation d'un deuxième microphone distinct du premier microphone ;

- si une deuxième durée entre une fin de la première occultation et un début de la deuxième occultation est inférieure à une deuxième durée prédéfinie, détecter le glissement de commande.


 
3. Equipement de restitution audio selon l'une des revendications précédentes, le composant de traitement (12) étant agencé pour comparer le glissement de commande avec au moins un glissement prédéfini d'une liste prédéfinie, pour déterminer un glissement prédéfini particulier auquel correspond le glissement de commande, et pour commander au moins une action prédéterminée associée au glissement prédéfini particulier.
 
4. Equipement de restitution audio selon la revendication 3, dans lequel chaque glissement prédéfini correspond à une succession d'occultations prédéfinie de microphones (10) disposés successivement.
 
5. Equipement de restitution audio selon la revendication 4, dans lequel les microphones (10) sont alignés, les glissements prédéfinis étant des glissements linéaires.
 
6. Equipement de restitution audio selon la revendication 4, dans lequel les microphones (10) sont disposés de manière circulaire, les glissements prédéfinis étant des glissements circulaires.
 
7. Equipement de restitution audio selon l'une des revendications 3 à 6, dans lequel au moins un glissement prédéfini associé à une action prédéterminée particulière est défini de manière à débuter nécessairement par une occultation d'un microphone initial prédéfini et/ou de manière à s'achever nécessairement par une occultation d'un microphone final prédéfini.
 
8. Equipement de restitution audio selon l'une des revendications 3 à 7, dans lequel la liste prédéfinie comprend plusieurs glissements prédéfinis dans un même sens mais de longueurs différentes.
 
9. Equipement de restitution audio selon l'une des revendications 3 à 8, dans lequel l'action prédéterminée associée à l'un au moins des glissements prédéfinis est une action à réponse progressive.
 
10. Equipement de restitution audio selon les revendications 8 et 9, dans lequel un niveau de réponse de l'action à réponse progressive dépend de la longueur dudit glissement prédéfini.
 
11. Equipement de restitution audio selon l'une des revendications 9 ou 10, dans lequel les glissements prédéfinis comprennent des glissements prédéfinis dans un premier sens et des glissements prédéfinis dans un deuxième sens, un glissement prédéfini dans le premier sens étant associé à une augmentation d'un niveau de réponse de l'action à réponse progressive alors qu'un glissement prédéfini dans le deuxième sens est associé à une réduction du niveau de réponse de l'action à réponse progressive.
 
12. Equipement de restitution audio selon l'une des revendications 9 à 11, dans lequel une variation d'un niveau de réponse de l'action à réponse progressive est plus importante si le glissement prédéfini est suivi d'une occultation maintenue d'un microphone à la fin du glissement prédéfini.
 
13. Equipement de restitution audio selon l'une des revendications 9 à 12, dans lequel l'action à réponse progressive est un réglage d'un volume de restitution sonore de l'équipement de restitution audio (1).
 
14. Equipement de restitution audio selon l'une des revendications précédentes, comprenant un émetteur sensoriel agencé pour fournir à l'utilisateur un retour sensoriel représentatif du glissement de commande et/ou d'un niveau de réponse de l'action prédéterminée.
 
15. Equipement de restitution audio selon la revendication 14, dans lequel l'émetteur sensoriel est agencé pour émettre un signal sensoriel de retour lorsque le niveau de réponse de l'action prédéterminée franchit un palier prédéfini ou atteint une butée maximale ou minimale.
 
16. Equipement de restitution audio selon la revendication 14, dans lequel l'émetteur sensoriel est agencé pour émettre un signal sensoriel de retour qui dépend d'un parcours sur le boîtier (2) d'un doigt de l'utilisateur lors du glissement de commande.
 
17. Equipement de restitution audio selon l'une des revendications 14 à 16, l'émetteur sensoriel étant un émetteur lumineux (20).
 
18. Equipement de restitution audio selon l'une des revendications 14 à 16, l'émetteur sensoriel étant un émetteur sonore (6).
 
19. Equipement de restitution audio selon l'une des revendications précédentes, l'équipement de restitution audio étant une enceinte connectée (1).
 
20. Procédé de commande d'un équipement de restitution audio selon l'une des revendications précédentes, comprenant les étapes de :

- émettre via le haut-parleur (6) le signal sonore de détection ;

- acquérir les signaux audio de détection produits par les microphones (10) ;

- détecter à partir des signaux audio de détection la succession d'occultations d'au moins deux microphones (10) distincts ;

- analyser la succession d'occultations de manière à détecter le glissement de commande réalisé sur le boîtier (2) par l'utilisateur entre les au moins deux microphones (10) distincts ;

- commander l'action prédéterminée suite à la détection du glissement de commande.


 
21. Programme d'ordinateur comprenant des instructions qui conduisent le composant de traitement (12) de l'équipement de restitution audio (1) selon l'une des revendications 1 à 19 à exécuter les étapes du procédé de commande selon la revendication 20.
 
22. Support d'enregistrement lisible par ordinateur, sur lequel est enregistré le programme d'ordinateur selon la revendication 21.
 




Dessins
















Rapport de recherche









Rapport de recherche