ENCODEUR AMBISONIQUE AMELIORE D'UNE SOURCE SONORE A PLURALITE DE REFLEXIONS

(19)

(11)

EP 3 400 599 B1

(12)	FASCICULE DE BREVET EUROPEEN

(45)	Mention de la délivrance du brevet:
	16.06.2021 Bulletin 2021/24

(21)	Numéro de dépôt: 16808645.2

(22)	Date de dépôt: 08.12.2016

(51)

Int. Cl.:

G10L 19/008^(2013.01)

(86)	Numéro de dépôt:
	PCT/EP2016/080216

(87)	Numéro de publication internationale:
	WO 2017/118519 (13.07.2017 Gazette 2017/28)

(54)	ENCODEUR AMBISONIQUE AMELIORE D'UNE SOURCE SONORE A PLURALITE DE REFLEXIONS VERBESSERTER AMBISONIC-CODIERER FÜR EINE TONQUELLE MIT MEHREREN REFLEXIONEN IMPROVED AMBISONIC ENCODER FOR A SOUND SOURCE HAVING A PLURALITY OF REFLECTIONS

(84)	Etats contractants désignés:
	AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

(30)

Priorité:

05.01.2016 FR 1650062

(43)	Date de publication de la demande:
	14.11.2018 Bulletin 2018/46

(73)	Titulaire: Mimi Hearing Technologies GmbH
	10245 Berlin (DE)

(72)	Inventeur:
	BERTHET, Pierre 35890 Laille (FR)

(74)	Mandataire: Marks & Clerk France
	Immeuble "Visium" 22, avenue Aristide Briand 94117 Arcueil Cedex 94117 Arcueil Cedex (FR)

(56)

Documents cités: :

US-A- 6 021 206
US-A1- 2007 160 216

US-A1- 2005 069 143
US-A1- 2011 305 344

Markus Noisternig ET AL: "A 3D AMBISONIC BASED BINAURAL SOUND REPRODUCTION SYSTEM", , 1 juin 2003 (2003-06-01), XP055139736, Extrait de l'Internet: URL:http://www.aes.org/e-lib/inst/download .cfm/12314.pdf?ID=12314 [extrait le 2014-09-11]

Il est rappelé que: Dans un délai de neuf mois à compter de la date de publication de la mention de la délivrance de brevet européen, toute personne peut faire opposition au brevet européen délivré, auprès de l'Office européen des brevets. L'opposition doit être formée par écrit et motivée. Elle n'est réputée formée qu'après paiement de la taxe d'opposition. (Art. 99(1) Convention sur le brevet européen).

Description

DOMAINE DE L'INVENTION

[0001] La présente invention concerne l'encodage ambisonique de sources sonores. Il concerne plus spécifiquement l'amélioration de l'efficacité de ce codage, dans le cas où une source sonore est affectée de réflexions dans une scène sonore.

ETAT DE L'ART PRECEDENT

[0002] Les représentations spatialisées du son regroupent des techniques de capture de synthèse et de reproduction d'environnement sonore permettant une immersion de l'auditeur beaucoup plus importante dans un environnement sonore. Elles permettent notamment à un utilisateur de discerner un nombre de sources sonores supérieures au nombre de haut-parleurs dont il dispose, et localiser précisément en 3D ces sources sonores, même lorsque leur direction n'est pas celle d'un haut-parleur. Les applications des représentations spatialisées du son sont nombreuses, et incluent la localisation précise de source sonores en 3 dimensions par un utilisateur à partir d'un son issu d'un casque stéréo, ou la localisation de sources sonores en 3 dimensions par des utilisateurs dans une pièce, le son étant émis par des enceintes, par exemple des enceintes 5.1. De plus, les représentations spatialisées du son permettent la réalisation d'effets sonores nouveaux. Par exemple, elles permettent la rotation d'une scène sonore ou l'application de réflexion d'une source sonore pour simuler le rendu d'un environnement sonore donné, par exemple une salle de cinéma ou une salle de concert.

[0003] Les représentations spatialisées s'effectuent en deux étapes principales: un encodage ambisonique, et un décodage ambisonique. Pour bénéficier d'une représentation spatialisée du son, un décodage ambisonique en temps réel est toujours nécessaire. Une production ou traitement du son en temps-réel peut impliquer en plus un encodage ambisonique en temps réel de celui-ci. L'encodage ambisonique étant une tâche complexe, les capacités d'encodage ambisonique en temps réel peuvent être limitées. Par exemple, une capacité de calcul donnée ne pourra être capable d'encoder en temps réel qu'un nombre de sources sonores limitées.

[0004] Les techniques de représentation spatialisées du son sont notamment décrites par J. Daniel, Représentations de champs acoustiques, application à la transmission et à la reproduction de scènes sonores dans un contexte multimédia, INIST-CNRS, Cote INIST : T 139957. L'encodage ambisonique d'un champ sonore consiste en la décomposition du champ de pression sonore en un point, correspondant par exemple à la position d'un utilisateur, sous forme de coordonnées sphériques, exprimées sous la forme suivante :

Dans laquelle p(r,t) représente la pression sonore, à un instant t, dans la direction r par rapport au point auquel le champ sonore est calculé. j^m représente la fonction sphérique de Bessel d'ordre m.

[0005] Y_mn(θ,ϕ) représente l'harmonique sphérique d'ordre mn dans les directions (θ,ϕ). définies par la direction r. Le symbole B_mn(t) définit les coefficients ambisoniques correspondant aux différentes harmoniques sphériques, à un instant t.

[0006] Les coefficients ambisoniques définissent donc, à chaque instant, l'ensemble du champ sonore entourant un point. Le traitement des champs sonores dans le domaine ambisonique possède des propriétés particulièrement intéressantes. En particulier, il est très aisé de procéder à des rotations de l'ensemble du champ sonore. Il est de plus possible de diffuser sur des haut-parleurs, à partir d'un ensemble de coefficients ambisoniques, du son comportant des informations de direction. Il est par exemple possible de diffuser du son sur des enceintes de types 5.1. Il est également possible de restituer, dans un casque ne disposant que d'un haut-parleur gauche et d'un haut-parleur droit, du son comportant des informations de directions, en utilisant des fonctions de transfert connues sous le nom de HRTF (Head-Related Transfer Functions, ou Fonctions de Transfert Relatives à la Tête). Ces fonctions permettent de restituer un signal directionnel sur deux haut-parleurs, en ajoutant à au moins un canal d'un signal stéréo un délai et/ou une atténuation, qui seront interprétés par le cerveau comme définissant la direction de la source sonore.

[0007] La décomposition dite HOA (de l'acronyme anglais Higher Order Ambisonics, ou Ambisonie de Plus Haut Ordre) consiste à tronquer cette somme infinie à un ordre M, supérieur ou égal à 1 :

[0008] D'une manière générale, une source suffisamment distante est considérée comme propageant une onde sonore de manière sphérique. Il est alors possible de considérer que la valeur à un instant t d'un coefficient ambisonique B_mn(t) lié à cette source dépend, d'une part, de la pression sonore S(t) de la source à cet instant t, et d'autre part de l'harmonique sphérique liée à l'orientation (θ_s,ϕ_s) de cette source sonore. On peut donc écrire, pour une source sonore unique :

[0009] Dans le cas d'un ensemble de N_s sources sonores lointaines, les coefficients ambisoniques décrivant la scène sonore sont calculés comme la somme des coefficients ambisoniques de chacune des sources, chaque source i ayant une orientation (θ_si,ϕ_si):

[0010] On peut également représenter ce calcul sous forme de vecteur :

Les coefficients ambisoniques gardant la forme B_mn, avec, à l'ordre M, m allant de 0 à M, et n allant de -m à m.

[0011] Un appareil comprenant un encodage ambisonique d'au moins une source peut donc définir un champ sonore complet, en calculant les coefficients ambisoniques à un ordre M. En fonction de l'ordre M, et du nombre de sources, ce calcul peut être long et gourmand en ressource. En effet, à un ordre M, (M + 1)² coefficients ambisoniques sont calculés à chaque instant t. Pour chaque coefficient, la contribution B_mn(t) = S(t)Y_mn(θ_s,ϕ_s) de chacune des N_s sources doit être calculée. Si une source S est fixe, l'harmonique sphérique Y_mn(θ_s,ϕ_s) peut être pré-calculée. Dans le cas contraire, elle doit être recalculée à chaque instant.

[0012] Une augmentation de l'ordre du coefficient ambisonique permet une meilleure qualité du rendu auditif. Il peut donc être difficile d'obtenir une bonne qualité sonore, tout en préservant une charge, un temps de calcul raisonnable, une consommation électrique et un usage de batterie raisonnables. Ceci est d'autant plus vrai que les calculs de coefficients ambisoniques s'effectuent souvent en temps-réel sur des dispositifs mobiles. C'est par exemple le cas d'un smartphone, pour écouter de la musique en temps réel, avec des informations directionnelles calculées à l'aide de coefficients ambisoniques.

[0013] Cette problématique est encore plus forte lorsque des réflexions sont calculées dans une scène sonore.

[0014] Le calcul de réflexions permet de simuler une scène sonore dans une pièce, par exemple une salle de cinéma ou de concert. Dans ces conditions, le son se réfléchit sur les murs de la salle, donnant une « ambiance » caractéristique, les réflexions étant définies par les positions respectives des sources sonores, de l'auditeur, mais aussi par les matériaux sur lesquels les ondes sonores se diffusent, par exemple le matériau des murs. La création d'effets de salle à l'aide d'un codage audio ambisonique est notamment décrite par J. Daniel, Représentations de champs acoustiques, application à la transmission et à la reproduction de scènes sonores dans un contexte multimédia, INIST-CNRS, Cote INIST : T 139957, pp. 283-287.

[0015] Il est possible de simuler l'effet des réflexions et de donner une « ambiance » en ambisonie, en ajoutant, pour chaque source sonore, un ensemble de sources sonores secondaires, dont l'intensité et la direction sont calculées à partir des réflexions des sources sonores sur les murs et obstacles d'une scène sonore. Quelques sources sonores sont nécessaires, pour chaque source sonore initiale, afin de simuler de manière satisfaisante une scène sonore. Cependant, ceci rend le problème de capacité de calcul et de batterie précité encore plus critique, puisque la complexité de calcul des coefficients ambisoniques est encore multipliée par le nombre de sources sonores secondaires. La complexité du calcul des coefficients ambisoniques pour un rendu sonore satisfaisant peut alors rendre cette solution impraticable, par exemple parce qu'il devient impossible de calculer les coefficients ambisoniques en temps réel, parce que la charge de calcul des coefficients ambisoniques devient trop importante, ou parce la consommation électrique et/ou de batterie sur un appareil mobile devient rédhibitoire.

[0016] N. Tsingos et al. Perceptual Audio Rendering of Complex Virtual Environment, ACM Transactions on Graphics (TOG) - Proceedings of ACM SIGGRAPH 2004, Volume 23 Issue 3, August 200, pp. 249-258 divulgue une méthode de traitement binaural pour pallier ce problème. La solution proposée par Tsingos consiste à réduire le nombre de sources sonores en:

Evaluant la puissance de chaque source sonore ;
Classant les sources sonores, de la plus à la moins puissante ;
Supprimant les sources sonores les moins puissantes ;
Groupant les sources sonores restantes par grappes de sources sonores proches les unes des autres, et les fusionnant pour obtenir, pour chaque grappe, une unique source sonore virtuelle.

[0017] La méthode divulguée par Tsingos permet de réduire le nombre de sources sonores, et donc la complexité du traitement global lorsque des réverbérations sont utilisées. Cependant, cette technique présente plusieurs inconvénients. Elle n'améliore pas la complexité du traitement des réverbérations elles-mêmes. Le problème rencontré se poserait donc à nouveau, si, avec un nombre réduit de sources, on souhaite augmenter le nombre de réverbérations. De plus, les traitements pour déterminer la puissance sonore de chaque source, et fusionner les sources par grappes présentent eux-mêmes une charge de calcul importante. Les expériences décrites se limitent à des cas ou les sources sonores sont connues à l'avance, et leurs puissances respectives pré-calculées. Dans des cas de scènes sonores pour lesquelles plusieurs sources d'intensités variables sont présentes, et dont les puissances doivent être recalculées, la charge de calcul associée viendrait, au moins partiellement, annuler le gain de calcul obtenu en limitant le nombre de sources.

[0018] Enfin, les tests conduits par Tsingos donnent des résultats satisfaisants lorsque les sources sonores sont assimilables à du bruit, par exemple dans le cas d'une foule dans le métro. Sur d'autres types de sources sonores, une telle méthode pourrait s'avérer dommageable. Par exemple, lors de l'enregistrement d'un concert donné par un orchestre symphonique, il est fréquent que plusieurs instruments, bien qu'ayant une puissance sonore faible, contribuent de manière importante à l'harmonie d'ensemble. Supprimer purement et simplement les sources sonores associées, car elles sont relativement peu puissantes, nuirait alors gravement à la qualité de l'enregistrement.

[0019] Le document US 6021206 divulgue un filtrage de sources sonores virtuelles correspondant aux réflexions comprenant un délai et une atténuation.

[0020] Le document Markus Noistering et al. « A 3D AMBISONIC BASED BINAURAL SOUND REPRODUCTION SYSTEM » divulgue la création de sources sonores virtuelles correspondant aux réflexions et l'application d'un gain et d'un délai à chacune de ces sources

[0021] Le document US 2007/160216 divulgue, de manière générale, le calcul de gains en fonction de la position d'une source sonore pour la binauralisation.

[0022] Le document US 2005/069143 divulgue l'application de fonctions HRTF au son dans le domaine fréquentiel.

[0023] Le document US 2011/305344 divulgue méthode de transformations des pistes sonores avant encodage binaural, afin de minimiser le besoin de « sweet spot », notamment en convertissant certaines pistes en mono.

[0024] Il y a donc besoin d'un appareil et d'une méthode pour le calcul des coefficients ambisoniques, qui permette de calculer en temps réel un ensemble de coefficients ambisoniques représentatifs d'au moins une source sonore et une ou plusieurs réflexions de celle-ci dans une scène sonore, tout en limitant la complexité de calcul additionnelle liée à la ou aux réflexions de la source sonore, sans réduire à priori le nombre de sources sonores.

RESUME DE L'INVENTION

[0025] A cet effet, l'invention concerne un encodeur ambisonique d'onde sonore à pluralité de réflexions, comprenant : une logique de transformation fréquentielle de l'onde sonore ; une logique de calcul d'harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir d'une position d'une source de l'onde sonore et de positions d'obstacles à une propagation de l'onde sonore ; une pluralité de logiques de filtrage dans le domaine fréquentiel recevant en entrée des harmoniques sphériques de la pluralité de réflexions, chaque logique de filtrage consistant en une atténuation et un délai d'une réflexion, et étant paramétrée par un coefficient acoustique et un délai de ladite réflexion ; une logique d'addition d'harmoniques sphériques de l'onde sonore et des sorties des logiques de filtrage, en un ensemble d'harmoniques sphériques représentatives à la fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel ; une logique de multiplication dudit ensemble d'harmoniques sphériques représentatives à la fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel par des valeurs d'intensité sonores de l'onde en sortie de la transformation fréquentielle, afin d'obtenir un ensemble de coefficients ambisoniques représentatifs à la fois de l'onde sonore et de la pluralité de réflexions.

[0026] Avantageusement, la logique de calcul d'harmoniques sphériques de l'onde sonore est configurée pour calculer les harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir d'une position fixe de la source de l'onde sonore.

[0027] Avantageusement, la logique de calcul d'harmoniques sphériques de l'onde sonore est configurée pour calculer de manière itérative les harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir de positions successives de la source de l'onde sonore.

[0028] Avantageusement, chaque réflexion est caractérisée par un unique coefficient acoustique.

[0029] Avantageusement, chaque réflexion est caractérisée par un coefficient acoustique pour chaque fréquence dudit échantillonnage fréquentiel.

[0030] Avantageusement, les réflexions sont représentées par des sources sonores virtuelles.

[0031] Avantageusement, l'encodeur ambisonique comprend en outre une logique de calcul des coefficients acoustiques, des délais et de la position de des sources sonores virtuelles des réflexions, ladite logique de calcul étant configurée pour calculer les coefficients acoustiques et les délais des réflexions en fonction d'estimations d'une différence de distance parcourue par le son entre la position de la source de l'onde sonore et une position estimée d'un utilisateur d'une part, et d'une distance parcourue par le son entre les positions des sources sonores virtuelles des réflexions et la position estimée de l'utilisateur d'autre part.

[0032] Avantageusement, la logique de calcul des coefficients acoustiques, des délais et des positions des sources sonores virtuelles des réflexions est en outre configurée pour calculer les coefficients acoustiques des réflexions en fonction d'au moins un coefficient acoustique d'au moins un obstacle à la propagation d'ondes sonores, sur lequel le son est réfléchi.

[0033] Avantageusement, la logique de calcul des coefficients acoustiques, des délais et des positions des sources sonores virtuelles des réflexions est en outre configurée pour calculer les coefficients acoustiques des réflexions en fonction d'un coefficient acoustique d'au moins un obstacle à la propagation d'ondes sonores, sur lequel le son est réfléchi.

[0034] Avantageusement, la logique de calcul d'harmoniques sphériques de l'onde sonore et de la pluralité de réflexions est en outre configurée pour calculer des harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à chaque fréquence de sortie du circuit de transformation fréquentielle, ledit encodeur ambisonique comprenant en outre une logique de calcul de coefficients binauraux de l'onde sonore, configurée pour calculer des coefficient binauraux de l'onde sonore en multipliant à chaque fréquence de sortie du circuit de transformation fréquentielle de l'onde sonore le signal de l'onde sonore par les harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à cette fréquence.

[0035] Avantageusement, la logique de calcul des coefficients acoustiques, des délais et des positions des sources sonores virtuelles des réflexions est configurée pour calculer des coefficients acoustiques et des délais d'une pluralité de réflexions tardives.

[0036] L'invention concerne également une méthode d'encodage ambisonique d'onde sonore à pluralité de réflexions, comme définie par la revendication 12.

[0037] L'invention concerne également un programme d'ordinateur pour l'encodage ambisonique d'onde sonore à pluralité de réflexions, comme définie par la revendication 13.

[0038] L'encodeur ambisonique selon l'invention permet d'améliorer la sensation d'immersion dans une scène audio 3D.

[0039] La complexité d'encodage des réflexions de sources sonores d'un encodeur ambisonique selon l'invention est moindre que la complexité d'encodage des réflexions de sources sonores d'un encodeur ambisonique selon l'état de l'art.

[0040] L'encodeur ambisonique selon l'invention permet d'encoder un plus grand nombre de réflexions d'une source sonore en temps réel.

[0041] L'encodeur ambisonique selon l'invention permet de diminuer la consommation électrique liée à l'encodage ambisonique, et d'augmenter la durée de vie d'une batterie d'un appareil mobile utilisé pour cette application.

LISTE DES FIGURES

[0042] D'autres caractéristiques apparaîtront à la lecture de la description détaillée donnée à titre d'exemple et non limitative qui suit faite au regard de dessins annexés qui représentent:

les figures 1a et 1b, deux exemples de systèmes d'écoute d'onde sonore, selon deux modes de réalisation de l'invention
la figure 2, un exemple d'un système de binauralisation comprenant un moteur de binauralisation par source sonore d'une scène audio selon l'état de l'art ;
les figures 3a et 3b, deux exemples de moteurs de binauralisation d'une scène 3D, respectivement dans le domaine temporel et le domaine fréquentiel selon l'état de l'art
la figure 4, un exemple d'encodeur ambisonique d'une onde sonore à une pluralité de réflexions, dans un ensemble de modes de mise en œuvre de l'invention ;
la figure 5, un exemple de calcul d'une source sonore secondaire, dans un mode de mise en œuvre de l'invention ;
la figure 6, un exemple de calcul de réflexions précoces et de réflexions tardives, dans un mode de réalisation de l'invention ;
la figure 7, une méthode d'encodage d'une onde sonore à une pluralité de réflexions dans un ensemble de modes de mise en œuvre de l'invention.

DESCRIPTION DETAILLEE

[0043] Les figures 1a et 1b représentent deux exemples de systèmes d'écoute d'onde sonore, selon deux modes de réalisation de l'invention.

[0044] La figure 1a représente un exemple de système d'écoute d'onde sonore, selon un mode de réalisation de l'invention.

[0045] Le système 100a comprend une tablette tactile 110a, un casque 120a pour permettre à un utilisateur 130a d'écouter une onde sonore. Le système 100a, comprend, à titre d'exemple uniquement, une tablette tactile. Cependant, cet exemple est également applicable à un smartphone, ou à tout autre appareil mobile possédant des capacités d'affichage et de diffusion sonore. L'onde sonore peut par exemple être issue de la lecture d'un film ou d'un jeu. Selon plusieurs modes de réalisation de l'invention, le système 100a peut être configuré pour écouter plusieurs ondes sonores. Par exemple, lorsque le système 100a est configuré pour la lecture d'un film comprenant une piste sonore multicanal 5.1, 6 ondes sonores sont écoutées simultanément. De la même manière, lorsque le système 100a est configuré pour jouer à un jeu, de nombreuses ondes sonores peuvent être écoutées simultanément. Par exemple, dans le cas d'un jeu faisant intervenir plusieurs personnages, une onde sonore peut être créée pour chaque personnage.

[0046] Chacune des ondes sonores est associée à une source sonore, dont la position est connue.

[0047] La tablette tactile 110a comprend un encodeur ambisonique 111a selon l'invention, un circuit de transformation 112a, et un décodeur ambisonique 113a.

[0048] Selon un ensemble de modes de réalisation de l'invention, l'encodeur ambisonique 111a, le circuit de transformation 112a et le décodeur ambisonique 113a sont constitués d'instructions de code d'ordinateur exécutées sur un processeur de la tablette tactile. Ils peuvent par exemple avoir été obtenus en installant une application ou un logiciel spécifique sur la tablette. Dans d'autres modes de réalisation de l'invention, l'un au moins parmi l'encodeur ambisonique 111a, le circuit de transformation 112a et le décodeur ambisonique 113a est un circuit intégré spécialisé, par exemple un ASIC (acronyme de l'anglais « Application-Specific Integrated Circuit, littéralement « circuit intégré propre à une application »), un FPGA (acronyme de l'anglais Field-Programmable Gate Array, Réseau de portes programmable).

[0049] L'encodeur ambisonique 111a est configuré pour calculer, dans le domaine fréquentiel, un ensemble de coefficients ambisoniques représentatifs de l'ensemble d'une scène sonore, à partir d'au moins une onde sonore. Il est de plus configuré pour appliquer des réflexions à au moins une onde sonore, afin de simuler un environnement d'écoute, par exemple une salle de cinéma d'une certaine taille, ou une salle de concert.

[0050] Le circuit de transformation 112a est configuré pour effectuer des rotations de la scène sonore en modifiant les coefficients ambisoniques, afin de simuler la rotation de la tête de l'utilisateur, de sorte que, quelle que soit l'orientation de son visage, les différentes ondes sonores lui paraissent parvenir d'une même position. Par exemple, si l'utilisateur tourne la tête vers la gauche d'un angle a, une rotation de la scène sonore vers la droite d'un même angle α permet de continuer à lui faire parvenir le son toujours de la même direction. Selon un ensemble de modes de réalisation de l'invention, le casque 120a est équipé d'au moins un capteur de mouvement 121a, par exemple un gyromètre, permettant d'obtenir un angle ou une dérivée d'un angle de rotation de la tête de l'utilisateur 130a. Un signal représentatif d'un angle de rotation, ou d'une dérivée d'un angle de rotation, est alors envoyé par le casque 121a à la tablette 120a, afin que le circuit de transformation 112a effectue la rotation de la scène sonore correspondante.

[0051] Le décodeur ambisonique 113a est configuré pour restituer la scène sonore sur les deux canaux stéréo du casque 120a, en convertissant les coefficients ambisoniques transformés en deux signaux stéréo, l'un pour le canal gauche et l'autre pour le canal droit. Dans un ensemble de modes de réalisation de l'invention, le décodage ambisonique s'effectue à l'aide de fonctions dites HRTF (acronyme de l'anglais « Head Related Transfer Functions », littéralement Fonctions de Transfer Liées à la Tête) permettant de restituer, sur deux canaux stéréo les directions des différentes sources sonores. La demande de brevet français n° 1558279, déposée par le demandeur, décrit une méthode pour créer des fonctions HRTF optimisées pour un utilisateur en fonction d'une banque de fonctions HRTF, et des caractéristiques du visage dudit utilisateur.

[0052] Le système 100a permet ainsi à son utilisateur de bénéficier d'une expérience particulièrement immersive : lors d'un jeu ou d'une lecture d'un contenu multimédia, en plus de l'image, ce système lui permet de bénéficier d'une impression d'immersion dans une scène sonore. Cette impression est amplifiée à la fois par le suivi des orientations des différentes sources sonores lorsque l'utilisateur tourne la tête, et par l'application de réflexions donnant une impression d'immersion dans un environnement d'écoute particulier. Ce système permet par exemple de regarder un film ou un concert avec un casque audio, en ayant une impression d'immersion dans une salle de cinéma ou une salle de concert. L'ensemble de ces opérations est effectué en temps réel, ce qui permet d'adapter en permanence le son perçu par l'utilisateur à l'orientation de sa tête.

[0053] L'encodeur ambisonique 111a selon l'invention permet d'encoder un plus grand nombre de réflexions des sources sonores, avec une complexité moindre par rapport à un encodeur ambisonique de l'art antérieur. Il permet donc d'effectuer tous les calculs ambisoniques en temps réel, tout en augmentant le nombre de réflexions des sources sonores. Cette augmentation du nombre de réflexions permet de modéliser de manière plus fine l'environnement d'écoute simulé (salle de concert, de cinéma...) et donc d'améliorer la sensation d'immersion dans la scène sonore. La réduction de la complexité de l'encodage ambisonique permet également, en considérant un nombre identique de source sonores, de réduire la consommation électrique de l'encodeur par rapport à un encodeur de l'état de l'art, et donc d'augmenter la durée de déchargement de la batterie de la tablette tactile 110a. Cela permet donc à l'utilisateur de profiter d'un contenu multimédia pendant une durée plus longue.

[0054] La figure 1b représente un second exemple de système d'écoute d'onde sonore, selon un mode de réalisation de l'invention.

[0055] Le système 100b comprend une unité centrale 110b connectée à un écran 114b, une souris 115b et un clavier 116b et un casque 120b et est utilisé par un utilisateur 130b. L'unité centrale comprend un encodeur ambisonique 111b selon l'invention, un circuit de transformation 112b, et un décodeur ambisonique 113b, respectivement semblables à l'encodeur ambisonique 111a, circuit de transformation 112a, et décodeur ambisonique 113a du système 100a. De manière similaire au système 100a, l'encodeur ambisonique 111b est configuré pour encoder au moins une onde représentative d'une scène sonore en y ajoutant des réflexions, le casque 120a comprend au moins un capteur de mouvement 120b, le circuit de transformation 120b est configuré pour effectuer des rotations de la scène sonore afin de suivre l'orientation de la tête de l'utilisateur, et le décodeur ambisonique 113b est configuré pour restituer le son sur les deux canaux stéréo du casque 120b, de manière à ce que l'utilisateur 130b ait une impression d'immersion dans une scène sonore.

[0056] Le système 100b est adapté pour la visualisation de contenu multimédia, mais également pour le jeu vidéo. En effet, dans un jeu vidéo, de très nombreuses ondes sonores, issues de différentes sources, peuvent survenir. C'est par exemple le cas dans un jeu de stratégie ou de guerre, dans lequel de nombreux personnages peuvent émettre des sons différents (bruits de pas, de course, tirs...) pour diverses sources sonores. Un encodeur ambisonique 111b permet d'encoder toutes ces sources, tout en leur ajoutant de nombreuses réflexions rendant la scène plus réaliste et immersive, en temps réel. Ainsi, le système 100b comprenant un encodeur ambisonique 111b selon l'invention permet une expérience immersive dans un jeu vidéo, avec un grand nombre de sources sonores et de réflexions.

[0057] La figure 2 représente un exemple d'un système de binauralisation comprenant un moteur de binauralisation par source sonore d'une scène audio selon l'état de l'art.

[0058] Le système de binauralisation 200 est configuré pour transformer un ensemble 210 de sources sonores d'une scène sonore en un canal gauche 240 et un canal droit 241 d'un système d'écoute stéréo, et comprend un ensemble de moteurs binauraux 220, comprenant un moteur binaural par source sonore.

[0059] Les sources peuvent être de tout type de sources sonores (mono, stéréo, 5.1, sources sonores multiples dans le cas d'un jeu vidéo par exemple). Chaque source sonore est associée à une orientation dans l'espace par exemple définie par des angles (θ,ϕ) dans un référentiel, et par une onde sonore, elle-même représentée par un ensemble d'échantillons temporels.

[0060] Chacun des moteurs de binauralisation de l'ensemble 220 est configuré pour, pour une source sonore et à chaque instant t correspondant à un échantillon de la source sonore :

effectuer un encodage HOA de la source sonore à un ordre M ;
effectuer une transformation sur les coefficients binauraux, par exemple une rotation ;
calculer une intensité sonore p(r,t) à des instants t pour un ensemble de canaux de sortie, dans laquelle r représente l'orientation du canal de sortie.

[0061] Les canaux de sortie possibles correspondent aux différents canaux d'écoute, on peut par exemple avoir deux canaux de sortie dans un système d'écoute stéréo, 6 canaux de sortie dans un système d'écoute 5.1, etc...

[0062] Chaque moteur de binauralisation produit deux sorties (une sortie gauche et une sortie droite), et le système 200 comprend un circuit d'addition 230 de toutes les sorties gauches et un circuit d'addition 231 de toutes les sorties droites de l'ensemble 220 de moteurs de binauralisation. Les sorties des logiques d'addition 230 et 231 sont respectivement l'onde sonore du canal gauche 240 et l'onde sonore du canal droit 241 d'un système d'écoute stéréo.

[0063] Le système 200 permet de transformer l'ensemble de sources sonores 210 en deux canaux stéréo, tout en pouvant appliquer toutes les transformations permises par l'ambisonie, telles que des rotations.

[0064] Cependant, le système 200 présente un inconvénient majeur en termes de temps de calcul : il nécessite des calculs pour calculer les coefficients ambisoniques de chaque source sonore, des calculs pour les transformations de chaque source sonore, et des calculs pour les sorties associées à chaque source sonore. La charge de calcul pour le traitement d'une source sonore par le système 200 est donc proportionnelle au nombre de sources sonores, et peut, pour un grand nombre de sources sonores, devenir prohibitive.

[0065] Les figures 3a et 3b représentent deux exemples de moteurs de binauralisation d'une scène 3D, respectivement dans le domaine temporel et le domaine fréquentiel selon l'état de l'art.

[0066] La figure 3a représente un exemple de moteur de binauralisation d'une scène 3D, dans le domaine temporel selon l'état de l'art.

[0067] Afin de limiter la complexité du traitement binaural dans le cas d'un grand nombre de sources, le moteur de binauralisation 300a comprend un unique moteur d'encodage HOA 320a pour l'ensemble des sources 310 de la scène sonore. Ce moteur d'encodage 320a est configuré pour calculer, à chaque pas de temps, les coefficients binauraux de chaque source sonore en fonction de l'intensité et de la position de la source sonore audit pas de temps, puis à sommer les coefficients binauraux des différentes sources sonores. Ceci permet d'obtenir un unique ensemble 321a de coefficients binauraux représentatifs de l'ensemble de la scène sonore.

[0068] Le moteur de binauralisation 320a comprend ensuite un circuit de transformation 330a des coefficients, configuré pour transformer l'ensemble de coefficients 321a représentatifs de la scène sonore en un ensemble de coefficients transformés 331a représentatifs de l'ensemble de la scène sonore. Ceci permet par exemple d'effectuer une rotation de l'ensemble de la scène sonore.

[0069] Le moteur de binauralisation 300a comprend enfin un décodeur binaural 340a, configuré pour restituer les coefficients transformés 331a en un ensemble de canaux de sortie, par exemple un canal gauche 341a et un canal droit 342a d'un système stéréo.

[0070] Le moteur de binauralisation 300a permet donc de réduire la complexité de calcul nécessaire au traitement binaural d'une scène sonore par rapport au système 200, en appliquant les étapes de transformation et décodage à l'ensemble de la scène sonore, plutôt qu'à chaque source sonore prise individuellement.

[0071] figure 3b représente un exemple de moteur de binauralisation d'une scène 3D, dans le domaine fréquentiel selon l'état de l'art.

[0072] Le moteur de binauralisation 300b est assez semblable au moteur de binauralisation 300a. Il comprend un ensemble 311b de logiques de transformation fréquentielle, l'ensemble 311b comprenant une logique de transformation fréquentielle pour chaque source sonore. Les logiques de transformation fréquentielle peuvent par exemple être configurées pour appliquer une transformée de Fourier rapide (ou FFT, de l'acronyme anglais Fast Fourier Transform), afin d'obtenir un ensemble 312b de sources dans le domaine fréquentiel. L'application de transformées fréquentielles est bien connue de l'homme de l'art, et est par exemple décrite par A. Mertins, Signal Analysis : Wavelets, Filter banks, Time-Frequency Transforms and Applications, English (revised edition). ISBN : 9780470841839. Elle consiste par exemple à transformer, par fenêtres temporelles, les échantillons sonores en intensité fréquentielles, selon un échantillonnage fréquentiel. L'opération inverse, ou transformation fréquentielle inverse (dite FFT^-1 ou transformation de Fourier rapide inverse dans le cas d'une transformée de Fourier rapide) permet de restituer, à partir d'un échantillonnage de fréquences, des intensités d'échantillons sonores.

[0073] Le moteur de binauralisation 300b comprend ensuite un encodeur HOA 320b dans le domaine fréquentiel. L'encodeur 320b est configuré pour calculer, pour chaque source et à chaque fréquence de l'échantillonnage fréquentiel, les coefficients ambisoniques correspondants, puis à additionner les coefficients ambisoniques des différentes sources, afin d'obtenir un ensemble 321b d'échantillons ambisoniques représentatifs de l'ensemble de la scène sonore, aux différentes fréquences. Un coefficient ambisonique à une fréquence f de l'échantillonnage en fréquence s'obtient, de manière similaire à un coefficient ambisonique à l'instant t, par la formule: B_mn(f) = S(f)Y_mn(θ_s,ϕ_s).

[0074] Le moteur de binauralisation 300b comprend ensuite un circuit de transformation 330b, similaire au circuit de transformation 330a, permettant d'obtenir un ensemble 331b de coefficients ambisoniques transformés représentatifs de l'ensemble de la scène sonore, et un décodeur binaural 340b, configuré pour restituer deux canaux stéréo 341b et 342b. Le décodeur binaural 340b comprend un circuit de transformation fréquentielle inverse, afin de restituer les canaux stéréo dans le domaine temporel.

[0075] Les propriétés du moteur de binauralisation 300b sont assez semblables à celles du moteur de binauralisation 300a. Il permet également d'effectuer un traitement binaural d'une scène sonore, avec une complexité réduite par rapport au système 200.

[0076] En cas d'augmentation importante du nombre de sources, la complexité du traitement binaural des moteurs de binauralisation 300a et 300b est principalement due au calcul des coefficients HOA par les encodeurs 320a et 320b. En effet, le nombre de coefficients à calculer est proportionnel au nombre de sources. Au contraire, les circuits de transformation 330a et 330b, ainsi que les décodeurs binauraux 340a et 340b traitent des ensembles de coefficients binauraux représentatifs de l'ensemble de la scène sonore, dont le nombre ne varie pas en fonction du nombre de sources.

[0077] Pour le traitement des réflexions, la complexité des encodeurs binauraux 320a et 320b peut augmenter de manière importante. En effet, la solution de l'état de l'art pour traiter les réflexions consiste à ajouter une source sonore virtuelle pour chaque réflexion. La complexité de l'encodage HOA de ces encodeurs selon l'état de l'art augmente donc proportionnellement en fonction du nombre de réflexions par source, et peut devenir problématique lorsque le nombre de réflexions devient trop important.

[0078] La figure 4 représente un exemple d'encodeur ambisonique d'une onde sonore à une pluralité de réflexions, dans un ensemble de modes de mise en œuvre de l'invention.

[0079] L'encodeur ambisonique 400 est configuré pour encoder une onde sonore 410 avec une pluralité de réflexions, en un ensemble de coefficients ambisoniques à un ordre M. Pour ce faire, l'encodeur ambisonique est configuré pour calculer une ensemble 460 d'harmoniques sphériques représentatives de l'onde sonore et de la pluralité de réflexions. L'encodeur ambisonique 400 sera décrit, à titre d'exemple, pour l'encodage d'une onde sonore unique. Cependant un encodeur ambisonique 400 selon l'invention peut également encoder une pluralité d'ondes sonores, les éléments de l'encodeur ambisonique étant utilisé de la même manière pour chaque onde sonore additionnelle. L'onde sonore 410 peut correspondre par exemple à un canal d'une piste audio, ou à une onde sonore créée dynamiquement, par exemple une onde sonore correspondant à un objet d'un jeu vidéo. Dans un ensemble de modes de réalisation de l'invention, les ondes sonores sont définies par des échantillons successifs d'intensité sonore. Selon différents modes de réalisation de l'invention, les ondes sonores peuvent par exemple être échantillonnées à une fréquence de 22500Hz, 12000Hz, 44100 Hz, 48000 Hz, 88200 Hz, ou 96000 Hz, et chacun des échantillons d'intensité codé sur 8, 12, 16, 24 ou 32 bits. En cas de pluralité d'onde sonores, celles-ci peuvent être échantillonnées à des fréquences différentes, et les échantillons peuvent être codés sur des nombres de bits différents.

[0080] L'encodeur ambisonique 400 comprend une logique 420 de transformation fréquentielle de l'onde sonore. Celle-ci est similaire aux logiques 311b de transformation fréquentielle des ondes sonores du système de binauralisation 300b selon l'état de l'art. Dans des modes de réalisation à une pluralité d'ondes sonores, l'encodeur 400 comprend une logique de transformation fréquentielle pour chaque onde sonore. En sortie de la logique de transformation fréquentielle, une onde sonore est définie 421, pour une fenêtre temporelle, par un ensemble d'intensités à différentes fréquences d'un échantillonnage en fréquence. Dans un ensemble de modes de réalisation de l'invention, la logique 420 de transformation fréquentielle est une logique d'application d'une FFT.

[0081] L'encodeur 400a comprend également une logique 430 de calcul d'harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir d'une position d'une source de l'onde sonore et de positions d'obstacles à la propagation de l'onde sonore. Dans un ensemble de modes de réalisation de l'invention, la position de la source de l'onde sonore est définie par des angles (θ_si,ϕ_si) et une distance par rapport à une position d'écoute de l'utilisateur. Le calcul des harmoniques sphériques Y₀₀(θ_si,ϕ_si), Y_1-1(θ_si,ϕ_si) Y₁₀(θ_si,ϕ_si), Y₁₁(θ_si,ϕ_si), ..., Y_MM(θ_si,ϕ_si), de l'onde sonore à l'ordre M peut s'effectuer selon les méthodes connues de l'état de l'art, à partir des angles (θ_si,ϕ_si) définissant l'orientation de la source de l'onde sonore.

[0082] La logique 430 est également configurée pour calculer, à partir de la position de la source de l'onde sonore, un ensemble d'harmoniques sphériques de la pluralité de réflexions. Dans un ensemble de modes de réalisation de l'invention, la logique 430 est configurée pour calculer, à partir de la position de la source de l'onde sonore, et de positions d'obstacles à la propagation de l'onde sonore, une orientation d'une source virtuelle d'une réflexion, définie par des angles (θ_s,r,ϕ_s,r) puis, à partir de ces angles, des harmoniques sphériques Y₀₀(θ_s,r,ϕ_s,r), Y_1-1(θ_s,r,ϕ_s,r), Y₁₀(θ_s,r,ϕ_s,r), Y₁₁(θ_s,r,ϕ_s,r), ..., Y_MM(θ_s,r,ϕ_s,r) de la réflexion de l'onde sonore. Ceci permet d'obtenir, pour chaque réflexion, les harmoniques sphériques correspondant à la direction de l'onde réfléchie sur les obstacles à la propagation de l'onde sonore.

[0083] L'encodeur ambisonique 400 comprend également une pluralité 440 de logiques de filtrage dans le domaine fréquentiel recevant en entrée des harmoniques sphériques de la pluralité de réflexions, chaque logique de filtrage étant paramétrée par des coefficients acoustiques et de délai des réflexions. Dans la suite de la description, on appellera α_r un coefficient acoustique d'une réflexion et δ_r un délai d'une réflexion. Selon différents modes de réalisation de l'invention, le coefficient acoustique peut être un coefficient de α_r réverbération, représentatif d'un rapport des intensités d'une réflexion sur des intensités de la source sonore et défini entre 0 et 1. Selon d'autres modes de réalisation de l'invention, le coefficient acoustique est un coefficient α_a dit d'atténuation ou d'absorption, soit un coefficient défini entre 0 et 1 tel que α_a = α_r - 1. Ces logiques de filtrage permettent d'appliquer aux coefficients ambisoniques d'une réflexion un délai et une atténuation. Ainsi, la combinaison de l'orientation de la source virtuelle de la réflexion, du délai et de l'atténuation de la réflexion permet de modéliser chaque réflexion comme une réplique de la source sonore, venant d'une direction différente, affectée d'un délai et atténuée, suite au parcours et aux réflexions de l'onde sonore. Cette modélisation permet, avec plusieurs réflexions de simuler la propagation d'une onde sonore dans une scène de manière simple et efficace.

[0084] De manière générale, le filtrage, à une fréquence f, d'une harmonique sphérique d'une réflexion peut s'écrire : H_r(f) Y_ij(θ_s,r,ϕ_s,r). Dans un mode de réalisation de l'invention une logique de filtrage 440 est configurée pour filtrer les harmoniques sphériques en appliquant: α_re^-j2^πδrY_ij(θ_s,r,ϕ_s,r). Dans ce mode de réalisation, le coefficient α_r est traité comme un coefficient de réverbération. Dans d'autres modes de réalisation, un coefficient α_a peut être traité comme un coefficient d'atténuation, et le filtrage des harmoniques sphériques peut par exemple s'effectuer en appliquant: (1 - α_a)e^-j2^πfδrY_ij(θ_s,r,ϕ_s,r). Dans la suite de la description, on considèrera sauf mention contraire le coefficient α_r comme un coefficient de réverbération. Un homme de l'art pourra cependant aisément mettre en œuvre les différents modes de réalisation de l'invention avec un coefficient d'atténuation plutôt qu'un coefficient de réverbération.

[0085] L'encodeur ambisonique 400 comprend également une logique 450 d'addition des harmoniques sphériques de l'onde sonore et des sorties des logiques de filtrage. Cette logique permet d'obtenir un ensemble Y'₀₀, Y'_1-1, Y'₁₀, Y'₁₁, ... Y'_MM d'harmoniques sphériques à l'ordre M, représentatives à la fois de l'onde sonore, et des réflexions de l'onde sonore, dans le domaine fréquentiel. Un harmonique sphérique Y'_ij (avec 0 ≤ i ≤ M, et -i ≤ j ≤ i) représentative à la fois de l'onde sonore, et des réflexions de l'onde sonore, est donc égale, en sortie de la logique d'addition 450, à la valeur

dans laquelle Y_ij(θ_si,ϕ_si) est une harmonique sphérique de la source de l'onde sonore, N_r est le nombre de réflexions de l'onde sonore, Y_ij(θ_s,r,ϕ_s,r) sont les harmoniques sphériques des positions des sources sonores virtuelles des réflexions, et les termes H_r(f) sont les logiques de filtrage des harmoniques sphériques pour la réflexion r à une fréquence f. Dans un ensemble de modes de réalisation de l'invention, les logiques de filtrage H_r(f) sont telles que H_r(f) = α_re^-j2πfδ_r, et les harmoniques sphériques Y_ij à l'ordre M, représentatives à la fois de l'onde sonore, et des réflexions de l'onde sonore sont égales, en sortie de la logique 450 d'addition, à:

[0086] Selon différents modes de réalisation de l'invention, le nombre N_r de réflexions peut être prédéfini. Selon d'autres modes de réalisation de l'invention, les réflexions de l'onde sonore sont conservées selon leur coefficient acoustique, le nombre Nr de réflexions dépendant alors de la position de la source sonore, de la position de l'utilisateur, et des obstacles à la propagation du son. Dans l'exemple ci-dessus, le coefficient acoustique est défini comme un ratio de l'intensité de la réflexion sur l'intensité de la source sonore, soit un coefficient de réverbération. Dans un mode de réalisation de l'invention, les réflexions de l'onde sonore ayant un coefficient acoustique supérieur ou égal à un seuil prédéfini sont conservées. Dans d'autres modes de réalisation, le coefficient acoustique est défini comme un coefficient d'atténuation, soit un ratio entre l'intensité sonore absorbée par les obstacles à la propagation d'ondes sonores et le trajet dans l'air et l'intensité de la source sonore. Dans ce mode de réalisation, les réflexions de l'onde sonore ayant un coefficient acoustique inférieur ou égal à un seuil prédéfini sont conservées

[0087] Ainsi, l'encodeur ambisonique 400 permet de calculer un ensemble d'harmoniques sphériques Y'_ij représentatives à la fois de l'onde sonore et de ses réflexions. Une fois ces harmoniques sphériques calculées, l'encodeur peut comprendre une logique de multiplication des harmoniques sphériques par les valeurs d'intensités sonores de la source aux différentes fréquences, afin d'obtenir des coefficients ambisoniques représentatifs à la fois de l'onde sonore et des réflexions. Dans des modes de réalisation à plusieurs sources sonores, l'encodeur 400 comprend une logique d'addition des coefficients ambisoniques des différentes sources sonores et de leurs réflexions, permettant d'obtenir en sortie des coefficients ambisoniques représentatifs de l'ensemble de la scène sonore.

[0088] Dans un ensemble de modes de réalisation de l'invention, les coefficients ambisoniques à l'ordre M représentatifs de la scène sonore sont alors égaux, en sortie de la logique d'addition des coefficients ambisoniques des différentes sources sonores et de leurs réflexions, pour Ns sources sonores et pour une fréquence f, à :

[0089] L'utilisation d'un unique coefficient ambisonique Y'_ij représentatif à la fois de l'onde sonore et de ses réflexions permet de réduire de manière importante les opérations de calcul permettant d'obtenir les coefficients ambisoniques, surtout lorsque le nombre de réflexions est élevé. En effet, ceci permet de réduire le nombre de multiplications, puisqu'il n'est plus nécessaire de multiplier chacune des intensités S_i(f) d'une source pour chaque fréquence par chacune des harmoniques sphériques Y_ij(θ_s,r,ϕ_s,r), pour chaque valeur de i telle que 0 ≤ i ≤ M, chaque valeur de j telle que -i ≤ j ≤ i, et chaque réflexion. Cette réduction du nombre de multiplications permet une réduction importante de la complexité de calcul, particulièrement dans le cas d'un nombre de réflexions élevé.

[0090] Dans un ensemble de modes de réalisation de l'invention, la logique 430 de calcul d'harmoniques sphériques de l'onde sonore est configurée pour calculer les harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir d'une position fixe de la source de l'onde sonore. Dans ce cas, les orientations (θ_si,ϕ_si) de la source sonore, et les orientations (θ_s,r,ϕ_s,r) de chacune des harmoniques sont constantes. Les harmoniques sphériques de l'onde sonore et de la pluralité de réflexions ont alors également une valeur constante, et peuvent être calculées une unique fois pour l'onde sonore.

[0091] Dans d'autres modes de réalisation de l'invention, la logique 430 de calcul d'harmoniques sphériques de l'onde sonore est configurée pour calculer de manière itérative les harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir de positions successives de la source de l'onde sonore. Selon différents modes de réalisation de l'invention, différentes possibilités existent pour définir les itérations de calcul. Dans un mode de réalisation de l'invention, la logique 430 est configurée pour recalculer les valeurs des harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à chaque fois qu'un changement de la position de la source de l'onde sonore ou de la position de l'utilisateur est détecté. Dans un autre mode de réalisation de l'invention, la logique 430 est configurée pour recalculer les valeurs des harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à intervalles réguliers, par exemple toutes les 10 ms. Dans un autre mode de réalisation de l'invention, la logique 430 est configurée pour recalculer les valeurs des harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à chacune des fenêtres temporelles utilisées par la logique 420 de transformation fréquentielle de l'onde sonore pour convertir les échantillons temporels de l'onde sonore en échantillons fréquentiels.

[0092] Dans un ensemble de modes de réalisation de l'invention, chaque réflexion est caractérisée par un unique coefficient acoustique α_r.

[0093] Dans d'autres modes de réalisation de l'invention, chaque réflexion est caractérisée par un coefficient acoustique pour chaque fréquence dudit échantillonnage fréquentiel. Ceci permet d'obtenir des coefficients acoustiques différents pour les différentes fréquences, et d'améliorer le rendu de certains effets. Par exemple, il est connu que les matériaux épais absorbent de manière plus importante les basses fréquences. De même certains types de matériaux absorbent et réfléchissent de manière différente les hautes fréquences. Ainsi, la définition de coefficients acoustiques différents pour une même réflexion et différentes fréquences permet de caractériser les matériaux rencontrés par les réflexions, permettant un meilleur rendu de différents types de salle, en fonction des matériaux des murs de celle-ci.

[0094] Dans un ensemble de modes de réalisation de l'invention, une réflexion à une fréquence peut être considérée comme nulle, en fonction d'une comparaison entre le coefficient acoustique α_r pour cette fréquence et un seuil prédéfini. Par exemple, si le coefficient α_r représente un coefficient de réverbération, la fréquence est considérée comme nulle s'il est inférieur à un seuil prédéfini. Au contraire, s'il s'agit d'un coefficient d'atténuation, la fréquence est considérée comme nulle s'il est supérieur ou égal à un seuil prédéfini. Ceci permet de limiter encore le nombre de multiplications, et donc la complexité de l'encodage ambisonique, tout en ayant un impact minime sur le rendu binaural.

[0095] Dans un ensemble de modes de réalisation de l'invention, l'encodeur ambisonique 400 comprend une logique de calcul des coefficients acoustiques et des délais, et de la position de la source sonore virtuelle des réflexions. Cette logique de calcul peut par exemple être configurée pour calculer les coefficients acoustiques et les délais des réflexions en fonction d'estimations d'une différence de distance parcourue par le son entre la position de la source de l'onde sonore et une position estimée d'un utilisateur d'une part, et la distance parcourue par le son entre les positions des sources sonores virtuelles des réflexions et la position estimée de l'utilisateur d'autre part. Il est en effet aisé, connaissant la différence de distance parcourue par le l'onde sonore par parvenir à l'utilisateur, en ligne droite depuis la source sonore d'une part, et par le biais d'une réflexion d'autre part, et connaissant la célérité du son, de déduire le délai ressenti par l'utilisateur entre le son issu de la source sonore en ligne droite d'une part, et le son ayant été affecté par la réflexion d'autre part.

[0096] De la même manière, il est connu que l'intensité d'une onde sonore diminue au fur et à mesure de son parcours dans l'air. La logique de calcul des coefficients acoustiques et des délais, et de la position de la source sonore virtuelle des réflexions peut donc être configurée pour calculer un coefficient acoustique d'une réflexion de l'onde sonore en fonction de la différence de distance parcourue entre le son issu de la source sonore en ligne droite d'une part, et le son ayant été affecté par la réflexion d'autre part.

[0097] Dans d'autres modes de réalisation de l'invention, la logique de calcul des coefficients acoustiques et des délais, et de la position de la source sonore virtuelle des réflexions est également configurée pour calculer les coefficients acoustiques des réflexions en fonction d'un coefficient acoustique d'au moins un obstacle à la propagation d'ondes sonores, sur lequel le son est réfléchi. Ceci permet de mieux modéliser l'absorption par les matériaux d'une salle, et le coefficient acoustique de l'obstacle peut être variable selon les différentes fréquences. Le coefficient acoustique de l'obstacle peut être un coefficient de réverbération ou un coefficient d'atténuation.

[0098] La figure 5 représente un exemple de calcul d'une source sonore secondaire, dans un mode de mise en œuvre de l'invention.

[0099] Dans cet exemple une source de l'onde sonore a une position 520 dans une pièce 510, et l'utilisateur a une position 540. La pièce 510 est constituée de 4 murs 511, 512, 513 et 514.

[0100] Dans un ensemble de modes de mise en œuvre de l'invention, la logique de calcul des coefficients acoustiques et des délais, et de la position de la source sonore virtuelle des réflexions est configurée pour calculer les position, délai et atténuation des sources sonores virtuelles des réflexions de la manière suivante : pour chacun des murs 511, 512, 513, 514, la logique est configurée pour calculer une position d'une source sonore virtuelle d'une réflexion comme le symétrique de la position de la source sonore par rapport à un mur. La logique de calcul est ainsi configurée pour calculer les positions 521, 522, 523 et 524 de quatre sources sonores virtuelles des réflexions, respectivement par rapport aux murs 511, 512, 513 et 514.

[0101] Pour chacune de ces sources sonores virtuelles, la logique de calcul est configurée pour calculer un chemin de parcours de l'onde sonore, et en déduire le coefficient acoustique et le délai correspondants. Par exemple, dans le cas de la source sonore virtuelle 511, l'onde sonore suit le trajet 530 jusqu'au point 531 du mur 512, puis le chemin 532 jusqu'à la position de l'utilisateur 540. La distance parcourue par le son selon le chemin 530, 532 permet de calculer un coefficient acoustique et un délai de la réflexion. Dans un ensemble de modes de réalisation de l'invention la logique de calcul est également configurée pour appliquer un coefficient acoustique correspondant à l'absorption du mur 512 au point 531. Dans un ensemble de modes de réalisation de l'invention, ce coefficient dépend des différentes fréquences, et peut par exemple être déterminé, pour chaque fréquence, en fonction du matériau et/ou de l'épaisseur du mur 512.

[0102] Dans un ensemble de modes de réalisation de l'invention, les sources sonores virtuelles 521, 522, 523, 524 sont utilisées pour calculer des sources sonores virtuelles secondaires, correspondant à des réflexions multiples. Par exemple, une source virtuelle secondaire 533 peut être calculée comme le symétrique de la source virtuelle 521 par rapport au mur 514. Le chemin de l'onde sonore correspondant comprend alors les segments 530 jusqu'au point 531 ; 534 entre les points 531 et 535 ; 536 entre le point 535 et la position 540 de l'utilisateur. Les coefficients acoustiques et les délais peuvent alors être calculés à partir de la distance parcourue par le son sur les segments 531, 535 et 536, et de l'absorption des murs aux points 531 et 535.

[0103] Selon différents modes de réalisation de l'invention, des sources sonores virtuelles correspondant à des réflexions peuvent être calculées jusqu'à un ordre n prédéfini. Différents modes de réalisation sont possibles pour déterminer les réflexions à conserver. Dans un mode de réalisation de l'invention, la logique de calcul est configurée pour calculer, pour chaque source sonore virtuelle, une source sonore virtuelle d'ordre supérieur pour chacun des murs, jusqu'à un ordre prédéfini n. Dans un mode de réalisation, l'encodeur ambisonique est configuré pour traiter un nombre Nr prédéfini de réflexions par source sonore, et conserve les Nr réflexions ayant l'atténuation la plus faible. Dans un autre mode de réalisation de l'invention, les sources sonores virtuelles sont conservées sur la base d'une comparaison d'un coefficient acoustique avec un seuil prédéfini.

[0104] La figure 6 représente un exemple de calcul de réflexions précoces et de réflexions tardives, dans un mode de réalisation de l'invention.

[0105] Le diagramme 600 représente l'intensité de plusieurs réflexions de l'onde sonore, par rapport au temps. L'axe 601 représente l'intensité d'une réflexion, et l'axe 602 le délai entre l'émission de l'onde sonore par la source de l'onde sonore, et la perception d'une réflexion par l'utilisateur. Dans cet exemple, les réflexions survenant avant un délai prédéfini 603 sont considérées comme des réflexions précoces 610, et les réflexions survenant après le délai 603 comme des réflexions tardives 620. Dans un mode de réalisation de l'invention, les réflexions précoces sont calculées à l'aide d'une source sonore virtuelle, par exemple selon le principe décrit en référence à la figure 5.

[0106] Selon différents modes de réalisation de l'invention, les réflexions tardives sont calculées de la manière suivante: un ensemble de Nt sources sonores secondaires est calculée, par exemple selon le principe décrit en figure 5. La logique de calcul des coefficients acoustiques et des délais, et de la position de la source sonore virtuelle des réflexions est configurée pour conserver un nombre Nr de réflexions inférieur à Nt, selon différents modes de réalisation décrits ci-dessus. Dans un ensemble de modes de réalisation de l'invention, elle est de plus configurée pour construire une liste de (Nt - Nr) réflexions tardives, comprenant toutes les réflexions non conservées. Cette liste comprend uniquement, pour chaque réflexion tardive, un coefficient acoustique et un délai de la réflexion tardive, mais pas de position d'une source virtuelle.

[0107] Selon un mode de réalisation de l'invention, cette liste est transmise par l'encodeur ambisonique à un décodeur ambisonique. Le décodeur ambisonique est alors configuré pour filtrer ses sorties, par exemple ses canaux stéréo de sortie, avec les coefficients acoustiques et les délais des réflexions tardives, puis à ajouter ces signaux filtrés aux signaux de sortie. Ceci permet d'améliorer la sensation d'immersion dans une salle ou un environnement d'écoute, tout en limitant encore la complexité de calcul de l'encodeur.

[0108] Selon un autre mode de réalisation de l'invention, l'encodeur ambisonique est configuré pour filtrer l'onde sonore avec les coefficients acoustiques et les délais des réflexions tardives, et ajouter les signaux obtenus de manière uniforme à l'ensemble des coefficients ambisoniques. Ceci permet d'obtenir, avec une complexité de calcul limitée, un effet représentatif de multiples réflexions dans un environnement sonore. Dans ce mode de réalisation de l'invention, comme dans le précédent, les réflexions tardives ont une intensité faible et n'ont pas d'information de direction d'une source sonore. Elles seront donc perçues par un utilisateur comme un « écho » de l'onde sonore, réparti de manière homogène dans la scène sonore, et représentatif d'un environnement d'écoute.

[0109] Le calcul des coefficients acoustiques et délais des réflexions tardives induit le calcul de nombreuses réflexions. Il s'agit donc d'une opération relativement coûteuse en termes de complexité de calcul. Selon un mode de réalisation de l'invention, ce calcul est effectué une seule fois, par exemple à l'initialisation de la scène sonore, et les coefficients acoustiques et les délais des réflexions tardives sont réutilisés sans modification par l'encodeur ambisonique. Ceci permet d'obtenir des réflexions tardives représentatives de l'environnement d'écoute à moindre coût. Selon d'autres modes de réalisation de l'invention, ce calcul est effectué de manière itérative. Par exemple, ces coefficients acoustiques et délais des réflexions tardives peuvent être calculés à des intervalles de temps prédéfinis, par exemple toutes les 5 secondes. Ceci permet de conserver en permanence des coefficients acoustiques et délais des réflexions tardives représentatifs de la scène sonore, et des positions relatives d'une source de l'onde sonore et de l'utilisateur, tout en limitant la complexité de calcul liée à la détermination des réflexions tardives.

[0110] Dans d'autres modes de réalisation de l'invention, les coefficients acoustiques et délais des réflexions tardives sont calculés lorsque la position d'une source de l'onde sonore ou de l'utilisateur varie de manière significative, par exemple lorsque la différence entre la position de l'utilisateur et une position précédente de l'utilisateur lors d'un calcul des coefficients acoustiques et délais des réflexions tardives représentatifs de la scène sonore est supérieure à un seuil prédéfini. Ceci permet de ne calculer les coefficients acoustiques et délais des réflexions tardives représentatifs de la scène sonore que lorsque la position d'une source de l'onde sonore ou de l'utilisateur a suffisamment varié pour modifier de manière perceptible les réflexions tardives.

[0111] La figure 7 représente une méthode d'encodage d'une onde sonore à une pluralité de réflexions dans un ensemble de modes de mise en œuvre de l'invention.

[0112] La méthode 700 comprend une étape 710 de transformation fréquentielle de l'onde sonore.

[0113] Elle comprend ensuite une étape 720 de calcul d'harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir d'une position d'une source de l'onde sonore et de positions d'obstacles à la propagation d'ondes sonores.

[0114] Elle comprend ensuite une étape 730 de filtrage, par une pluralité de logiques de filtrage dans le domaine fréquentiel, des harmoniques sphériques de la pluralité de réflexions, chaque logique de filtrage étant paramétrée par des coefficients acoustiques et des délais des réflexions.

[0115] Elle comprend ensuite une étape 740 d'addition d'harmoniques sphériques de l'onde sonore et des sorties des logiques de filtrage.

[0116] Les exemples ci-dessus démontrent la capacité d'un encodeur ambisonique selon l'invention à calculer des coefficients ambisoniques d'une onde sonore à une pluralité de réflexions. Ils ne sont cependant donnés qu'à titre d'exemple et ne limitent en aucun cas la portée de l'invention, définie dans les revendications ci-dessous.

Revendications

1. Encodeur ambisonique (400) d'onde sonore (410) à pluralité de réflexions, comprenant :

- Une logique (420) de transformation fréquentielle de l'onde sonore ;

- Une logique (430) de calcul d'harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir d'une position d'une source de l'onde sonore et de positions d'obstacles à une propagation de l'onde sonore ;

- une pluralité (440) de logiques de filtrage dans le domaine fréquentiel recevant en entrée des harmoniques sphériques de la pluralité de réflexions, chaque logique de filtrage consistant en une atténuation et un délai d'une réflexion, et étant paramétrée par un coefficient acoustique et un délai de ladite réflexion ;

- Une logique (450) d'addition d'harmoniques sphériques de l'onde sonore et des sorties des logiques de filtrage, en un ensemble d'harmoniques sphériques représentatives à la fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel ;

- Une logique de multiplication dudit ensemble d'harmoniques sphériques représentatives à la fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel par des valeurs d'intensité sonores de l'onde en sortie de la transformation fréquentielle, afin d'obtenir un ensemble de coefficients ambisoniques (B₀₀,B_1-1,B₁₀,B₁₁,...,B_MM) représentatifs à la fois de l'onde sonore et de la pluralité de réflexions.

2. Encodeur ambisonique selon la revendication 1, dans lequel la logique de calcul d'harmoniques sphériques de l'onde sonore est configurée pour calculer les harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir d'une position fixe de la source de l'onde sonore.

3. Encodeur ambisonique selon la revendication 1, dans lequel la logique de calcul d'harmoniques sphériques de l'onde sonore est configurée pour calculer de manière itérative les harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir de positions successives de la source de l'onde sonore.

4. Encodeur ambisonique selon l'une des revendications 1 à 3, dans lequel chaque réflexion est caractérisée par un unique coefficient acoustique.

5. Encodeur ambisonique selon l'une des revendications 1 à 3, dans lequel chaque réflexion est caractérisée par un coefficient acoustique pour chaque fréquence dudit échantillonnage fréquentiel.

6. Encodeur ambisonique selon l'une des revendications 1 à 5, dans lequel les réflexions sont représentées par des sources sonores virtuelles.

7. Encodeur ambisonique selon l'une des revendications 1 à 5, comprenant en outre une logique de calcul des coefficients acoustiques, des délais et de la position de des sources sonores virtuelles des réflexions, ladite logique de calcul étant configurée pour calculer les coefficients acoustiques et les délais des réflexions en fonction d'estimations d'une différence de distance parcourue par le son entre la position de la source de l'onde sonore et une position estimée d'un utilisateur d'une part, et d'une distance parcourue par le son entre les positions des sources sonores virtuelles des réflexions et la position estimée de l'utilisateur d'autre part.

8. Encodeur ambisonique selon la revendication 7, dans lequel la logique de calcul des coefficients acoustiques, des délais et des positions des sources sonores virtuelles des réflexions, est en outre configurée pour calculer les coefficients acoustiques des réflexions en fonction d'au moins un coefficient acoustique d'au moins un obstacle à la propagation d'ondes sonores, sur lequel le son est réfléchi.

9. Encodeur ambisonique selon l'une des revendications 7 à 8, dans lequel la logique de calcul des coefficients acoustiques, des délais et des positions des sources sonores virtuelles des réflexions est configurée pour calculer des positions de sources sonores virtuelles des réflexions comme des symétriques de la position de la source de l'onde sonore par rapport à un plan tangent à un obstacle à la propagation d'ondes sonores.

10. Encodeur ambisonique selon l'une des revendications 1 à 9, dans lequel la logique de calcul d'harmoniques sphériques de l'onde sonore et de la pluralité de réflexions est en outre configurée pour calculer des harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à chaque fréquence de sortie du circuit de transformation fréquentielle, ledit encodeur ambisonique comprenant en outre une logique de calcul de coefficients binauraux de l'onde sonore, configurée pour calculer des coefficient binauraux de l'onde sonore en multipliant à chaque fréquence de sortie du circuit de transformation fréquentielle de l'onde sonore le signal de l'onde sonore par les harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à cette fréquence.

11. Encodeur ambisonique selon l'une des revendications 7 à 9, dans lequel la logique de calcul des coefficients acoustiques, des délais et des positions des sources sonores virtuelles des réflexions est configurée pour calculer des coefficients acoustiques et des délais d'une pluralité de réflexions tardives.

12. Méthode d'encodage ambisonique d'onde sonore à pluralité de réflexions, comprenant :

- une transformation fréquentielle (710) de l'onde sonore ;

- un calcul (720) d'harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir d'une position d'une source de l'onde sonore et de positions d'obstacles à une propagation d'ondes sonores ;

- un filtrage (730), par une pluralité de logiques de filtrage dans le domaine fréquentiel, des harmoniques sphériques de la pluralité de réflexions, chaque logique de filtrage consistant en une atténuation et un délai d'une réflexion, et étant paramétrée par un coefficient acoustique et un délai d'une réflexion;

- une addition (740) d'harmoniques sphériques de l'onde sonore et des sorties des logiques de filtrage, en un ensemble d'harmoniques sphériques représentatives à la fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel

- une multiplication dudit ensemble d'harmoniques sphériques représentatives à la fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel par des valeurs d'intensité sonores de l'onde en sortie de la transformation fréquentielle, afin d'obtenir un ensemble de coefficients ambisoniques (B₀₀,B_1-1,B₁₀,B₁₁,...,B_MM) représentatifs à la fois de l'onde sonore et de la pluralité de réflexions.

13. Produit programme d'ordinateur comprenant des instructions de code de programme enregistrées sur un support lisible par ordinateur pour l'encodage ambisonique d'onde sonore à pluralité de réflexions, lesdites instructions de code de programme étant configurées pour :

- effectuer une transformation fréquentielle de l'onde sonore ;

- calculer des harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir d'une position d'une source de l'onde sonore et de positions d'obstacles à une propagation de l'onde sonore ;

- paramétrer une pluralité de logiques de filtrage dans le domaine fréquentiel recevant en entrée des harmoniques sphériques de la pluralité de réflexions, chaque logique de filtrage consistant en une atténuation et un délai d'une réflexion, et étant paramétrée par un coefficient acoustique et un délai de ladite réflexion ;

- additionner des harmoniques sphériques de l'onde sonore et des sorties des logiques de filtrage, en un ensemble d'harmoniques sphériques représentatives à la fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel ;

- multiplier ledit ensemble d'harmoniques sphériques représentatives à la fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel par des valeurs d'intensité sonores de l'onde en sortie de la transformation fréquentielle, afin d'obtenir un ensemble de coefficients ambisoniques (B₀₀,B_1-1,B₁₀,B₁₁,...,B_MM) représentatifs à la fois de l'onde sonore et de la pluralité de réflexions ;
lorsque ledit programme fonctionne sur un ordinateur.

Ansprüche

1. Ambisonic-Encoder (400) für eine Schallwelle (410) mit einer Mehrzahl von Reflexionen, der Folgendes umfasst:

- eine Logik (420) zum Frequenztransformieren der Schallwelle;

- eine Logik (430) zum Berechnen von sphärischen Harmonischen der Schallwelle und der Mehrzahl von Reflexionen auf der Basis einer Position einer Quelle der Schallwelle und von Positionen von Hindernissen für eine Ausbreitung der Schallwelle;

- eine Mehrzahl (440) von Filterlogiken in der Frequenzdomäne, die am Eingang sphärische Harmonische der Mehrzahl von Reflexionen empfangen, wobei jede Filterlogik aus einer Dämpfung und einer Verzögerung einer Reflexion besteht und durch einen akustischen Koeffizienten und eine Verzögerung der Reflexion parametrisiert ist;

- Logik (450) zum Summieren von sphärischen Harmonischen der Schallwelle und der Ausgänge der Filterlogiken zu einem Satz von sphärischen Harmonischen, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen in der Frequenzdomäne repräsentativ sind;

- eine Logik zum Multiplizieren des Satzes von sphärischen Harmonischen, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen in der Frequenzdomäne repräsentativ sind, mit Schallintensitätswerten der Welle am Ausgang der Frequenztransformation, um einen Satz von ambisonischen Koeffizienten (B₀₀,B_1-1,B₁₀,B₁₁,...,B_MM) zu erhalten, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen repräsentativ sind.

2. Ambisonic-Encoder nach Anspruch 1, wobei die Logik zum Berechnen der sphärischen Harmonischen der Schallwelle zum Berechnen der sphärischen Harmonischen der Schallwelle und der Mehrzahl von Reflexionen auf der Basis einer festen Position der Quelle der Schallwelle konfiguriert ist.

3. Ambisonic-Encoder nach Anspruch 1, wobei die Logik zum Berechnen von sphärischen Harmonischen der Schallwelle zum iterativen Berechnen der sphärischen Harmonischen der Schallwelle und der Mehrzahl von Reflexionen auf der Basis von aufeinanderfolgenden Positionen der Quelle der Schallwelle konfiguriert ist.

4. Ambisonic-Encoder nach einem der Ansprüche 1 bis 3, wobei jede Reflexion durch einen einzelnen akustischen Koeffizienten gekennzeichnet ist.

5. Ambisonic-Encoder nach einem der Ansprüche 1 bis 3, wobei jede Reflexion durch einen akustischen Koeffizienten für jede Frequenz der Frequenzabtastung gekennzeichnet ist.

6. Ambisonic-Encoder nach einem der Ansprüche 1 bis 5, wobei die Reflexionen durch virtuelle Schallquellen dargestellt werden.

7. Ambisonic-Encoder nach einem der Ansprüche 1 bis 5, der ferner eine Logik zum Berechnen von akustischen Koeffizienten, Verzögerungen und der Position der virtuellen Schallquellen der Reflexionen umfasst, wobei die Berechnungslogik zum Berechnen der akustischen Koeffizienten und der Verzögerungen von den Reflexionen als eine Funktion von Schätzungen einer Differenz zwischen der Schalllaufstrecke zwischen der Position der Quelle der Schallwelle und einer geschätzten Position eines Benutzers einerseits und einer Schalllaufstrecke zwischen den Positionen der virtuellen Schallquellen der Reflexionen und der geschätzten Position des Benutzers andererseits konfiguriert ist.

8. Ambisonic-Encoder nach Anspruch 7, wobei die Logik zum Berechnen von akustischen Koeffizienten, Verzögerungen und Positionen der virtuellen Schallquellen von Reflexionen ferner zum Berechnen der akustischen Koeffizienten von Reflexionen als eine Funktion von mindestens einem akustischen Koeffizienten von mindestens einem Hindernis für die Schallwellenausbreitung, an dem der Schall reflektiert wird, konfiguriert ist.

9. Ambisonic-Encoder nach einem der Ansprüche 7 bis 8, wobei die Logik zur Berechnung von akustischen Koeffizienten, Verzögerungen und Positionen von virtuellen Schallquellen von Reflexionen zum Berechnen der Positionen von virtuellen Schallquellen von Reflexionen als Symmetrien der Position der Quelle der Schallwelle in Bezug auf eine Ebene, die ein Hindernis für die Schallwellenausbreitung tangiert, konfiguriert ist.

10. Ambisonic-Encoder nach einem der Ansprüche 1 bis 9, wobei die Logik zum Berechnen von sphärischen Harmonischen der Schallwelle und der Mehrzahl von Reflexionen ferner zum Berechnen von sphärischen Harmonischen der Schallwelle und der Mehrzahl von Reflexionen bei jeder Ausgangsfrequenz der Frequenztransformationsschaltung konfiguriert ist, wobei der Ambisonic-Encoder ferner eine Logik zum Berechnen von binauralen Koeffizienten der Schallwelle umfasst, die zum Berechnen von binauralen Koeffizienten der Schallwelle durch Multiplizieren, bei jeder Ausgangsfrequenz der Frequenztransformationsschaltung der Schallwelle, des Schallwellensignals mit den sphärischen Harmonischen der Schallwelle und den Mehrzahl von Reflexionen bei dieser Frequenz konfiguriert ist.

11. Ambisonic-Encoder nach einem der Ansprüche 7 bis 9, wobei die Logik zum Berechnen von akustischen Koeffizienten, Verzögerungen und Positionen von den virtuellen Schallquellen von den Reflexionen zum Berechnen von akustischen Koeffizienten und Verzögerungen einer Mehrzahl von späteren Reflexionen konfiguriert ist.

12. Verfahren zur ambisonischen Encodierung einer Schallwelle mit einer Mehrzahl von Reflexionen, das Folgendes umfasst:

- Frequenztransformieren (710) der Schallwelle;

- Berechnen (720) von sphärischen Harmonischen der Schallwelle und der Mehrzahl von Reflexionen auf der Basis einer Position einer Quelle der Schallwelle und von Positionen von Hindernissen für eine Schallwellenausbreitung;

- Filtern (730), durch eine Mehrzahl von Filterlogiken in der Frequenzdomäne, der sphärischen Harmonischen der Mehrzahl von Reflexionen, wobei jede Filterlogik aus einer Dämpfung und einer Verzögerung einer Reflexion besteht und durch einen akustischen Koeffizienten und eine Verzögerung einer Reflexion parametrisiert wird;

- Addieren (740) von sphärischen Harmonischen der Schallwelle und der Ausgänge der Filterlogiken zu einem Satz von sphärischen Harmonischen, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen in der Frequenzdomäne repräsentativ sind;

- Multiplizieren des Satzes von sphärischen Harmonischen, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen in der Frequenzdomäne repräsentativ sind, mit Schallintensitätswerten der Welle am Ausgang der Frequenztransformation, um einen Satz von ambisonischen Koeffizienten (B₀₀,B_1-1,B₁₀,B₁₁,...,B_MM) zu erhalten, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen repräsentativ sind.

13. Computerprogrammprodukt mit auf einem computerlesbaren Medium gespeicherten Programmcode-Befehlen zum ambisonischen Encodieren von Schallwellen mit einer Mehrzahl von Reflexionen, wobei die Programmcode-Befehle konfiguriert sind zum:

- Bewirken einer Frequenztransformation der Schallwelle;

- Berechnen von sphärischen Harmonischen der Schallwelle und der Mehrzahl von Reflexionen auf der Basis einer Position einer Quelle der Schallwelle und von Positionen von Hindernissen für eine Schallwellenausbreitung;

- Parametrisieren einer Mehrzahl von Filterlogiken in der Frequenzdomäne, die am Eingang sphärische Harmonische der Mehrzahl von Reflexionen empfangen, wobei jede Filterlogik aus einer Dämpfung und einer Verzögerung einer Reflexion besteht und durch einen akustischen Koeffizienten und eine Verzögerung der Reflexion parametrisiert wird;

- Summieren der sphärischen Harmonischen der Schallwelle und Ausgänge der Filterlogiken zu einem Satz von sphärischen Harmonischen, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen in der Frequenzdomäne repräsentativ sind;

- Multiplizieren des Satzes von sphärischen Harmonischen, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen in der Frequenzdomäne repräsentativ sind, mit Schallintensitätswerten der Welle am Ausgang der Frequenztransformation, um einen Satz von ambisonischen Koeffizienten (B₀₀,B_1-1, B₁₀, B₁₁,...,B_MM) zu erhalten, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen repräsentativ sind;
wenn das Programm auf einem Computer läuft.

Claims

1. An ambisonic encoder (400) for a sound wave (410) having a plurality of reflections, comprising:

- a logic (420) for frequency transformation of the sound wave;

- a logic (430) for calculating spherical harmonics of the sound wave and of the plurality of reflections on the basis of a position of a source of the sound wave and of positions of obstacles to propagation of the sound wave;

- a plurality (440) of filtering logics in the frequency domain receiving, as input, spherical harmonics of the plurality of reflections, each filtering logic consisting of an attenuation and a delay of a reflection, and being parameterized by an acoustic coefficient and a delay of said reflection;

- a logic (450) of adding spherical harmonics of the sound wave and outputs from the filtering logics into a set of spherical harmonics representative of both the sound wave and the plurality of reflections in the frequency domain;

- a multiplication logic of said set of spherical harmonics representative of both the sound wave and the plurality of reflections in the frequency domain by sound intensity values of the wave at the output of the frequency transformation to obtain a set of ambisonic coefficients (B₀₀, B_1-1, B₁₀, B₁₁, ..., B_MM) representative of both the sound wave and the plurality of reflections.

2. The ambisonic encoder according to claim 1, wherein the logic for calculating spherical harmonics of the sound wave is configured to calculate the spherical harmonics of the sound wave and of the plurality of reflections on the basis of a fixed position of the source of the sound wave.

3. The ambisonic encoder according to claim 1, wherein the logic for calculating spherical harmonics of the sound wave is configured to iteratively calculate the spherical harmonics of the sound wave and of the plurality of reflections on the basis of successive positions of the source of the sound wave.

4. The ambisonic encoder according to one of claims 1 to 3, wherein each reflection is characterized by a unique acoustic coefficient.

5. The ambisonic encoder according to one of claims 1 to 3, wherein each reflection is characterized by an acoustic coefficient for each frequency of the frequency sampling.

6. The ambisonic encoder according to one of claims 1 to 5, wherein the reflections are represented by virtual sound sources.

7. The ambisonic encoder according to one of claims 1 to 5, further comprising a logic for calculating the acoustic coefficients, the delays and the position of the virtual sound sources of the reflections, the calculating logic being configured to calculate the acoustic coefficients and the delays of the reflections according to estimates of a difference in the distance traveled by the sound between the position of the source of the sound wave and an estimated position both of a user and of a distance traveled by the sound between the positions of the virtual sound sources of the reflections and the estimated position of the user.

8. The ambisonic encoder according to claim 7, wherein the logic for calculating the acoustic coefficients, the delays and the positions of the virtual sound sources of the reflections is further configured to calculate the acoustic coefficients of the reflections according to at least one acoustic coefficient of at least one obstacle to the propagation of sound waves, off which the sound is reflected.

9. The ambisonic encoder according to one of claims 7 to 8, wherein the logic for calculating the acoustic coefficients, the delays and the positions of the virtual sound sources of the reflections is configured to calculate positions of virtual sound sources of the reflections as inverses of the position of the source of the sound wave with respect to a plane that is tangential to an obstacle to the propagation of sound waves.

10. The ambisonic encoder according to one of claims 1 to 9, wherein the logic for calculating spherical harmonics of the sound wave and of the plurality of reflections is further configured to calculate spherical harmonics of the sound wave and of the plurality of reflections at each output frequency of the frequency transformation circuit, the ambisonic encoder further comprising a logic for calculating binaural coefficients of the sound wave, which logic is configured to calculate binaural coefficients of the sound wave by multiplying, at each output frequency of the circuit for transforming the frequency of the sound wave, the signal of the sound wave by the spherical harmonics of the sound wave and of the plurality of reflections at this frequency.

11. The ambisonic encoder according to one of claims 7 to 9, wherein the logic for calculating the acoustic coefficients, the delays and the positions of the virtual sound sources of the reflections is configured to calculate acoustic coefficients and delays of a plurality of late reflections.

12. A method for ambisonically encoding a sound wave having a plurality of reflections, comprising:

- performing a frequency transformation (710) of the sound wave;

- calculating (720) spherical harmonics of the sound wave and of the plurality of reflections on the basis of a position of a source of the sound wave and of positions of obstacles to a propagation of sound waves;

- filtering (730), by a plurality of logics for filtering in the frequency domain, spherical harmonics of the plurality reflections, each filtering logic consisting of an attenuation and a delay of a reflection, and being parameterized by an acoustic coefficient and a delay of a reflection;

- adding (740) spherical harmonics of the sound wave and the outputs from the filtering logics, into a set of spherical harmonics representative of both the sound wave and of the plurality of reflections in the frequency domain;

- multiplying said set of spherical harmonics representative of both the sound wave and the plurality of reflections in the frequency domain by sound intensity values of the wave at the output of the frequency transformation to obtain a set of ambisonic coefficients (B₀₀, B_1-1, B₁₀, B₁₁, ..., B_MM) representative of both the sound wave and the plurality of reflections.

13. A computer program product, comprising computer code instructions stored on a computer readable medium for ambisonic encoding of sound waves with a plurality of reflections, said computer code instructions being configured to:

- perform a frequency transformation of the sound wave;

- calculate spherical harmonics of the sound wave and of the plurality of reflections on a basis of a position of a source of the sound wave and of positions of obstacles to a propagation of sound waves;

- parameterize a plurality of logics for filtering in the frequency domain receiving, as input, spherical harmonics of the plurality of reflections, each filtering logic consisting of an attenuation and a delay of a reflection, and being parameterized by an acoustic coefficient and a delay of said reflection;

- add spherical harmonics of the sound wave and outputs from the filtering logics, into a set of spherical harmonics representative of both the sound wave and the plurality of reflections in the frequency domain;

- multiply said set of spherical harmonics representative of both the sound wave and the plurality of reflections in the frequency domain by sound intensity values of the wave at the output of the frequency transformation to obtain a set of ambisonic coefficients (B₀₀, B_1-1, B₁₀, B₁₁, ..., B_MM) representative of both the sound wave and the plurality of reflections;
when said program runs on the computer.

Dessins

Références citées

RÉFÉRENCES CITÉES DANS LA DESCRIPTION

Cette liste de références citées par le demandeur vise uniquement à aider le lecteur et ne fait pas partie du document de brevet européen. Même si le plus grand soin a été accordé à sa conception, des erreurs ou des omissions ne peuvent être exclues et l'OEB décline toute responsabilité à cet égard.

Documents brevets cités dans la description

Littérature non-brevet citée dans la description

J. DANIELReprésentations de champs acoustiques, application à la transmission et à la reproduction de scènes sonores dans un contexte multimédiaINIST-CNRS, Cote INIST : T 139957, [0004]
J. DANIELReprésentations de champs acoustiques, application à la transmission et à la reproduction de scènes sonores dans un contexte multimédiaINIST-CNRS, Cote INIST : T 139957, 283-287 [0014]
N. TSINGOS et al.Perceptual Audio Rendering of Complex Virtual Environment, ACM Transactions on Graphics (TOG)Proceedings of ACM SIGGRAPH 2004, vol. 23, 3249-258 [0016]
MARKUS NOISTERING et al.A 3D AMBISONIC BASED BINAURAL SOUND REPRODUCTION SYSTEM, [0020]
A. MERTINSSignal Analysis : Wavelets, Filter banks, Time-Frequency Transforms and Applications, English [0072]