DOMAINE DE L'INVENTION
[0001] La présente invention concerne l'encodage ambisonique de sources sonores. Il concerne
plus spécifiquement l'amélioration de l'efficacité de ce codage, dans le cas où une
source sonore est affectée de réflexions dans une scène sonore.
ETAT DE L'ART PRECEDENT
[0002] Les représentations spatialisées du son regroupent des techniques de capture de synthèse
et de reproduction d'environnement sonore permettant une immersion de l'auditeur beaucoup
plus importante dans un environnement sonore. Elles permettent notamment à un utilisateur
de discerner un nombre de sources sonores supérieures au nombre de haut-parleurs dont
il dispose, et localiser précisément en 3D ces sources sonores, même lorsque leur
direction n'est pas celle d'un haut-parleur. Les applications des représentations
spatialisées du son sont nombreuses, et incluent la localisation précise de source
sonores en 3 dimensions par un utilisateur à partir d'un son issu d'un casque stéréo,
ou la localisation de sources sonores en 3 dimensions par des utilisateurs dans une
pièce, le son étant émis par des enceintes, par exemple des enceintes 5.1. De plus,
les représentations spatialisées du son permettent la réalisation d'effets sonores
nouveaux. Par exemple, elles permettent la rotation d'une scène sonore ou l'application
de réflexion d'une source sonore pour simuler le rendu d'un environnement sonore donné,
par exemple une salle de cinéma ou une salle de concert.
[0003] Les représentations spatialisées s'effectuent en deux étapes principales: un encodage
ambisonique, et un décodage ambisonique. Pour bénéficier d'une représentation spatialisée
du son, un décodage ambisonique en temps réel est toujours nécessaire. Une production
ou traitement du son en temps-réel peut impliquer en plus un encodage ambisonique
en temps réel de celui-ci. L'encodage ambisonique étant une tâche complexe, les capacités
d'encodage ambisonique en temps réel peuvent être limitées. Par exemple, une capacité
de calcul donnée ne pourra être capable d'encoder en temps réel qu'un nombre de sources
sonores limitées.
[0004] Les techniques de représentation spatialisées du son sont notamment décrites par
J. Daniel, Représentations de champs acoustiques, application à la transmission et
à la reproduction de scènes sonores dans un contexte multimédia, INIST-CNRS, Cote
INIST : T 139957. L'encodage ambisonique d'un champ sonore consiste en la décomposition du champ de
pression sonore en un point, correspondant par exemple à la position d'un utilisateur,
sous forme de coordonnées sphériques, exprimées sous la forme suivante :

Dans laquelle
p(
r,
t) représente la pression sonore, à un instant t, dans la direction
r par rapport au point auquel le champ sonore est calculé.
jm représente la fonction sphérique de Bessel d'ordre m.
[0005] Ymn(
θ,ϕ) représente l'harmonique sphérique d'ordre mn dans les directions (
θ,ϕ)
. définies par la direction
r. Le symbole
Bmn(
t) définit les coefficients ambisoniques correspondant aux différentes harmoniques
sphériques, à un instant t.
[0006] Les coefficients ambisoniques définissent donc, à chaque instant, l'ensemble du champ
sonore entourant un point. Le traitement des champs sonores dans le domaine ambisonique
possède des propriétés particulièrement intéressantes. En particulier, il est très
aisé de procéder à des rotations de l'ensemble du champ sonore. Il est de plus possible
de diffuser sur des haut-parleurs, à partir d'un ensemble de coefficients ambisoniques,
du son comportant des informations de direction. Il est par exemple possible de diffuser
du son sur des enceintes de types 5.1. Il est également possible de restituer, dans
un casque ne disposant que d'un haut-parleur gauche et d'un haut-parleur droit, du
son comportant des informations de directions, en utilisant des fonctions de transfert
connues sous le nom de HRTF (Head-Related Transfer Functions, ou Fonctions de Transfert
Relatives à la Tête). Ces fonctions permettent de restituer un signal directionnel
sur deux haut-parleurs, en ajoutant à au moins un canal d'un signal stéréo un délai
et/ou une atténuation, qui seront interprétés par le cerveau comme définissant la
direction de la source sonore.
[0007] La décomposition dite HOA (de l'acronyme anglais Higher Order Ambisonics, ou Ambisonie
de Plus Haut Ordre) consiste à tronquer cette somme infinie à un ordre M, supérieur
ou égal à 1 :

[0008] D'une manière générale, une source suffisamment distante est considérée comme propageant
une onde sonore de manière sphérique. Il est alors possible de considérer que la valeur
à un instant t d'un coefficient ambisonique
Bmn(
t) lié à cette source dépend, d'une part, de la pression sonore
S(
t) de la source à cet instant t, et d'autre part de l'harmonique sphérique liée à l'orientation
(
θs,
ϕs) de cette source sonore. On peut donc écrire, pour une source sonore unique :

[0009] Dans le cas d'un ensemble de
Ns sources sonores lointaines, les coefficients ambisoniques décrivant la scène sonore
sont calculés comme la somme des coefficients ambisoniques de chacune des sources,
chaque source i ayant une orientation (
θsi,
ϕsi):

[0010] On peut également représenter ce calcul sous forme de vecteur :

Les coefficients ambisoniques gardant la forme
Bmn, avec, à l'ordre M, m allant de 0 à M, et n allant de -m à m.
[0011] Un appareil comprenant un encodage ambisonique d'au moins une source peut donc définir
un champ sonore complet, en calculant les coefficients ambisoniques à un ordre M.
En fonction de l'ordre M, et du nombre de sources, ce calcul peut être long et gourmand
en ressource. En effet, à un ordre M, (M + 1)
2 coefficients ambisoniques sont calculés à chaque instant t. Pour chaque coefficient,
la contribution
Bmn(
t) =
S(
t)
Ymn(
θs,ϕs) de chacune des N
s sources doit être calculée. Si une source S est fixe, l'harmonique sphérique
Ymn(
θs,
ϕs) peut être pré-calculée. Dans le cas contraire, elle doit être recalculée à chaque
instant.
[0012] Une augmentation de l'ordre du coefficient ambisonique permet une meilleure qualité
du rendu auditif. Il peut donc être difficile d'obtenir une bonne qualité sonore,
tout en préservant une charge, un temps de calcul raisonnable, une consommation électrique
et un usage de batterie raisonnables. Ceci est d'autant plus vrai que les calculs
de coefficients ambisoniques s'effectuent souvent en temps-réel sur des dispositifs
mobiles. C'est par exemple le cas d'un smartphone, pour écouter de la musique en temps
réel, avec des informations directionnelles calculées à l'aide de coefficients ambisoniques.
[0013] Cette problématique est encore plus forte lorsque des réflexions sont calculées dans
une scène sonore.
[0014] Le calcul de réflexions permet de simuler une scène sonore dans une pièce, par exemple
une salle de cinéma ou de concert. Dans ces conditions, le son se réfléchit sur les
murs de la salle, donnant une « ambiance » caractéristique, les réflexions étant définies
par les positions respectives des sources sonores, de l'auditeur, mais aussi par les
matériaux sur lesquels les ondes sonores se diffusent, par exemple le matériau des
murs. La création d'effets de salle à l'aide d'un codage audio ambisonique est notamment
décrite par
J. Daniel, Représentations de champs acoustiques, application à la transmission et
à la reproduction de scènes sonores dans un contexte multimédia, INIST-CNRS, Cote
INIST : T 139957, pp. 283-287.
[0015] Il est possible de simuler l'effet des réflexions et de donner une « ambiance » en
ambisonie, en ajoutant, pour chaque source sonore, un ensemble de sources sonores
secondaires, dont l'intensité et la direction sont calculées à partir des réflexions
des sources sonores sur les murs et obstacles d'une scène sonore. Quelques sources
sonores sont nécessaires, pour chaque source sonore initiale, afin de simuler de manière
satisfaisante une scène sonore. Cependant, ceci rend le problème de capacité de calcul
et de batterie précité encore plus critique, puisque la complexité de calcul des coefficients
ambisoniques est encore multipliée par le nombre de sources sonores secondaires. La
complexité du calcul des coefficients ambisoniques pour un rendu sonore satisfaisant
peut alors rendre cette solution impraticable, par exemple parce qu'il devient impossible
de calculer les coefficients ambisoniques en temps réel, parce que la charge de calcul
des coefficients ambisoniques devient trop importante, ou parce la consommation électrique
et/ou de batterie sur un appareil mobile devient rédhibitoire.
[0017] La méthode divulguée par Tsingos permet de réduire le nombre de sources sonores,
et donc la complexité du traitement global lorsque des réverbérations sont utilisées.
Cependant, cette technique présente plusieurs inconvénients. Elle n'améliore pas la
complexité du traitement des réverbérations elles-mêmes. Le problème rencontré se
poserait donc à nouveau, si, avec un nombre réduit de sources, on souhaite augmenter
le nombre de réverbérations. De plus, les traitements pour déterminer la puissance
sonore de chaque source, et fusionner les sources par grappes présentent eux-mêmes
une charge de calcul importante. Les expériences décrites se limitent à des cas ou
les sources sonores sont connues à l'avance, et leurs puissances respectives pré-calculées.
Dans des cas de scènes sonores pour lesquelles plusieurs sources d'intensités variables
sont présentes, et dont les puissances doivent être recalculées, la charge de calcul
associée viendrait, au moins partiellement, annuler le gain de calcul obtenu en limitant
le nombre de sources.
[0018] Enfin, les tests conduits par Tsingos donnent des résultats satisfaisants lorsque
les sources sonores sont assimilables à du bruit, par exemple dans le cas d'une foule
dans le métro. Sur d'autres types de sources sonores, une telle méthode pourrait s'avérer
dommageable. Par exemple, lors de l'enregistrement d'un concert donné par un orchestre
symphonique, il est fréquent que plusieurs instruments, bien qu'ayant une puissance
sonore faible, contribuent de manière importante à l'harmonie d'ensemble. Supprimer
purement et simplement les sources sonores associées, car elles sont relativement
peu puissantes, nuirait alors gravement à la qualité de l'enregistrement.
[0019] Le document
US 6021206 divulgue un filtrage de sources sonores virtuelles correspondant aux réflexions comprenant
un délai et une atténuation.
[0021] Le document
US 2007/160216 divulgue, de manière générale, le calcul de gains en fonction de la position d'une
source sonore pour la binauralisation.
[0022] Le document
US 2005/069143 divulgue l'application de fonctions HRTF au son dans le domaine fréquentiel.
[0023] Le document
US 2011/305344 divulgue méthode de transformations des pistes sonores avant encodage binaural, afin
de minimiser le besoin de « sweet spot », notamment en convertissant certaines pistes
en mono.
[0024] Il y a donc besoin d'un appareil et d'une méthode pour le calcul des coefficients
ambisoniques, qui permette de calculer en temps réel un ensemble de coefficients ambisoniques
représentatifs d'au moins une source sonore et une ou plusieurs réflexions de celle-ci
dans une scène sonore, tout en limitant la complexité de calcul additionnelle liée
à la ou aux réflexions de la source sonore, sans réduire à priori le nombre de sources
sonores.
RESUME DE L'INVENTION
[0025] A cet effet, l'invention concerne un encodeur ambisonique d'onde sonore à pluralité
de réflexions, comprenant : une logique de transformation fréquentielle de l'onde
sonore ; une logique de calcul d'harmoniques sphériques de l'onde sonore et de la
pluralité de réflexions à partir d'une position d'une source de l'onde sonore et de
positions d'obstacles à une propagation de l'onde sonore ; une pluralité de logiques
de filtrage dans le domaine fréquentiel recevant en entrée des harmoniques sphériques
de la pluralité de réflexions, chaque logique de filtrage consistant en une atténuation
et un délai d'une réflexion, et étant paramétrée par un coefficient acoustique et
un délai de ladite réflexion ; une logique d'addition d'harmoniques sphériques de
l'onde sonore et des sorties des logiques de filtrage, en un ensemble d'harmoniques
sphériques représentatives à la fois de l'onde sonore et de la pluralité de réflexions
dans le domaine fréquentiel ; une logique de multiplication dudit ensemble d'harmoniques
sphériques représentatives à la fois de l'onde sonore et de la pluralité de réflexions
dans le domaine fréquentiel par des valeurs d'intensité sonores de l'onde en sortie
de la transformation fréquentielle, afin d'obtenir un ensemble de coefficients ambisoniques
représentatifs à la fois de l'onde sonore et de la pluralité de réflexions.
[0026] Avantageusement, la logique de calcul d'harmoniques sphériques de l'onde sonore est
configurée pour calculer les harmoniques sphériques de l'onde sonore et de la pluralité
de réflexions à partir d'une position fixe de la source de l'onde sonore.
[0027] Avantageusement, la logique de calcul d'harmoniques sphériques de l'onde sonore est
configurée pour calculer de manière itérative les harmoniques sphériques de l'onde
sonore et de la pluralité de réflexions à partir de positions successives de la source
de l'onde sonore.
[0028] Avantageusement, chaque réflexion est caractérisée par un unique coefficient acoustique.
[0029] Avantageusement, chaque réflexion est caractérisée par un coefficient acoustique
pour chaque fréquence dudit échantillonnage fréquentiel.
[0030] Avantageusement, les réflexions sont représentées par des sources sonores virtuelles.
[0031] Avantageusement, l'encodeur ambisonique comprend en outre une logique de calcul des
coefficients acoustiques, des délais et de la position de des sources sonores virtuelles
des réflexions, ladite logique de calcul étant configurée pour calculer les coefficients
acoustiques et les délais des réflexions en fonction d'estimations d'une différence
de distance parcourue par le son entre la position de la source de l'onde sonore et
une position estimée d'un utilisateur d'une part, et d'une distance parcourue par
le son entre les positions des sources sonores virtuelles des réflexions et la position
estimée de l'utilisateur d'autre part.
[0032] Avantageusement, la logique de calcul des coefficients acoustiques, des délais et
des positions des sources sonores virtuelles des réflexions est en outre configurée
pour calculer les coefficients acoustiques des réflexions en fonction d'au moins un
coefficient acoustique d'au moins un obstacle à la propagation d'ondes sonores, sur
lequel le son est réfléchi.
[0033] Avantageusement, la logique de calcul des coefficients acoustiques, des délais et
des positions des sources sonores virtuelles des réflexions est en outre configurée
pour calculer les coefficients acoustiques des réflexions en fonction d'un coefficient
acoustique d'au moins un obstacle à la propagation d'ondes sonores, sur lequel le
son est réfléchi.
[0034] Avantageusement, la logique de calcul d'harmoniques sphériques de l'onde sonore et
de la pluralité de réflexions est en outre configurée pour calculer des harmoniques
sphériques de l'onde sonore et de la pluralité de réflexions à chaque fréquence de
sortie du circuit de transformation fréquentielle, ledit encodeur ambisonique comprenant
en outre une logique de calcul de coefficients binauraux de l'onde sonore, configurée
pour calculer des coefficient binauraux de l'onde sonore en multipliant à chaque fréquence
de sortie du circuit de transformation fréquentielle de l'onde sonore le signal de
l'onde sonore par les harmoniques sphériques de l'onde sonore et de la pluralité de
réflexions à cette fréquence.
[0035] Avantageusement, la logique de calcul des coefficients acoustiques, des délais et
des positions des sources sonores virtuelles des réflexions est configurée pour calculer
des coefficients acoustiques et des délais d'une pluralité de réflexions tardives.
[0036] L'invention concerne également une méthode d'encodage ambisonique d'onde sonore à
pluralité de réflexions, comme définie par la revendication 12.
[0037] L'invention concerne également un programme d'ordinateur pour l'encodage ambisonique
d'onde sonore à pluralité de réflexions, comme définie par la revendication 13.
[0038] L'encodeur ambisonique selon l'invention permet d'améliorer la sensation d'immersion
dans une scène audio 3D.
[0039] La complexité d'encodage des réflexions de sources sonores d'un encodeur ambisonique
selon l'invention est moindre que la complexité d'encodage des réflexions de sources
sonores d'un encodeur ambisonique selon l'état de l'art.
[0040] L'encodeur ambisonique selon l'invention permet d'encoder un plus grand nombre de
réflexions d'une source sonore en temps réel.
[0041] L'encodeur ambisonique selon l'invention permet de diminuer la consommation électrique
liée à l'encodage ambisonique, et d'augmenter la durée de vie d'une batterie d'un
appareil mobile utilisé pour cette application.
LISTE DES FIGURES
[0042] D'autres caractéristiques apparaîtront à la lecture de la description détaillée donnée
à titre d'exemple et non limitative qui suit faite au regard de dessins annexés qui
représentent:
- les figures 1a et 1b, deux exemples de systèmes d'écoute d'onde sonore, selon deux
modes de réalisation de l'invention
- la figure 2, un exemple d'un système de binauralisation comprenant un moteur de binauralisation
par source sonore d'une scène audio selon l'état de l'art ;
- les figures 3a et 3b, deux exemples de moteurs de binauralisation d'une scène 3D,
respectivement dans le domaine temporel et le domaine fréquentiel selon l'état de
l'art
- la figure 4, un exemple d'encodeur ambisonique d'une onde sonore à une pluralité de
réflexions, dans un ensemble de modes de mise en œuvre de l'invention ;
- la figure 5, un exemple de calcul d'une source sonore secondaire, dans un mode de
mise en œuvre de l'invention ;
- la figure 6, un exemple de calcul de réflexions précoces et de réflexions tardives,
dans un mode de réalisation de l'invention ;
- la figure 7, une méthode d'encodage d'une onde sonore à une pluralité de réflexions
dans un ensemble de modes de mise en œuvre de l'invention.
DESCRIPTION DETAILLEE
[0043] Les figures 1a et 1b représentent deux exemples de systèmes d'écoute d'onde sonore,
selon deux modes de réalisation de l'invention.
[0044] La figure 1a représente un exemple de système d'écoute d'onde sonore, selon un mode
de réalisation de l'invention.
[0045] Le système 100a comprend une tablette tactile 110a, un casque 120a pour permettre
à un utilisateur 130a d'écouter une onde sonore. Le système 100a, comprend, à titre
d'exemple uniquement, une tablette tactile. Cependant, cet exemple est également applicable
à un smartphone, ou à tout autre appareil mobile possédant des capacités d'affichage
et de diffusion sonore. L'onde sonore peut par exemple être issue de la lecture d'un
film ou d'un jeu. Selon plusieurs modes de réalisation de l'invention, le système
100a peut être configuré pour écouter plusieurs ondes sonores. Par exemple, lorsque
le système 100a est configuré pour la lecture d'un film comprenant une piste sonore
multicanal 5.1, 6 ondes sonores sont écoutées simultanément. De la même manière, lorsque
le système 100a est configuré pour jouer à un jeu, de nombreuses ondes sonores peuvent
être écoutées simultanément. Par exemple, dans le cas d'un jeu faisant intervenir
plusieurs personnages, une onde sonore peut être créée pour chaque personnage.
[0046] Chacune des ondes sonores est associée à une source sonore, dont la position est
connue.
[0047] La tablette tactile 110a comprend un encodeur ambisonique 111a selon l'invention,
un circuit de transformation 112a, et un décodeur ambisonique 113a.
[0048] Selon un ensemble de modes de réalisation de l'invention, l'encodeur ambisonique
111a, le circuit de transformation 112a et le décodeur ambisonique 113a sont constitués
d'instructions de code d'ordinateur exécutées sur un processeur de la tablette tactile.
Ils peuvent par exemple avoir été obtenus en installant une application ou un logiciel
spécifique sur la tablette. Dans d'autres modes de réalisation de l'invention, l'un
au moins parmi l'encodeur ambisonique 111a, le circuit de transformation 112a et le
décodeur ambisonique 113a est un circuit intégré spécialisé, par exemple un ASIC (acronyme
de l'anglais « Application-Specific Integrated Circuit, littéralement « circuit intégré
propre à une application »), un FPGA (acronyme de l'anglais Field-Programmable Gate
Array, Réseau de portes programmable).
[0049] L'encodeur ambisonique 111a est configuré pour calculer, dans le domaine fréquentiel,
un ensemble de coefficients ambisoniques représentatifs de l'ensemble d'une scène
sonore, à partir d'au moins une onde sonore. Il est de plus configuré pour appliquer
des réflexions à au moins une onde sonore, afin de simuler un environnement d'écoute,
par exemple une salle de cinéma d'une certaine taille, ou une salle de concert.
[0050] Le circuit de transformation 112a est configuré pour effectuer des rotations de la
scène sonore en modifiant les coefficients ambisoniques, afin de simuler la rotation
de la tête de l'utilisateur, de sorte que, quelle que soit l'orientation de son visage,
les différentes ondes sonores lui paraissent parvenir d'une même position. Par exemple,
si l'utilisateur tourne la tête vers la gauche d'un angle a, une rotation de la scène
sonore vers la droite d'un même angle α permet de continuer à lui faire parvenir le
son toujours de la même direction. Selon un ensemble de modes de réalisation de l'invention,
le casque 120a est équipé d'au moins un capteur de mouvement 121a, par exemple un
gyromètre, permettant d'obtenir un angle ou une dérivée d'un angle de rotation de
la tête de l'utilisateur 130a. Un signal représentatif d'un angle de rotation, ou
d'une dérivée d'un angle de rotation, est alors envoyé par le casque 121a à la tablette
120a, afin que le circuit de transformation 112a effectue la rotation de la scène
sonore correspondante.
[0051] Le décodeur ambisonique 113a est configuré pour restituer la scène sonore sur les
deux canaux stéréo du casque 120a, en convertissant les coefficients ambisoniques
transformés en deux signaux stéréo, l'un pour le canal gauche et l'autre pour le canal
droit. Dans un ensemble de modes de réalisation de l'invention, le décodage ambisonique
s'effectue à l'aide de fonctions dites HRTF (acronyme de l'anglais « Head Related
Transfer Functions », littéralement Fonctions de Transfer Liées à la Tête) permettant
de restituer, sur deux canaux stéréo les directions des différentes sources sonores.
La demande de brevet français n°
1558279, déposée par le demandeur, décrit une méthode pour créer des fonctions HRTF optimisées
pour un utilisateur en fonction d'une banque de fonctions HRTF, et des caractéristiques
du visage dudit utilisateur.
[0052] Le système 100a permet ainsi à son utilisateur de bénéficier d'une expérience particulièrement
immersive : lors d'un jeu ou d'une lecture d'un contenu multimédia, en plus de l'image,
ce système lui permet de bénéficier d'une impression d'immersion dans une scène sonore.
Cette impression est amplifiée à la fois par le suivi des orientations des différentes
sources sonores lorsque l'utilisateur tourne la tête, et par l'application de réflexions
donnant une impression d'immersion dans un environnement d'écoute particulier. Ce
système permet par exemple de regarder un film ou un concert avec un casque audio,
en ayant une impression d'immersion dans une salle de cinéma ou une salle de concert.
L'ensemble de ces opérations est effectué en temps réel, ce qui permet d'adapter en
permanence le son perçu par l'utilisateur à l'orientation de sa tête.
[0053] L'encodeur ambisonique 111a selon l'invention permet d'encoder un plus grand nombre
de réflexions des sources sonores, avec une complexité moindre par rapport à un encodeur
ambisonique de l'art antérieur. Il permet donc d'effectuer tous les calculs ambisoniques
en temps réel, tout en augmentant le nombre de réflexions des sources sonores. Cette
augmentation du nombre de réflexions permet de modéliser de manière plus fine l'environnement
d'écoute simulé (salle de concert, de cinéma...) et donc d'améliorer la sensation
d'immersion dans la scène sonore. La réduction de la complexité de l'encodage ambisonique
permet également, en considérant un nombre identique de source sonores, de réduire
la consommation électrique de l'encodeur par rapport à un encodeur de l'état de l'art,
et donc d'augmenter la durée de déchargement de la batterie de la tablette tactile
110a. Cela permet donc à l'utilisateur de profiter d'un contenu multimédia pendant
une durée plus longue.
[0054] La figure 1b représente un second exemple de système d'écoute d'onde sonore, selon
un mode de réalisation de l'invention.
[0055] Le système 100b comprend une unité centrale 110b connectée à un écran 114b, une souris
115b et un clavier 116b et un casque 120b et est utilisé par un utilisateur 130b.
L'unité centrale comprend un encodeur ambisonique 111b selon l'invention, un circuit
de transformation 112b, et un décodeur ambisonique 113b, respectivement semblables
à l'encodeur ambisonique 111a, circuit de transformation 112a, et décodeur ambisonique
113a du système 100a. De manière similaire au système 100a, l'encodeur ambisonique
111b est configuré pour encoder au moins une onde représentative d'une scène sonore
en y ajoutant des réflexions, le casque 120a comprend au moins un capteur de mouvement
120b, le circuit de transformation 120b est configuré pour effectuer des rotations
de la scène sonore afin de suivre l'orientation de la tête de l'utilisateur, et le
décodeur ambisonique 113b est configuré pour restituer le son sur les deux canaux
stéréo du casque 120b, de manière à ce que l'utilisateur 130b ait une impression d'immersion
dans une scène sonore.
[0056] Le système 100b est adapté pour la visualisation de contenu multimédia, mais également
pour le jeu vidéo. En effet, dans un jeu vidéo, de très nombreuses ondes sonores,
issues de différentes sources, peuvent survenir. C'est par exemple le cas dans un
jeu de stratégie ou de guerre, dans lequel de nombreux personnages peuvent émettre
des sons différents (bruits de pas, de course, tirs...) pour diverses sources sonores.
Un encodeur ambisonique 111b permet d'encoder toutes ces sources, tout en leur ajoutant
de nombreuses réflexions rendant la scène plus réaliste et immersive, en temps réel.
Ainsi, le système 100b comprenant un encodeur ambisonique 111b selon l'invention permet
une expérience immersive dans un jeu vidéo, avec un grand nombre de sources sonores
et de réflexions.
[0057] La figure 2 représente un exemple d'un système de binauralisation comprenant un moteur
de binauralisation par source sonore d'une scène audio selon l'état de l'art.
[0058] Le système de binauralisation 200 est configuré pour transformer un ensemble 210
de sources sonores d'une scène sonore en un canal gauche 240 et un canal droit 241
d'un système d'écoute stéréo, et comprend un ensemble de moteurs binauraux 220, comprenant
un moteur binaural par source sonore.
[0059] Les sources peuvent être de tout type de sources sonores (mono, stéréo, 5.1, sources
sonores multiples dans le cas d'un jeu vidéo par exemple). Chaque source sonore est
associée à une orientation dans l'espace par exemple définie par des angles (
θ,ϕ) dans un référentiel, et par une onde sonore, elle-même représentée par un ensemble
d'échantillons temporels.
[0060] Chacun des moteurs de binauralisation de l'ensemble 220 est configuré pour, pour
une source sonore et à chaque instant t correspondant à un échantillon de la source
sonore :
- effectuer un encodage HOA de la source sonore à un ordre M ;
- effectuer une transformation sur les coefficients binauraux, par exemple une rotation
;
- calculer une intensité sonore p(r,t) à des instants t pour un ensemble de canaux de sortie, dans laquelle r représente l'orientation du canal de sortie.
[0061] Les canaux de sortie possibles correspondent aux différents canaux d'écoute, on peut
par exemple avoir deux canaux de sortie dans un système d'écoute stéréo, 6 canaux
de sortie dans un système d'écoute 5.1, etc...
[0062] Chaque moteur de binauralisation produit deux sorties (une sortie gauche et une sortie
droite), et le système 200 comprend un circuit d'addition 230 de toutes les sorties
gauches et un circuit d'addition 231 de toutes les sorties droites de l'ensemble 220
de moteurs de binauralisation. Les sorties des logiques d'addition 230 et 231 sont
respectivement l'onde sonore du canal gauche 240 et l'onde sonore du canal droit 241
d'un système d'écoute stéréo.
[0063] Le système 200 permet de transformer l'ensemble de sources sonores 210 en deux canaux
stéréo, tout en pouvant appliquer toutes les transformations permises par l'ambisonie,
telles que des rotations.
[0064] Cependant, le système 200 présente un inconvénient majeur en termes de temps de calcul
: il nécessite des calculs pour calculer les coefficients ambisoniques de chaque source
sonore, des calculs pour les transformations de chaque source sonore, et des calculs
pour les sorties associées à chaque source sonore. La charge de calcul pour le traitement
d'une source sonore par le système 200 est donc proportionnelle au nombre de sources
sonores, et peut, pour un grand nombre de sources sonores, devenir prohibitive.
[0065] Les figures 3a et 3b représentent deux exemples de moteurs de binauralisation d'une
scène 3D, respectivement dans le domaine temporel et le domaine fréquentiel selon
l'état de l'art.
[0066] La figure 3a représente un exemple de moteur de binauralisation d'une scène 3D, dans
le domaine temporel selon l'état de l'art.
[0067] Afin de limiter la complexité du traitement binaural dans le cas d'un grand nombre
de sources, le moteur de binauralisation 300a comprend un unique moteur d'encodage
HOA 320a pour l'ensemble des sources 310 de la scène sonore. Ce moteur d'encodage
320a est configuré pour calculer, à chaque pas de temps, les coefficients binauraux
de chaque source sonore en fonction de l'intensité et de la position de la source
sonore audit pas de temps, puis à sommer les coefficients binauraux des différentes
sources sonores. Ceci permet d'obtenir un unique ensemble 321a de coefficients binauraux
représentatifs de l'ensemble de la scène sonore.
[0068] Le moteur de binauralisation 320a comprend ensuite un circuit de transformation 330a
des coefficients, configuré pour transformer l'ensemble de coefficients 321a représentatifs
de la scène sonore en un ensemble de coefficients transformés 331a représentatifs
de l'ensemble de la scène sonore. Ceci permet par exemple d'effectuer une rotation
de l'ensemble de la scène sonore.
[0069] Le moteur de binauralisation 300a comprend enfin un décodeur binaural 340a, configuré
pour restituer les coefficients transformés 331a en un ensemble de canaux de sortie,
par exemple un canal gauche 341a et un canal droit 342a d'un système stéréo.
[0070] Le moteur de binauralisation 300a permet donc de réduire la complexité de calcul
nécessaire au traitement binaural d'une scène sonore par rapport au système 200, en
appliquant les étapes de transformation et décodage à l'ensemble de la scène sonore,
plutôt qu'à chaque source sonore prise individuellement.
[0071] figure 3b représente un exemple de moteur de binauralisation d'une scène 3D, dans
le domaine fréquentiel selon l'état de l'art.
[0072] Le moteur de binauralisation 300b est assez semblable au moteur de binauralisation
300a. Il comprend un ensemble 311b de logiques de transformation fréquentielle, l'ensemble
311b comprenant une logique de transformation fréquentielle pour chaque source sonore.
Les logiques de transformation fréquentielle peuvent par exemple être configurées
pour appliquer une transformée de Fourier rapide (ou FFT, de l'acronyme anglais Fast
Fourier Transform), afin d'obtenir un ensemble 312b de sources dans le domaine fréquentiel.
L'application de transformées fréquentielles est bien connue de l'homme de l'art,
et est par exemple décrite par
A. Mertins, Signal Analysis : Wavelets, Filter banks, Time-Frequency Transforms and
Applications, English (revised edition). ISBN : 9780470841839. Elle consiste par exemple à transformer, par fenêtres temporelles, les échantillons
sonores en intensité fréquentielles, selon un échantillonnage fréquentiel. L'opération
inverse, ou transformation fréquentielle inverse (dite FFT
-1 ou transformation de Fourier rapide inverse dans le cas d'une transformée de Fourier
rapide) permet de restituer, à partir d'un échantillonnage de fréquences, des intensités
d'échantillons sonores.
[0073] Le moteur de binauralisation 300b comprend ensuite un encodeur HOA 320b dans le domaine
fréquentiel. L'encodeur 320b est configuré pour calculer, pour chaque source et à
chaque fréquence de l'échantillonnage fréquentiel, les coefficients ambisoniques correspondants,
puis à additionner les coefficients ambisoniques des différentes sources, afin d'obtenir
un ensemble 321b d'échantillons ambisoniques représentatifs de l'ensemble de la scène
sonore, aux différentes fréquences. Un coefficient ambisonique à une fréquence f de
l'échantillonnage en fréquence s'obtient, de manière similaire à un coefficient ambisonique
à l'instant t, par la formule:
Bmn(
f) =
S(
f)
Ymn(
θs,
ϕs).
[0074] Le moteur de binauralisation 300b comprend ensuite un circuit de transformation 330b,
similaire au circuit de transformation 330a, permettant d'obtenir un ensemble 331b
de coefficients ambisoniques transformés représentatifs de l'ensemble de la scène
sonore, et un décodeur binaural 340b, configuré pour restituer deux canaux stéréo
341b et 342b. Le décodeur binaural 340b comprend un circuit de transformation fréquentielle
inverse, afin de restituer les canaux stéréo dans le domaine temporel.
[0075] Les propriétés du moteur de binauralisation 300b sont assez semblables à celles du
moteur de binauralisation 300a. Il permet également d'effectuer un traitement binaural
d'une scène sonore, avec une complexité réduite par rapport au système 200.
[0076] En cas d'augmentation importante du nombre de sources, la complexité du traitement
binaural des moteurs de binauralisation 300a et 300b est principalement due au calcul
des coefficients HOA par les encodeurs 320a et 320b. En effet, le nombre de coefficients
à calculer est proportionnel au nombre de sources. Au contraire, les circuits de transformation
330a et 330b, ainsi que les décodeurs binauraux 340a et 340b traitent des ensembles
de coefficients binauraux représentatifs de l'ensemble de la scène sonore, dont le
nombre ne varie pas en fonction du nombre de sources.
[0077] Pour le traitement des réflexions, la complexité des encodeurs binauraux 320a et
320b peut augmenter de manière importante. En effet, la solution de l'état de l'art
pour traiter les réflexions consiste à ajouter une source sonore virtuelle pour chaque
réflexion. La complexité de l'encodage HOA de ces encodeurs selon l'état de l'art
augmente donc proportionnellement en fonction du nombre de réflexions par source,
et peut devenir problématique lorsque le nombre de réflexions devient trop important.
[0078] La figure 4 représente un exemple d'encodeur ambisonique d'une onde sonore à une
pluralité de réflexions, dans un ensemble de modes de mise en œuvre de l'invention.
[0079] L'encodeur ambisonique 400 est configuré pour encoder une onde sonore 410 avec une
pluralité de réflexions, en un ensemble de coefficients ambisoniques à un ordre M.
Pour ce faire, l'encodeur ambisonique est configuré pour calculer une ensemble 460
d'harmoniques sphériques représentatives de l'onde sonore et de la pluralité de réflexions.
L'encodeur ambisonique 400 sera décrit, à titre d'exemple, pour l'encodage d'une onde
sonore unique. Cependant un encodeur ambisonique 400 selon l'invention peut également
encoder une pluralité d'ondes sonores, les éléments de l'encodeur ambisonique étant
utilisé de la même manière pour chaque onde sonore additionnelle. L'onde sonore 410
peut correspondre par exemple à un canal d'une piste audio, ou à une onde sonore créée
dynamiquement, par exemple une onde sonore correspondant à un objet d'un jeu vidéo.
Dans un ensemble de modes de réalisation de l'invention, les ondes sonores sont définies
par des échantillons successifs d'intensité sonore. Selon différents modes de réalisation
de l'invention, les ondes sonores peuvent par exemple être échantillonnées à une fréquence
de 22500Hz, 12000Hz, 44100 Hz, 48000 Hz, 88200 Hz, ou 96000 Hz, et chacun des échantillons
d'intensité codé sur 8, 12, 16, 24 ou 32 bits. En cas de pluralité d'onde sonores,
celles-ci peuvent être échantillonnées à des fréquences différentes, et les échantillons
peuvent être codés sur des nombres de bits différents.
[0080] L'encodeur ambisonique 400 comprend une logique 420 de transformation fréquentielle
de l'onde sonore. Celle-ci est similaire aux logiques 311b de transformation fréquentielle
des ondes sonores du système de binauralisation 300b selon l'état de l'art. Dans des
modes de réalisation à une pluralité d'ondes sonores, l'encodeur 400 comprend une
logique de transformation fréquentielle pour chaque onde sonore. En sortie de la logique
de transformation fréquentielle, une onde sonore est définie 421, pour une fenêtre
temporelle, par un ensemble d'intensités à différentes fréquences d'un échantillonnage
en fréquence. Dans un ensemble de modes de réalisation de l'invention, la logique
420 de transformation fréquentielle est une logique d'application d'une FFT.
[0081] L'encodeur 400a comprend également une logique 430 de calcul d'harmoniques sphériques
de l'onde sonore et de la pluralité de réflexions à partir d'une position d'une source
de l'onde sonore et de positions d'obstacles à la propagation de l'onde sonore. Dans
un ensemble de modes de réalisation de l'invention, la position de la source de l'onde
sonore est définie par des angles (
θsi,ϕsi) et une distance par rapport à une position d'écoute de l'utilisateur. Le calcul
des harmoniques sphériques
Y00(
θsi,ϕsi),
Y1-1(
θsi,
ϕsi)
Y10(
θsi,
ϕsi),
Y11(
θsi,
ϕsi), ...,
YMM(
θsi,
ϕsi), de l'onde sonore à l'ordre M peut s'effectuer selon les méthodes connues de l'état
de l'art, à partir des angles (
θsi,
ϕsi) définissant l'orientation de la source de l'onde sonore.
[0082] La logique 430 est également configurée pour calculer, à partir de la position de
la source de l'onde sonore, un ensemble d'harmoniques sphériques de la pluralité de
réflexions. Dans un ensemble de modes de réalisation de l'invention, la logique 430
est configurée pour calculer, à partir de la position de la source de l'onde sonore,
et de positions d'obstacles à la propagation de l'onde sonore, une orientation d'une
source virtuelle d'une réflexion, définie par des angles
(θs,r,
ϕs,r) puis, à partir de ces angles, des harmoniques sphériques
Y00(
θs,r,
ϕs,r),
Y1-1(
θs,r,
ϕs,r),
Y10(
θs,r,
ϕs,r),
Y11(
θs,r,
ϕs,r), ...,
YMM(
θs,r,
ϕs,r) de la réflexion de l'onde sonore. Ceci permet d'obtenir, pour chaque réflexion,
les harmoniques sphériques correspondant à la direction de l'onde réfléchie sur les
obstacles à la propagation de l'onde sonore.
[0083] L'encodeur ambisonique 400 comprend également une pluralité 440 de logiques de filtrage
dans le domaine fréquentiel recevant en entrée des harmoniques sphériques de la pluralité
de réflexions, chaque logique de filtrage étant paramétrée par des coefficients acoustiques
et de délai des réflexions. Dans la suite de la description, on appellera
αr un coefficient acoustique d'une réflexion et
δr un délai d'une réflexion. Selon différents modes de réalisation de l'invention, le
coefficient acoustique peut être un coefficient de
αr réverbération, représentatif d'un rapport des intensités d'une réflexion sur des
intensités de la source sonore et défini entre 0 et 1. Selon d'autres modes de réalisation
de l'invention, le coefficient acoustique est un coefficient
αa dit d'atténuation ou d'absorption, soit un coefficient défini entre 0 et 1 tel que
αa =
αr - 1. Ces logiques de filtrage permettent d'appliquer aux coefficients ambisoniques
d'une réflexion un délai et une atténuation. Ainsi, la combinaison de l'orientation
de la source virtuelle de la réflexion, du délai et de l'atténuation de la réflexion
permet de modéliser chaque réflexion comme une réplique de la source sonore, venant
d'une direction différente, affectée d'un délai et atténuée, suite au parcours et
aux réflexions de l'onde sonore. Cette modélisation permet, avec plusieurs réflexions
de simuler la propagation d'une onde sonore dans une scène de manière simple et efficace.
[0084] De manière générale, le filtrage, à une fréquence f, d'une harmonique sphérique d'une
réflexion peut s'écrire :
Hr(f) Yij(
θs,r,
ϕs,r). Dans un mode de réalisation de l'invention une logique de filtrage 440 est configurée
pour filtrer les harmoniques sphériques en appliquant:
αre-j2πδrYij(
θs,r,
ϕs,r). Dans ce mode de réalisation, le coefficient
αr est traité comme un coefficient de réverbération. Dans d'autres modes de réalisation,
un coefficient
αa peut être traité comme un coefficient d'atténuation, et le filtrage des harmoniques
sphériques peut par exemple s'effectuer en appliquant: (
1 - αa)
e-j2πfδrYij(
θs,r,
ϕs,r). Dans la suite de la description, on considèrera sauf mention contraire le coefficient
αr comme un coefficient de réverbération. Un homme de l'art pourra cependant aisément
mettre en œuvre les différents modes de réalisation de l'invention avec un coefficient
d'atténuation plutôt qu'un coefficient de réverbération.
[0085] L'encodeur ambisonique 400 comprend également une logique 450 d'addition des harmoniques
sphériques de l'onde sonore et des sorties des logiques de filtrage. Cette logique
permet d'obtenir un ensemble
Y'00,
Y'1-1,
Y'10, Y'11, ...
Y'MM d'harmoniques sphériques à l'ordre M, représentatives à la fois de l'onde sonore,
et des réflexions de l'onde sonore, dans le domaine fréquentiel. Un harmonique sphérique
Y'ij (avec 0 ≤ i ≤ M, et -i ≤ j ≤ i) représentative à la fois de l'onde sonore, et des
réflexions de l'onde sonore, est donc égale, en sortie de la logique d'addition 450,
à la valeur

dans laquelle
Yij(
θsi,
ϕsi) est une harmonique sphérique de la source de l'onde sonore,
Nr est le nombre de réflexions de l'onde sonore,
Yij(
θs,r,
ϕs,r) sont les harmoniques sphériques des positions des sources sonores virtuelles des
réflexions, et les termes
Hr(f) sont les logiques de filtrage des harmoniques sphériques pour la réflexion r à une
fréquence f. Dans un ensemble de modes de réalisation de l'invention, les logiques
de filtrage
Hr(f) sont telles que
Hr(f) =
αre-j2πfδr, et les harmoniques sphériques
Yij à l'ordre M, représentatives à la fois de l'onde sonore, et des réflexions de l'onde
sonore sont égales, en sortie de la logique 450 d'addition, à:

[0086] Selon différents modes de réalisation de l'invention, le nombre N
r de réflexions peut être prédéfini. Selon d'autres modes de réalisation de l'invention,
les réflexions de l'onde sonore sont conservées selon leur coefficient acoustique,
le nombre Nr de réflexions dépendant alors de la position de la source sonore, de
la position de l'utilisateur, et des obstacles à la propagation du son. Dans l'exemple
ci-dessus, le coefficient acoustique est défini comme un ratio de l'intensité de la
réflexion sur l'intensité de la source sonore, soit un coefficient de réverbération.
Dans un mode de réalisation de l'invention, les réflexions de l'onde sonore ayant
un coefficient acoustique supérieur ou égal à un seuil prédéfini sont conservées.
Dans d'autres modes de réalisation, le coefficient acoustique est défini comme un
coefficient d'atténuation, soit un ratio entre l'intensité sonore absorbée par les
obstacles à la propagation d'ondes sonores et le trajet dans l'air et l'intensité
de la source sonore. Dans ce mode de réalisation, les réflexions de l'onde sonore
ayant un coefficient acoustique inférieur ou égal à un seuil prédéfini sont conservées
[0087] Ainsi, l'encodeur ambisonique 400 permet de calculer un ensemble d'harmoniques sphériques
Y'ij représentatives à la fois de l'onde sonore et de ses réflexions. Une fois ces harmoniques
sphériques calculées, l'encodeur peut comprendre une logique de multiplication des
harmoniques sphériques par les valeurs d'intensités sonores de la source aux différentes
fréquences, afin d'obtenir des coefficients ambisoniques représentatifs à la fois
de l'onde sonore et des réflexions. Dans des modes de réalisation à plusieurs sources
sonores, l'encodeur 400 comprend une logique d'addition des coefficients ambisoniques
des différentes sources sonores et de leurs réflexions, permettant d'obtenir en sortie
des coefficients ambisoniques représentatifs de l'ensemble de la scène sonore.
[0088] Dans un ensemble de modes de réalisation de l'invention, les coefficients ambisoniques
à l'ordre M représentatifs de la scène sonore sont alors égaux, en sortie de la logique
d'addition des coefficients ambisoniques des différentes sources sonores et de leurs
réflexions, pour Ns sources sonores et pour une fréquence f, à :

[0089] L'utilisation d'un unique coefficient ambisonique
Y'ij représentatif à la fois de l'onde sonore et de ses réflexions permet de réduire de
manière importante les opérations de calcul permettant d'obtenir les coefficients
ambisoniques, surtout lorsque le nombre de réflexions est élevé. En effet, ceci permet
de réduire le nombre de multiplications, puisqu'il n'est plus nécessaire de multiplier
chacune des intensités
Si(
f) d'une source pour chaque fréquence par chacune des harmoniques sphériques
Yij(
θs,r,ϕs,r), pour chaque valeur de i telle que 0 ≤ i ≤ M, chaque valeur de j telle que -i ≤
j ≤ i, et chaque réflexion. Cette réduction du nombre de multiplications permet une
réduction importante de la complexité de calcul, particulièrement dans le cas d'un
nombre de réflexions élevé.
[0090] Dans un ensemble de modes de réalisation de l'invention, la logique 430 de calcul
d'harmoniques sphériques de l'onde sonore est configurée pour calculer les harmoniques
sphériques de l'onde sonore et de la pluralité de réflexions à partir d'une position
fixe de la source de l'onde sonore. Dans ce cas, les orientations (
θsi,ϕsi) de la source sonore, et les orientations (
θs,r,ϕs,r) de chacune des harmoniques sont constantes. Les harmoniques sphériques de l'onde
sonore et de la pluralité de réflexions ont alors également une valeur constante,
et peuvent être calculées une unique fois pour l'onde sonore.
[0091] Dans d'autres modes de réalisation de l'invention, la logique 430 de calcul d'harmoniques
sphériques de l'onde sonore est configurée pour calculer de manière itérative les
harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir
de positions successives de la source de l'onde sonore. Selon différents modes de
réalisation de l'invention, différentes possibilités existent pour définir les itérations
de calcul. Dans un mode de réalisation de l'invention, la logique 430 est configurée
pour recalculer les valeurs des harmoniques sphériques de l'onde sonore et de la pluralité
de réflexions à chaque fois qu'un changement de la position de la source de l'onde
sonore ou de la position de l'utilisateur est détecté. Dans un autre mode de réalisation
de l'invention, la logique 430 est configurée pour recalculer les valeurs des harmoniques
sphériques de l'onde sonore et de la pluralité de réflexions à intervalles réguliers,
par exemple toutes les 10 ms. Dans un autre mode de réalisation de l'invention, la
logique 430 est configurée pour recalculer les valeurs des harmoniques sphériques
de l'onde sonore et de la pluralité de réflexions à chacune des fenêtres temporelles
utilisées par la logique 420 de transformation fréquentielle de l'onde sonore pour
convertir les échantillons temporels de l'onde sonore en échantillons fréquentiels.
[0092] Dans un ensemble de modes de réalisation de l'invention, chaque réflexion est caractérisée
par un unique coefficient acoustique
αr.
[0093] Dans d'autres modes de réalisation de l'invention, chaque réflexion est caractérisée
par un coefficient acoustique pour chaque fréquence dudit échantillonnage fréquentiel.
Ceci permet d'obtenir des coefficients acoustiques différents pour les différentes
fréquences, et d'améliorer le rendu de certains effets. Par exemple, il est connu
que les matériaux épais absorbent de manière plus importante les basses fréquences.
De même certains types de matériaux absorbent et réfléchissent de manière différente
les hautes fréquences. Ainsi, la définition de coefficients acoustiques différents
pour une même réflexion et différentes fréquences permet de caractériser les matériaux
rencontrés par les réflexions, permettant un meilleur rendu de différents types de
salle, en fonction des matériaux des murs de celle-ci.
[0094] Dans un ensemble de modes de réalisation de l'invention, une réflexion à une fréquence
peut être considérée comme nulle, en fonction d'une comparaison entre le coefficient
acoustique
αr pour cette fréquence et un seuil prédéfini. Par exemple, si le coefficient
αr représente un coefficient de réverbération, la fréquence est considérée comme nulle
s'il est inférieur à un seuil prédéfini. Au contraire, s'il s'agit d'un coefficient
d'atténuation, la fréquence est considérée comme nulle s'il est supérieur ou égal
à un seuil prédéfini. Ceci permet de limiter encore le nombre de multiplications,
et donc la complexité de l'encodage ambisonique, tout en ayant un impact minime sur
le rendu binaural.
[0095] Dans un ensemble de modes de réalisation de l'invention, l'encodeur ambisonique 400
comprend une logique de calcul des coefficients acoustiques et des délais, et de la
position de la source sonore virtuelle des réflexions. Cette logique de calcul peut
par exemple être configurée pour calculer les coefficients acoustiques et les délais
des réflexions en fonction d'estimations d'une différence de distance parcourue par
le son entre la position de la source de l'onde sonore et une position estimée d'un
utilisateur d'une part, et la distance parcourue par le son entre les positions des
sources sonores virtuelles des réflexions et la position estimée de l'utilisateur
d'autre part. Il est en effet aisé, connaissant la différence de distance parcourue
par le l'onde sonore par parvenir à l'utilisateur, en ligne droite depuis la source
sonore d'une part, et par le biais d'une réflexion d'autre part, et connaissant la
célérité du son, de déduire le délai ressenti par l'utilisateur entre le son issu
de la source sonore en ligne droite d'une part, et le son ayant été affecté par la
réflexion d'autre part.
[0096] De la même manière, il est connu que l'intensité d'une onde sonore diminue au fur
et à mesure de son parcours dans l'air. La logique de calcul des coefficients acoustiques
et des délais, et de la position de la source sonore virtuelle des réflexions peut
donc être configurée pour calculer un coefficient acoustique d'une réflexion de l'onde
sonore en fonction de la différence de distance parcourue entre le son issu de la
source sonore en ligne droite d'une part, et le son ayant été affecté par la réflexion
d'autre part.
[0097] Dans d'autres modes de réalisation de l'invention, la logique de calcul des coefficients
acoustiques et des délais, et de la position de la source sonore virtuelle des réflexions
est également configurée pour calculer les coefficients acoustiques des réflexions
en fonction d'un coefficient acoustique d'au moins un obstacle à la propagation d'ondes
sonores, sur lequel le son est réfléchi. Ceci permet de mieux modéliser l'absorption
par les matériaux d'une salle, et le coefficient acoustique de l'obstacle peut être
variable selon les différentes fréquences. Le coefficient acoustique de l'obstacle
peut être un coefficient de réverbération ou un coefficient d'atténuation.
[0098] La figure 5 représente un exemple de calcul d'une source sonore secondaire, dans
un mode de mise en œuvre de l'invention.
[0099] Dans cet exemple une source de l'onde sonore a une position 520 dans une pièce 510,
et l'utilisateur a une position 540. La pièce 510 est constituée de 4 murs 511, 512,
513 et 514.
[0100] Dans un ensemble de modes de mise en œuvre de l'invention, la logique de calcul des
coefficients acoustiques et des délais, et de la position de la source sonore virtuelle
des réflexions est configurée pour calculer les position, délai et atténuation des
sources sonores virtuelles des réflexions de la manière suivante : pour chacun des
murs 511, 512, 513, 514, la logique est configurée pour calculer une position d'une
source sonore virtuelle d'une réflexion comme le symétrique de la position de la source
sonore par rapport à un mur. La logique de calcul est ainsi configurée pour calculer
les positions 521, 522, 523 et 524 de quatre sources sonores virtuelles des réflexions,
respectivement par rapport aux murs 511, 512, 513 et 514.
[0101] Pour chacune de ces sources sonores virtuelles, la logique de calcul est configurée
pour calculer un chemin de parcours de l'onde sonore, et en déduire le coefficient
acoustique et le délai correspondants. Par exemple, dans le cas de la source sonore
virtuelle 511, l'onde sonore suit le trajet 530 jusqu'au point 531 du mur 512, puis
le chemin 532 jusqu'à la position de l'utilisateur 540. La distance parcourue par
le son selon le chemin 530, 532 permet de calculer un coefficient acoustique et un
délai de la réflexion. Dans un ensemble de modes de réalisation de l'invention la
logique de calcul est également configurée pour appliquer un coefficient acoustique
correspondant à l'absorption du mur 512 au point 531. Dans un ensemble de modes de
réalisation de l'invention, ce coefficient dépend des différentes fréquences, et peut
par exemple être déterminé, pour chaque fréquence, en fonction du matériau et/ou de
l'épaisseur du mur 512.
[0102] Dans un ensemble de modes de réalisation de l'invention, les sources sonores virtuelles
521, 522, 523, 524 sont utilisées pour calculer des sources sonores virtuelles secondaires,
correspondant à des réflexions multiples. Par exemple, une source virtuelle secondaire
533 peut être calculée comme le symétrique de la source virtuelle 521 par rapport
au mur 514. Le chemin de l'onde sonore correspondant comprend alors les segments 530
jusqu'au point 531 ; 534 entre les points 531 et 535 ; 536 entre le point 535 et la
position 540 de l'utilisateur. Les coefficients acoustiques et les délais peuvent
alors être calculés à partir de la distance parcourue par le son sur les segments
531, 535 et 536, et de l'absorption des murs aux points 531 et 535.
[0103] Selon différents modes de réalisation de l'invention, des sources sonores virtuelles
correspondant à des réflexions peuvent être calculées jusqu'à un ordre n prédéfini.
Différents modes de réalisation sont possibles pour déterminer les réflexions à conserver.
Dans un mode de réalisation de l'invention, la logique de calcul est configurée pour
calculer, pour chaque source sonore virtuelle, une source sonore virtuelle d'ordre
supérieur pour chacun des murs, jusqu'à un ordre prédéfini n. Dans un mode de réalisation,
l'encodeur ambisonique est configuré pour traiter un nombre Nr prédéfini de réflexions
par source sonore, et conserve les Nr réflexions ayant l'atténuation la plus faible.
Dans un autre mode de réalisation de l'invention, les sources sonores virtuelles sont
conservées sur la base d'une comparaison d'un coefficient acoustique avec un seuil
prédéfini.
[0104] La figure 6 représente un exemple de calcul de réflexions précoces et de réflexions
tardives, dans un mode de réalisation de l'invention.
[0105] Le diagramme 600 représente l'intensité de plusieurs réflexions de l'onde sonore,
par rapport au temps. L'axe 601 représente l'intensité d'une réflexion, et l'axe 602
le délai entre l'émission de l'onde sonore par la source de l'onde sonore, et la perception
d'une réflexion par l'utilisateur. Dans cet exemple, les réflexions survenant avant
un délai prédéfini 603 sont considérées comme des réflexions précoces 610, et les
réflexions survenant après le délai 603 comme des réflexions tardives 620. Dans un
mode de réalisation de l'invention, les réflexions précoces sont calculées à l'aide
d'une source sonore virtuelle, par exemple selon le principe décrit en référence à
la figure 5.
[0106] Selon différents modes de réalisation de l'invention, les réflexions tardives sont
calculées de la manière suivante: un ensemble de Nt sources sonores secondaires est
calculée, par exemple selon le principe décrit en figure 5. La logique de calcul des
coefficients acoustiques et des délais, et de la position de la source sonore virtuelle
des réflexions est configurée pour conserver un nombre Nr de réflexions inférieur
à Nt, selon différents modes de réalisation décrits ci-dessus. Dans un ensemble de
modes de réalisation de l'invention, elle est de plus configurée pour construire une
liste de (Nt - Nr) réflexions tardives, comprenant toutes les réflexions non conservées.
Cette liste comprend uniquement, pour chaque réflexion tardive, un coefficient acoustique
et un délai de la réflexion tardive, mais pas de position d'une source virtuelle.
[0107] Selon un mode de réalisation de l'invention, cette liste est transmise par l'encodeur
ambisonique à un décodeur ambisonique. Le décodeur ambisonique est alors configuré
pour filtrer ses sorties, par exemple ses canaux stéréo de sortie, avec les coefficients
acoustiques et les délais des réflexions tardives, puis à ajouter ces signaux filtrés
aux signaux de sortie. Ceci permet d'améliorer la sensation d'immersion dans une salle
ou un environnement d'écoute, tout en limitant encore la complexité de calcul de l'encodeur.
[0108] Selon un autre mode de réalisation de l'invention, l'encodeur ambisonique est configuré
pour filtrer l'onde sonore avec les coefficients acoustiques et les délais des réflexions
tardives, et ajouter les signaux obtenus de manière uniforme à l'ensemble des coefficients
ambisoniques. Ceci permet d'obtenir, avec une complexité de calcul limitée, un effet
représentatif de multiples réflexions dans un environnement sonore. Dans ce mode de
réalisation de l'invention, comme dans le précédent, les réflexions tardives ont une
intensité faible et n'ont pas d'information de direction d'une source sonore. Elles
seront donc perçues par un utilisateur comme un « écho » de l'onde sonore, réparti
de manière homogène dans la scène sonore, et représentatif d'un environnement d'écoute.
[0109] Le calcul des coefficients acoustiques et délais des réflexions tardives induit le
calcul de nombreuses réflexions. Il s'agit donc d'une opération relativement coûteuse
en termes de complexité de calcul. Selon un mode de réalisation de l'invention, ce
calcul est effectué une seule fois, par exemple à l'initialisation de la scène sonore,
et les coefficients acoustiques et les délais des réflexions tardives sont réutilisés
sans modification par l'encodeur ambisonique. Ceci permet d'obtenir des réflexions
tardives représentatives de l'environnement d'écoute à moindre coût. Selon d'autres
modes de réalisation de l'invention, ce calcul est effectué de manière itérative.
Par exemple, ces coefficients acoustiques et délais des réflexions tardives peuvent
être calculés à des intervalles de temps prédéfinis, par exemple toutes les 5 secondes.
Ceci permet de conserver en permanence des coefficients acoustiques et délais des
réflexions tardives représentatifs de la scène sonore, et des positions relatives
d'une source de l'onde sonore et de l'utilisateur, tout en limitant la complexité
de calcul liée à la détermination des réflexions tardives.
[0110] Dans d'autres modes de réalisation de l'invention, les coefficients acoustiques et
délais des réflexions tardives sont calculés lorsque la position d'une source de l'onde
sonore ou de l'utilisateur varie de manière significative, par exemple lorsque la
différence entre la position de l'utilisateur et une position précédente de l'utilisateur
lors d'un calcul des coefficients acoustiques et délais des réflexions tardives représentatifs
de la scène sonore est supérieure à un seuil prédéfini. Ceci permet de ne calculer
les coefficients acoustiques et délais des réflexions tardives représentatifs de la
scène sonore que lorsque la position d'une source de l'onde sonore ou de l'utilisateur
a suffisamment varié pour modifier de manière perceptible les réflexions tardives.
[0111] La figure 7 représente une méthode d'encodage d'une onde sonore à une pluralité de
réflexions dans un ensemble de modes de mise en œuvre de l'invention.
[0112] La méthode 700 comprend une étape 710 de transformation fréquentielle de l'onde sonore.
[0113] Elle comprend ensuite une étape 720 de calcul d'harmoniques sphériques de l'onde
sonore et de la pluralité de réflexions à partir d'une position d'une source de l'onde
sonore et de positions d'obstacles à la propagation d'ondes sonores.
[0114] Elle comprend ensuite une étape 730 de filtrage, par une pluralité de logiques de
filtrage dans le domaine fréquentiel, des harmoniques sphériques de la pluralité de
réflexions, chaque logique de filtrage étant paramétrée par des coefficients acoustiques
et des délais des réflexions.
[0115] Elle comprend ensuite une étape 740 d'addition d'harmoniques sphériques de l'onde
sonore et des sorties des logiques de filtrage.
[0116] Les exemples ci-dessus démontrent la capacité d'un encodeur ambisonique selon l'invention
à calculer des coefficients ambisoniques d'une onde sonore à une pluralité de réflexions.
Ils ne sont cependant donnés qu'à titre d'exemple et ne limitent en aucun cas la portée
de l'invention, définie dans les revendications ci-dessous.
1. Encodeur ambisonique (400) d'onde sonore (410) à pluralité de réflexions, comprenant
:
- Une logique (420) de transformation fréquentielle de l'onde sonore ;
- Une logique (430) de calcul d'harmoniques sphériques de l'onde sonore et de la pluralité
de réflexions à partir d'une position d'une source de l'onde sonore et de positions
d'obstacles à une propagation de l'onde sonore ;
- une pluralité (440) de logiques de filtrage dans le domaine fréquentiel recevant
en entrée des harmoniques sphériques de la pluralité de réflexions, chaque logique
de filtrage consistant en une atténuation et un délai d'une réflexion, et étant paramétrée
par un coefficient acoustique et un délai de ladite réflexion ;
- Une logique (450) d'addition d'harmoniques sphériques de l'onde sonore et des sorties
des logiques de filtrage, en un ensemble d'harmoniques sphériques représentatives
à la fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel
;
- Une logique de multiplication dudit ensemble d'harmoniques sphériques représentatives
à la fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel
par des valeurs d'intensité sonores de l'onde en sortie de la transformation fréquentielle,
afin d'obtenir un ensemble de coefficients ambisoniques (B00,B1-1,B10,B11,...,BMM) représentatifs à la fois de l'onde sonore et de la pluralité de réflexions.
2. Encodeur ambisonique selon la revendication 1, dans lequel la logique de calcul d'harmoniques
sphériques de l'onde sonore est configurée pour calculer les harmoniques sphériques
de l'onde sonore et de la pluralité de réflexions à partir d'une position fixe de
la source de l'onde sonore.
3. Encodeur ambisonique selon la revendication 1, dans lequel la logique de calcul d'harmoniques
sphériques de l'onde sonore est configurée pour calculer de manière itérative les
harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à partir
de positions successives de la source de l'onde sonore.
4. Encodeur ambisonique selon l'une des revendications 1 à 3, dans lequel chaque réflexion
est caractérisée par un unique coefficient acoustique.
5. Encodeur ambisonique selon l'une des revendications 1 à 3, dans lequel chaque réflexion
est caractérisée par un coefficient acoustique pour chaque fréquence dudit échantillonnage fréquentiel.
6. Encodeur ambisonique selon l'une des revendications 1 à 5, dans lequel les réflexions
sont représentées par des sources sonores virtuelles.
7. Encodeur ambisonique selon l'une des revendications 1 à 5, comprenant en outre une
logique de calcul des coefficients acoustiques, des délais et de la position de des
sources sonores virtuelles des réflexions, ladite logique de calcul étant configurée
pour calculer les coefficients acoustiques et les délais des réflexions en fonction
d'estimations d'une différence de distance parcourue par le son entre la position
de la source de l'onde sonore et une position estimée d'un utilisateur d'une part,
et d'une distance parcourue par le son entre les positions des sources sonores virtuelles
des réflexions et la position estimée de l'utilisateur d'autre part.
8. Encodeur ambisonique selon la revendication 7, dans lequel la logique de calcul des
coefficients acoustiques, des délais et des positions des sources sonores virtuelles
des réflexions, est en outre configurée pour calculer les coefficients acoustiques
des réflexions en fonction d'au moins un coefficient acoustique d'au moins un obstacle
à la propagation d'ondes sonores, sur lequel le son est réfléchi.
9. Encodeur ambisonique selon l'une des revendications 7 à 8, dans lequel la logique
de calcul des coefficients acoustiques, des délais et des positions des sources sonores
virtuelles des réflexions est configurée pour calculer des positions de sources sonores
virtuelles des réflexions comme des symétriques de la position de la source de l'onde
sonore par rapport à un plan tangent à un obstacle à la propagation d'ondes sonores.
10. Encodeur ambisonique selon l'une des revendications 1 à 9, dans lequel la logique
de calcul d'harmoniques sphériques de l'onde sonore et de la pluralité de réflexions
est en outre configurée pour calculer des harmoniques sphériques de l'onde sonore
et de la pluralité de réflexions à chaque fréquence de sortie du circuit de transformation
fréquentielle, ledit encodeur ambisonique comprenant en outre une logique de calcul
de coefficients binauraux de l'onde sonore, configurée pour calculer des coefficient
binauraux de l'onde sonore en multipliant à chaque fréquence de sortie du circuit
de transformation fréquentielle de l'onde sonore le signal de l'onde sonore par les
harmoniques sphériques de l'onde sonore et de la pluralité de réflexions à cette fréquence.
11. Encodeur ambisonique selon l'une des revendications 7 à 9, dans lequel la logique
de calcul des coefficients acoustiques, des délais et des positions des sources sonores
virtuelles des réflexions est configurée pour calculer des coefficients acoustiques
et des délais d'une pluralité de réflexions tardives.
12. Méthode d'encodage ambisonique d'onde sonore à pluralité de réflexions, comprenant
:
- une transformation fréquentielle (710) de l'onde sonore ;
- un calcul (720) d'harmoniques sphériques de l'onde sonore et de la pluralité de
réflexions à partir d'une position d'une source de l'onde sonore et de positions d'obstacles
à une propagation d'ondes sonores ;
- un filtrage (730), par une pluralité de logiques de filtrage dans le domaine fréquentiel,
des harmoniques sphériques de la pluralité de réflexions, chaque logique de filtrage
consistant en une atténuation et un délai d'une réflexion, et étant paramétrée par
un coefficient acoustique et un délai d'une réflexion;
- une addition (740) d'harmoniques sphériques de l'onde sonore et des sorties des
logiques de filtrage, en un ensemble d'harmoniques sphériques représentatives à la
fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel
- une multiplication dudit ensemble d'harmoniques sphériques représentatives à la
fois de l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel
par des valeurs d'intensité sonores de l'onde en sortie de la transformation fréquentielle,
afin d'obtenir un ensemble de coefficients ambisoniques (B00,B1-1,B10,B11,...,BMM) représentatifs à la fois de l'onde sonore et de la pluralité de réflexions.
13. Produit programme d'ordinateur comprenant des instructions de code de programme enregistrées
sur un support lisible par ordinateur pour l'encodage ambisonique d'onde sonore à
pluralité de réflexions, lesdites instructions de code de programme étant configurées
pour :
- effectuer une transformation fréquentielle de l'onde sonore ;
- calculer des harmoniques sphériques de l'onde sonore et de la pluralité de réflexions
à partir d'une position d'une source de l'onde sonore et de positions d'obstacles
à une propagation de l'onde sonore ;
- paramétrer une pluralité de logiques de filtrage dans le domaine fréquentiel recevant
en entrée des harmoniques sphériques de la pluralité de réflexions, chaque logique
de filtrage consistant en une atténuation et un délai d'une réflexion, et étant paramétrée
par un coefficient acoustique et un délai de ladite réflexion ;
- additionner des harmoniques sphériques de l'onde sonore et des sorties des logiques
de filtrage, en un ensemble d'harmoniques sphériques représentatives à la fois de
l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel ;
- multiplier ledit ensemble d'harmoniques sphériques représentatives à la fois de
l'onde sonore et de la pluralité de réflexions dans le domaine fréquentiel par des
valeurs d'intensité sonores de l'onde en sortie de la transformation fréquentielle,
afin d'obtenir un ensemble de coefficients ambisoniques (B00,B1-1,B10,B11,...,BMM) représentatifs à la fois de l'onde sonore et de la pluralité de réflexions ;
lorsque ledit programme fonctionne sur un ordinateur.
1. Ambisonic-Encoder (400) für eine Schallwelle (410) mit einer Mehrzahl von Reflexionen,
der Folgendes umfasst:
- eine Logik (420) zum Frequenztransformieren der Schallwelle;
- eine Logik (430) zum Berechnen von sphärischen Harmonischen der Schallwelle und
der Mehrzahl von Reflexionen auf der Basis einer Position einer Quelle der Schallwelle
und von Positionen von Hindernissen für eine Ausbreitung der Schallwelle;
- eine Mehrzahl (440) von Filterlogiken in der Frequenzdomäne, die am Eingang sphärische
Harmonische der Mehrzahl von Reflexionen empfangen, wobei jede Filterlogik aus einer
Dämpfung und einer Verzögerung einer Reflexion besteht und durch einen akustischen
Koeffizienten und eine Verzögerung der Reflexion parametrisiert ist;
- Logik (450) zum Summieren von sphärischen Harmonischen der Schallwelle und der Ausgänge
der Filterlogiken zu einem Satz von sphärischen Harmonischen, die sowohl für die Schallwelle
als auch für die Mehrzahl von Reflexionen in der Frequenzdomäne repräsentativ sind;
- eine Logik zum Multiplizieren des Satzes von sphärischen Harmonischen, die sowohl
für die Schallwelle als auch für die Mehrzahl von Reflexionen in der Frequenzdomäne
repräsentativ sind, mit Schallintensitätswerten der Welle am Ausgang der Frequenztransformation,
um einen Satz von ambisonischen Koeffizienten (B00,B1-1,B10,B11,...,BMM) zu erhalten, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen
repräsentativ sind.
2. Ambisonic-Encoder nach Anspruch 1, wobei die Logik zum Berechnen der sphärischen Harmonischen
der Schallwelle zum Berechnen der sphärischen Harmonischen der Schallwelle und der
Mehrzahl von Reflexionen auf der Basis einer festen Position der Quelle der Schallwelle
konfiguriert ist.
3. Ambisonic-Encoder nach Anspruch 1, wobei die Logik zum Berechnen von sphärischen Harmonischen
der Schallwelle zum iterativen Berechnen der sphärischen Harmonischen der Schallwelle
und der Mehrzahl von Reflexionen auf der Basis von aufeinanderfolgenden Positionen
der Quelle der Schallwelle konfiguriert ist.
4. Ambisonic-Encoder nach einem der Ansprüche 1 bis 3, wobei jede Reflexion durch einen
einzelnen akustischen Koeffizienten gekennzeichnet ist.
5. Ambisonic-Encoder nach einem der Ansprüche 1 bis 3, wobei jede Reflexion durch einen
akustischen Koeffizienten für jede Frequenz der Frequenzabtastung gekennzeichnet ist.
6. Ambisonic-Encoder nach einem der Ansprüche 1 bis 5, wobei die Reflexionen durch virtuelle
Schallquellen dargestellt werden.
7. Ambisonic-Encoder nach einem der Ansprüche 1 bis 5, der ferner eine Logik zum Berechnen
von akustischen Koeffizienten, Verzögerungen und der Position der virtuellen Schallquellen
der Reflexionen umfasst, wobei die Berechnungslogik zum Berechnen der akustischen
Koeffizienten und der Verzögerungen von den Reflexionen als eine Funktion von Schätzungen
einer Differenz zwischen der Schalllaufstrecke zwischen der Position der Quelle der
Schallwelle und einer geschätzten Position eines Benutzers einerseits und einer Schalllaufstrecke
zwischen den Positionen der virtuellen Schallquellen der Reflexionen und der geschätzten
Position des Benutzers andererseits konfiguriert ist.
8. Ambisonic-Encoder nach Anspruch 7, wobei die Logik zum Berechnen von akustischen Koeffizienten,
Verzögerungen und Positionen der virtuellen Schallquellen von Reflexionen ferner zum
Berechnen der akustischen Koeffizienten von Reflexionen als eine Funktion von mindestens
einem akustischen Koeffizienten von mindestens einem Hindernis für die Schallwellenausbreitung,
an dem der Schall reflektiert wird, konfiguriert ist.
9. Ambisonic-Encoder nach einem der Ansprüche 7 bis 8, wobei die Logik zur Berechnung
von akustischen Koeffizienten, Verzögerungen und Positionen von virtuellen Schallquellen
von Reflexionen zum Berechnen der Positionen von virtuellen Schallquellen von Reflexionen
als Symmetrien der Position der Quelle der Schallwelle in Bezug auf eine Ebene, die
ein Hindernis für die Schallwellenausbreitung tangiert, konfiguriert ist.
10. Ambisonic-Encoder nach einem der Ansprüche 1 bis 9, wobei die Logik zum Berechnen
von sphärischen Harmonischen der Schallwelle und der Mehrzahl von Reflexionen ferner
zum Berechnen von sphärischen Harmonischen der Schallwelle und der Mehrzahl von Reflexionen
bei jeder Ausgangsfrequenz der Frequenztransformationsschaltung konfiguriert ist,
wobei der Ambisonic-Encoder ferner eine Logik zum Berechnen von binauralen Koeffizienten
der Schallwelle umfasst, die zum Berechnen von binauralen Koeffizienten der Schallwelle
durch Multiplizieren, bei jeder Ausgangsfrequenz der Frequenztransformationsschaltung
der Schallwelle, des Schallwellensignals mit den sphärischen Harmonischen der Schallwelle
und den Mehrzahl von Reflexionen bei dieser Frequenz konfiguriert ist.
11. Ambisonic-Encoder nach einem der Ansprüche 7 bis 9, wobei die Logik zum Berechnen
von akustischen Koeffizienten, Verzögerungen und Positionen von den virtuellen Schallquellen
von den Reflexionen zum Berechnen von akustischen Koeffizienten und Verzögerungen
einer Mehrzahl von späteren Reflexionen konfiguriert ist.
12. Verfahren zur ambisonischen Encodierung einer Schallwelle mit einer Mehrzahl von Reflexionen,
das Folgendes umfasst:
- Frequenztransformieren (710) der Schallwelle;
- Berechnen (720) von sphärischen Harmonischen der Schallwelle und der Mehrzahl von
Reflexionen auf der Basis einer Position einer Quelle der Schallwelle und von Positionen
von Hindernissen für eine Schallwellenausbreitung;
- Filtern (730), durch eine Mehrzahl von Filterlogiken in der Frequenzdomäne, der
sphärischen Harmonischen der Mehrzahl von Reflexionen, wobei jede Filterlogik aus
einer Dämpfung und einer Verzögerung einer Reflexion besteht und durch einen akustischen
Koeffizienten und eine Verzögerung einer Reflexion parametrisiert wird;
- Addieren (740) von sphärischen Harmonischen der Schallwelle und der Ausgänge der
Filterlogiken zu einem Satz von sphärischen Harmonischen, die sowohl für die Schallwelle
als auch für die Mehrzahl von Reflexionen in der Frequenzdomäne repräsentativ sind;
- Multiplizieren des Satzes von sphärischen Harmonischen, die sowohl für die Schallwelle
als auch für die Mehrzahl von Reflexionen in der Frequenzdomäne repräsentativ sind,
mit Schallintensitätswerten der Welle am Ausgang der Frequenztransformation, um einen
Satz von ambisonischen Koeffizienten (B00,B1-1,B10,B11,...,BMM) zu erhalten, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen
repräsentativ sind.
13. Computerprogrammprodukt mit auf einem computerlesbaren Medium gespeicherten Programmcode-Befehlen
zum ambisonischen Encodieren von Schallwellen mit einer Mehrzahl von Reflexionen,
wobei die Programmcode-Befehle konfiguriert sind zum:
- Bewirken einer Frequenztransformation der Schallwelle;
- Berechnen von sphärischen Harmonischen der Schallwelle und der Mehrzahl von Reflexionen
auf der Basis einer Position einer Quelle der Schallwelle und von Positionen von Hindernissen
für eine Schallwellenausbreitung;
- Parametrisieren einer Mehrzahl von Filterlogiken in der Frequenzdomäne, die am Eingang
sphärische Harmonische der Mehrzahl von Reflexionen empfangen, wobei jede Filterlogik
aus einer Dämpfung und einer Verzögerung einer Reflexion besteht und durch einen akustischen
Koeffizienten und eine Verzögerung der Reflexion parametrisiert wird;
- Summieren der sphärischen Harmonischen der Schallwelle und Ausgänge der Filterlogiken
zu einem Satz von sphärischen Harmonischen, die sowohl für die Schallwelle als auch
für die Mehrzahl von Reflexionen in der Frequenzdomäne repräsentativ sind;
- Multiplizieren des Satzes von sphärischen Harmonischen, die sowohl für die Schallwelle
als auch für die Mehrzahl von Reflexionen in der Frequenzdomäne repräsentativ sind,
mit Schallintensitätswerten der Welle am Ausgang der Frequenztransformation, um einen
Satz von ambisonischen Koeffizienten (B00,B1-1, B10, B11,...,BMM) zu erhalten, die sowohl für die Schallwelle als auch für die Mehrzahl von Reflexionen
repräsentativ sind;
wenn das Programm auf einem Computer läuft.
1. An ambisonic encoder (400) for a sound wave (410) having a plurality of reflections,
comprising:
- a logic (420) for frequency transformation of the sound wave;
- a logic (430) for calculating spherical harmonics of the sound wave and of the plurality
of reflections on the basis of a position of a source of the sound wave and of positions
of obstacles to propagation of the sound wave;
- a plurality (440) of filtering logics in the frequency domain receiving, as input,
spherical harmonics of the plurality of reflections, each filtering logic consisting
of an attenuation and a delay of a reflection, and being parameterized by an acoustic
coefficient and a delay of said reflection;
- a logic (450) of adding spherical harmonics of the sound wave and outputs from the
filtering logics into a set of spherical harmonics representative of both the sound
wave and the plurality of reflections in the frequency domain;
- a multiplication logic of said set of spherical harmonics representative of both
the sound wave and the plurality of reflections in the frequency domain by sound intensity
values of the wave at the output of the frequency transformation to obtain a set of
ambisonic coefficients (B00, B1-1, B10, B11, ..., BMM) representative of both the sound wave and the plurality of reflections.
2. The ambisonic encoder according to claim 1, wherein the logic for calculating spherical
harmonics of the sound wave is configured to calculate the spherical harmonics of
the sound wave and of the plurality of reflections on the basis of a fixed position
of the source of the sound wave.
3. The ambisonic encoder according to claim 1, wherein the logic for calculating spherical
harmonics of the sound wave is configured to iteratively calculate the spherical harmonics
of the sound wave and of the plurality of reflections on the basis of successive positions
of the source of the sound wave.
4. The ambisonic encoder according to one of claims 1 to 3, wherein each reflection is
characterized by a unique acoustic coefficient.
5. The ambisonic encoder according to one of claims 1 to 3, wherein each reflection is
characterized by an acoustic coefficient for each frequency of the frequency sampling.
6. The ambisonic encoder according to one of claims 1 to 5, wherein the reflections are
represented by virtual sound sources.
7. The ambisonic encoder according to one of claims 1 to 5, further comprising a logic
for calculating the acoustic coefficients, the delays and the position of the virtual
sound sources of the reflections, the calculating logic being configured to calculate
the acoustic coefficients and the delays of the reflections according to estimates
of a difference in the distance traveled by the sound between the position of the
source of the sound wave and an estimated position both of a user and of a distance
traveled by the sound between the positions of the virtual sound sources of the reflections
and the estimated position of the user.
8. The ambisonic encoder according to claim 7, wherein the logic for calculating the
acoustic coefficients, the delays and the positions of the virtual sound sources of
the reflections is further configured to calculate the acoustic coefficients of the
reflections according to at least one acoustic coefficient of at least one obstacle
to the propagation of sound waves, off which the sound is reflected.
9. The ambisonic encoder according to one of claims 7 to 8, wherein the logic for calculating
the acoustic coefficients, the delays and the positions of the virtual sound sources
of the reflections is configured to calculate positions of virtual sound sources of
the reflections as inverses of the position of the source of the sound wave with respect
to a plane that is tangential to an obstacle to the propagation of sound waves.
10. The ambisonic encoder according to one of claims 1 to 9, wherein the logic for calculating
spherical harmonics of the sound wave and of the plurality of reflections is further
configured to calculate spherical harmonics of the sound wave and of the plurality
of reflections at each output frequency of the frequency transformation circuit, the
ambisonic encoder further comprising a logic for calculating binaural coefficients
of the sound wave, which logic is configured to calculate binaural coefficients of
the sound wave by multiplying, at each output frequency of the circuit for transforming
the frequency of the sound wave, the signal of the sound wave by the spherical harmonics
of the sound wave and of the plurality of reflections at this frequency.
11. The ambisonic encoder according to one of claims 7 to 9, wherein the logic for calculating
the acoustic coefficients, the delays and the positions of the virtual sound sources
of the reflections is configured to calculate acoustic coefficients and delays of
a plurality of late reflections.
12. A method for ambisonically encoding a sound wave having a plurality of reflections,
comprising:
- performing a frequency transformation (710) of the sound wave;
- calculating (720) spherical harmonics of the sound wave and of the plurality of
reflections on the basis of a position of a source of the sound wave and of positions
of obstacles to a propagation of sound waves;
- filtering (730), by a plurality of logics for filtering in the frequency domain,
spherical harmonics of the plurality reflections, each filtering logic consisting
of an attenuation and a delay of a reflection, and being parameterized by an acoustic
coefficient and a delay of a reflection;
- adding (740) spherical harmonics of the sound wave and the outputs from the filtering
logics, into a set of spherical harmonics representative of both the sound wave and
of the plurality of reflections in the frequency domain;
- multiplying said set of spherical harmonics representative of both the sound wave
and the plurality of reflections in the frequency domain by sound intensity values
of the wave at the output of the frequency transformation to obtain a set of ambisonic
coefficients (B00, B1-1, B10, B11, ..., BMM) representative of both the sound wave and the plurality of reflections.
13. A computer program product, comprising computer code instructions stored on a computer
readable medium for ambisonic encoding of sound waves with a plurality of reflections,
said computer code instructions being configured to:
- perform a frequency transformation of the sound wave;
- calculate spherical harmonics of the sound wave and of the plurality of reflections
on a basis of a position of a source of the sound wave and of positions of obstacles
to a propagation of sound waves;
- parameterize a plurality of logics for filtering in the frequency domain receiving,
as input, spherical harmonics of the plurality of reflections, each filtering logic
consisting of an attenuation and a delay of a reflection, and being parameterized
by an acoustic coefficient and a delay of said reflection;
- add spherical harmonics of the sound wave and outputs from the filtering logics,
into a set of spherical harmonics representative of both the sound wave and the plurality
of reflections in the frequency domain;
- multiply said set of spherical harmonics representative of both the sound wave and
the plurality of reflections in the frequency domain by sound intensity values of
the wave at the output of the frequency transformation to obtain a set of ambisonic
coefficients (B00, B1-1, B10, B11, ..., BMM) representative of both the sound wave and the plurality of reflections;
when said program runs on the computer.