import numpy as np
from matplotlib import pyplot as plt

# A compléter
# Développement de la fonction de padding
def padding(signal,M):
    """
    Fonction de padding du signal pour l'agrandir à la taille M (si M supérieur à len(signal))
    signal : tableau 1D Numpy, représentant un signal
    M : entier, représentat la taille de padding attendue pour M
    """
    if M<=len(signal):
        return signal
    out = np.zeros((M),dtype=signal.dtype)
    out[:len(signal)] = signal
    return out

# Tests unitaires de la fonction de padding
x = np.array([1,3,7,2,5,6,6,8,1])
print(f"Padding de x avec M = 15 : {'OK' if ((len(padding(x,15))==15) & (padding(x,15)==np.array([1,3,7,2,5,6,6,8,1,0,0,0,0,0,0]))).all() else 'KO'}")
print(f"Padding de x avec M = 1 (aucun padding attendu) : {'OK' if ((len(padding(x,1))==len(x)) & (padding(x,1)==x).all()) else 'KO'}")
print(f"Padding de x avec M = len(x) (aucun padding attendu) : {'OK' if ((len(padding(x,len(x)))==len(x)) & (padding(x,len(x))==x).all()) else 'KO'}")

Padding de x avec M = 15 : OK
Padding de x avec M = 1 (aucun padding attendu) : OK
Padding de x avec M = len(x) (aucun padding attendu) : OK

# A compléter
# Développement d'une fonction qui décale un signal d'un pas de décalage S.
def shift(x, S):
    """
    Effectue un décalage de S sur le signal x
    x : tableau 1D NumPy, représentant un signal
    S : entier, représentant le pas de décalage à effectuer
    """
    # Récupération taille de x
    len_x = len(x)

    # Création du tableau 1D y, de taille len(x) + abs(S), remplis de zéro
    y = np.zeros((len_x+abs(S)))

    # Deux cas : S positif ou S négatif
    if S>0:
        # Cas S positif : on insère les valeurs de x à la fin de y
        y[-len_x:] = x
        # On retourne les len_x premières valeurs de y
        return y[:len_x]
    else:
        # Cas S négatif : on insères les valeurs de x au début de y
        y[:len_x] = x
        # On retourne les len_x dernières valeurs de y
        return y[-len_x:]

# Tests unitaires de la fonction de décalage
x = np.array([1,3,7,2,5,6,6,8,1])
print(f"Décalage de x avec S = 2 : {'OK' if (shift(x,2)==np.array([0,0,1,3,7,2,5,6,6])).all() else 'KO'}")
print(f"Décalage de x avec S = -5 : {'OK' if (shift(x,-5)==np.array([6,6,8,1,0,0,0,0,0])).all() else 'KO'}")
print(f"Décalage de x avec S = 0 : {'OK' if (shift(x,0)==x).all() else 'KO'}")
print(f"Décalage de x avec S = 20 : {'OK' if (shift(x,20)==np.array([0,0,0,0,0,0,0,0,0])).all() else 'KO'}")

Décalage de x avec S = 2 : OK
Décalage de x avec S = -5 : OK
Décalage de x avec S = 0 : OK
Décalage de x avec S = 20 : OK

# Développement de la fonction de calcul du score d'intercorrélation entre deux signaux à un décalage S fixé
def score_correlate(f,g,S,Te):
    """
    Calcule le score d'intercorrélation entre le signal f retardé de S et le signal g 
    f, g : tableaux NumPy 1D, signaux à corréler
    S : entier, retard du signal f
    Te : le temps d'échantillonage (en secondes)
    """
    
    # Padding des signaux pour qu'ils soient à la même taille
    len_f, len_g = len(f), len(g)
    f = padding(f,len_g)
    g = padding(g,len_f)
    
    # Décalage de f de S pas
    f_decale = shift(f,S)
    
    return np.dot(f_decale,np.conjugate(g)) * Te

# A compléter
# Fonction de corrélation entre les signaux f et g avec un pas d'échantillonage de Te
def correlation(f,g,Te):
    
    # Création du vecteur des différents shifts possibles où f et g ont un recouvrement
    S_vals = np.arange((-len(f)+1),len(g))
    
    # Calcul des retards tau possibles en fonction de S_vals et du pas d'échantillonage T_e
    tau_vals = S_vals * Te
       
    #for i in progressbar(range(len(tau_vals))):
    scores_corr = np.array([score_correlate(f,g,s,Te) for s in S_vals])
        
    return tau_vals, scores_corr

# A compléter
# Création des deux signaux

T = 2
Te=0.01

tA = np.arange(0,2,Te)
tB = np.arange(0,10,Te)

A = (tA<=1).astype(float)
B = (np.abs(tB%T)>T/2).astype(float)

plt.plot(tA,A,label='signal A(t)')
plt.plot(tB,B,label='signal B(t)')
plt.legend()
plt.tight_layout()
plt.show()

# A compléter
# Calcul de la corrélation entre A et B
tau_vals, A_B_correlation = correlation(A,B,Te)

plt.plot(tau_vals,A_B_correlation)
plt.show()

# A compléter
# Récupération des valeurs de tau où la corrélation est maximum
max_correlation = A_B_correlation.max()
tau_max_correlation = tau_vals[A_B_correlation==max_correlation]
print(tau_max_correlation)

[0.99 1.   1.01 2.99 3.   3.01 4.99 5.   5.01 6.99 7.   7.01 8.99 9.
 9.01]

# A compléter
# Calcul de la corrélation entre A et B via la fonction correlate de NumPy
A_B_correlation_numpy = np.correlate(B,A,'full')*Te

# Affichage du résultat
# Ici, on réutilise tau_vals, car la fonction de NumPy n'a pas l'information du taux d'échantillonage
plt.plot(tau_vals,A_B_correlation,label='Notre corrélation')
plt.plot(tau_vals,A_B_correlation_numpy, label='Corrélation NumPy')
plt.legend()
plt.tight_layout()
plt.show()

# A compléter
# Ajout d'une valeur aberrante à B(t)
B_bruite = B.copy()
B_bruite[tB==4.5]=100

# Calcul de la corrélation entre A et B avec la valeur aberrante
tau_vals, A_B_correlation_bruite = correlation(A,B_bruite,Te)

plt.plot(tau_vals,A_B_correlation_bruite)
plt.show()

# Développement de la fonction de calcul du score d'intercorrélation entre deux signaux à décalage S fixé
def score_ZNCC(f,g,s):
    """
    Calcule le score de ZNCC entre le signal f retardé de s et le signal g 
    f, g : tableaux NumPy 1D, signaux à corréler
    s : entier, retard du signal f
    """
    
    # Padding des signaux pour qu'ils soient à la même taille
    len_f, len_g = len(f), len(g)
    f = padding(f,len_g)
    g = padding(g,len_f)
    
    # Décalage de f de S pas
    f_decale = shift(f,s)
    
    # On calcule la corrélation uniquement sur l'intersection entre les deux signaux dans le temps
    index_min = max(0,s)
    index_max = min(len_f+s,len_g)
    
    f_decale = f_decale[index_min:index_max]
    g = np.conjugate(g[index_min:index_max])

    # On renvoit 0 si la taille de l'intersection est inférieur
    if (len(f_decale)<min(len_f,len_g)/4):
        return 0

    # On retire la moyenne aux deux signaux
    f_decale -= np.mean(f_decale)
    g -= np.mean(g) 
    
    # On calcule le score de corrélation et on divise par les normes de g et f
    # Afin d'éviter que les normes de g et f soient à zéro et donc que le dénominateur soit nul, on place chaque norme au minimum à epsilon = 1e-12
    return np.dot(f_decale,g) / (max(np.linalg.norm(g),1e-12) * max(np.linalg.norm(f_decale),1e-12))

# A compléter
# Fonction de ZNCC entre les signaux f et g avec un pas d'échantillonage de Te
def ZNCC(f,g,Te):
       
    # Création du vecteur des différents shifts possibles où f et g ont un recouvrement
    S_vals = np.arange((-len(f)+1),len(g))
    
    # Calcul des retards tau possibles en fonction de S_vals et du pas d'échantillonage T_e
    tau_vals = S_vals * Te
       
    #for i in progressbar(range(len(tau_vals))):
    scores_corr = np.array([score_ZNCC(f,g,s) for s in S_vals])
        
    return tau_vals, scores_corr

# A compléter
# Calcul de la corrélation entre A et B
tau_vals, A_B_ZNCC = ZNCC(A,B,Te)

plt.plot(tau_vals,A_B_ZNCC)
plt.show()

# A compléter
# Récupération des valeurs de tau où la corrélation est maximum
max_ZNCC = A_B_ZNCC.max()
tau_max_ZNCC = tau_vals[A_B_ZNCC==max_ZNCC]
print(tau_max_ZNCC)

# Récupération des valeurs de tau où la corrélation est minimum
min_ZNCC = A_B_ZNCC.min()
tau_min_ZNCC = tau_vals[A_B_ZNCC==min_ZNCC]
print(tau_min_ZNCC)

[1. 3. 5. 7.]
[0. 2. 4. 6. 8.]

# A compléter
# Calcul de ZNCC entre A et B avec la valeur aberrante
tau_vals, A_B_ZNCC_bruite = ZNCC(A,B_bruite,Te)

plt.plot(tau_vals,A_B_ZNCC_bruite)
plt.show()

import IPython

IPython.display.Audio('tag.wav')

# A compléter
# Chargement de l'extrait audio
from scipy.io import wavfile

freq_tag, extrait_tag = wavfile.read("tag.wav")

print(f"Fréquence d'échantillonage du tag audio : {freq_tag} Hz")

Fréquence d'échantillonage du tag audio : 8000 Hz

# A compléter
# Reconstruction de l'axe temporel
t_extrait_tag = np.arange(0, len(extrait_tag)/freq_tag, 1/freq_tag)

# Tracé du signal audio
plt.plot(t_extrait_tag, extrait_tag)
plt.title("Tag audio")
plt.show()

# A compléter
# Chargement de l'extrait audio music_1
freq_musique, extrait_musique = wavfile.read("music_1.wav")

# Reconstruction de l'axe temporel
t_musique = np.arange(0,len(extrait_musique)/freq_musique, 1/freq_musique)

# Affichage du signal
plt.plot(t_musique,extrait_musique)
plt.show()

# A compléter
# Calcul de ZNCC pour le tag audio et l'extrait musical
tau_vals, ZNCC_music_1 = ZNCC(extrait_tag.astype(float),extrait_musique.astype(float),1/freq_tag)

# Affichage du score ZNCC en fonction du retard tau
plt.plot(tau_vals,ZNCC_music_1)
plt.show()

# A compléter
# Récupération du tau optimal
best_tau = tau_vals[ZNCC_music_1.argmax()]
print(f"Tau optimal : {best_tau}")

Tau optimal : 1.4953750000000001

# A compléter
# Extraction de l'audio avec le meilleur score ZNCC
indice_tau_t_musique = np.argwhere(t_musique==best_tau)[0][0]
best_extrait_music_1 = extrait_musique[indice_tau_t_musique:indice_tau_t_musique+len(t_extrait_tag)]

# A compléter
# Export du meilleur extrait en fichier WAV
wavfile.write("best_extrait_music_1.wav",freq_musique,best_extrait_music_1)

IPython.display.Audio('best_extrait_music_1.wav')

# A compléter
# Chargement des extraits audios
freq_musique_2, extrait_musique_2 = wavfile.read("music_2.wav")
freq_musique_3, extrait_musique_3 = wavfile.read("music_3.wav")
freq_musique_4, extrait_musique_4 = wavfile.read("music_4.wav")
freq_musique_5, extrait_musique_5 = wavfile.read("music_5.wav")

# Reconstruction des axes temporels
t_musique_2 = np.arange(0,len(extrait_musique_2)/freq_musique_2, 1/freq_musique_2)
t_musique_3 = np.arange(0,len(extrait_musique_3)/freq_musique_3, 1/freq_musique_3)
t_musique_4 = np.arange(0,len(extrait_musique_4)/freq_musique_4, 1/freq_musique_4)
t_musique_5 = np.arange(0,len(extrait_musique_5)/freq_musique_5, 1/freq_musique_5)

# Affichage des signaux
plt.subplots(2,2,figsize=(10,7))
plt.subplot(221)
plt.plot(t_musique_2,extrait_musique_2)
plt.title("Extrait n°2")
plt.subplot(222)
plt.plot(t_musique_3,extrait_musique_3)
plt.title("Extrait n°3")
plt.subplot(223)
plt.plot(t_musique_4,extrait_musique_4)
plt.title("Extrait n°4")
plt.subplot(224)
plt.plot(t_musique_5,extrait_musique_5)
plt.title("Extrait n°5")
plt.tight_layout()
plt.show()

# Calcul de ZNCC pour le tag audio et les différents extraits musicaux (assez long...)
tau_vals_2, ZNCC_music_2 = ZNCC(extrait_tag.astype(float),extrait_musique_2.astype(float),1/freq_tag)
tau_vals_3, ZNCC_music_3 = ZNCC(extrait_tag.astype(float),extrait_musique_3.astype(float),1/freq_tag)
tau_vals_4, ZNCC_music_4 = ZNCC(extrait_tag.astype(float),extrait_musique_4.astype(float),1/freq_tag)
tau_vals_5, ZNCC_music_5 = ZNCC(extrait_tag.astype(float),extrait_musique_5.astype(float),1/freq_tag)

# Affichage des scores ZNCC en fonction du retard tau
plt.subplots(2,2,figsize=(10,7))
plt.subplot(221)
plt.plot(tau_vals_2,ZNCC_music_2)
plt.title("ZNCC extrait n°2")
plt.subplot(222)
plt.plot(tau_vals_3,ZNCC_music_3)
plt.title("ZNCC extrait n°3")
plt.subplot(223)
plt.plot(tau_vals_4,ZNCC_music_4)
plt.title("ZNCC extrait n°4")
plt.subplot(224)
plt.plot(tau_vals_5,ZNCC_music_5)
plt.title("ZNCC extrait n°5")
plt.tight_layout()
plt.show()

Traitement du Signal - TP2 : Corrélation de signaux¶

Exercice 1 : Commençons par développer la fonction...¶

Exercice 2 : ZNCC is the new correlation¶

Exercice 3 : Où est caché DJ Khaled ?¶