Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/332523
Type: DISSERTAÇÃO DIGITAL
Degree Level: Mestrado
Title: Efeito da reverberação na inteligibilidade e na identificação acústica de indivíduos
Title Alternative: The effect of reverberation in intelligibility and speaker
Author: Alcântara, Raoni Luar de Freitas, 1989-
Advisor: Masiero, Bruno Sanches, 1981-
Abstract: Resumo: Nessa Dissertação, é estudado o impacto do efeito da reverberação em sistemas de identificação de locutor com casamento e descasamento de reverberações entre treinamento e teste. No desenvolvimento do trabalho, uma análise do efeito é realizada a partir das medidas espectrograma, cocleograma, INS (índice de não-estacionariedade) e distância Bhattacharyya do sinal de voz reverberado em diferentes condições. O estudo mostrou que o aumento do valor de RT60 em uma sala causa uma diminuição da não-estacionariedade do sinal de voz reverberado. Em seguida, experimentos com medidas objetivas indicam como a reverberação é capaz de degradar a inteligibilidade do sinal de voz e que a utilização de máscaras acústicas pode atenuar estes efeitos. Por fim, é proposto o emprego de máscaras acústicas para identificação de locutor em ambientes com reverberação. Experimentos de identificação de locutor indicaram que o uso de máscaras acústicas melhora os resultados de identificação para casamento de reverberação entre treinamento e teste. Também foi proposta a utilização do atributo acústico GFCC (Gammatone Frequency Cepstral Coefficients) e do classificador alfa-GMM para a identificação de locutor com reverberação. Estas técnicas se mostraram eficazes em recuperar as taxas de acerto em casos de descasamento de reverberação em uma mesma sala

Abstract: This work presents a study about the effect of reverberation in speaker identification systems with mismatch between training and testing phases. Spectrograms, cochleograms INS (Index of Non-Stationarity) and the Bhattacharyya distance are used to analyze the reverberated speech signal under several conditions. This study show that an improvent in RT60 in a room can reduce the non-stationarity of the reverberated speech. Also, objective measures indicate that reverberation degrades speech intelligibility, that can be improved by binary masks, that are are proposed to improve speaker identification systems under reverberant conditions. Results show that the technique improved the identification rates for reverberation matches between training and testing. The classifier alfa-GMM and the acoustic feature GFCC (Gammatone Frequency Cepstral Coefficients) are also proposed in this work for speaker identification in reverberant conditions. Those techniques were capable of improve the correct rates under reverberation mismatch in a room
Subject: Fala - Inteligibilidade
Acústica
Language: Português
Editor: [s.n.]
Date Issue: 2018
Appears in Collections:FEEC - Tese e Dissertação

Files in This Item:
File SizeFormat 
Alcantara_RaoniLuarDeFreitas_M.pdf5.51 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.