voip quality enhancement with wideband extension method in broadband networks

5
Abstract— Voice over Internet Protocol (VoIP) is one of the most important technologies in the world of communication. In this work, end-users connect via ADSL modem to broadband IP network and a variety of multimedia services utilized in this network. VoIP is the most important services in the broadband network and attempts focused on improving quality of voice in VoIP toward the quality of voice in PSTN. Perceived voice quality is an important function in VoIP applications. The main aim is to find an efficient speech enhancement method for perceptual optimization of voice quality. In this work, use band- width extension (BWE) method to estimate wideband envelope and improve quality and intelligibility. This method applies to some common codecs (e.g. G.711/ G.726/ G.729/ iLBC, speex) and then evaluates quality with ITU P.862.2 (wideband PESQ). Simulation takes under both low packet loss conditions and non packet loss conditions. The results illustrate that the BWE algorithm can achieve reliable perceived voice quality in comparison with the previous condition. Keywords— VoIP, Bandwidth Extension, Voice Codec, Quality Improvement, Broadband Network. I. INTRODUÇÃO l crecimiento rápido del Protocolo de Internet (IP) basó las redes y el acceso ofrecido de red de banda anchas con un precio bajo ha dirigido muchos intereses hacia los servicios Voz sobre IP (VoIP). VoIP es simplemente una manera para hacer llamadas telefónicas vía internet. Es decir VoIP transmite el sígnalo de la voz vía una unidad de información cambiada y basada en la red en la cual las unidades de información de la voz pueden escoger el camino más eficaz. En este artículo, la red principal usada es una red de banda ancha que diseñó para la multimedia, la aplicación de la transmisión como VoIP. La cuestión más importante en una red de VoIP es la calidad del sígnalo de la voz. Por los avances tecnológicos durante años, la comunicación tradicional de la voz sobre PSTN está caracterizada por alta calidad, a menudo referida como la calidad toll. En las redes VoIP , la calidad de la voz está afectada por dos factores. Primero la calidad de los servicios (QoS) y el segundo códec de la voz. Las averías de QoS en una red de VoIP son el retraso y jitter. VoIP está principalmente averiada por el retraso largo lado-a-lado. En general el retraso de las redes de VoIP pueden F. Mousavipour, Universidad Shahab Danesh, Qom, Iran, [email protected] M. J. Khosravipour, Universidad Sáciense Tecnologica Nacional, Tehran, Iran, [email protected] aumentar por dos factores: (a) cuando se comunican dos códec distintos de la voz. (b) cuando el usuario reside detrás de un Gateway residencial. En [1-2] ITU-T y ETSI se recomienda algunos límites de retrasos para las conexiones de VoIP. Jitter es el resultado de la congestión de la red y alineamiento inoportuno. Por la parte del remitente, las unidades de información de la voz están transmitidas en un ritmo constante, mientras en otro lado, las unidades de información pueden recibirse en un ritmo desigual. Los valores de jitter entre 30 y 75ms también pueden estar admitidos. El retraso lado-a-lado y jitter causan la falta de las unidades de información. En una red de VoIP los datos del discurso están segmentados en márgenes y cada margen está empaquetado para la transmisión sobre la red. Si el retraso y jitter son más que la limitación, la falta de las unidades de información ocurre. Los códec trabajan bajo tres condiciones: banda ancha, banda estrecha y banda ultra ancha. Los sistemas tradicionales del cambio transmiten los sígnalos de la voz usando solamente una banda estrecha de códec G.711(PCM). En una red de VoIP con la banda ancha o ultra ancha los códec pueden usarse, PSTN impuso la condición de códec de la banda estrecha en la red de VoIP. Recientes estudios han discutido sobre los métodos de estimar los datos perdidos y esconderlos. Estos métodos normalmente compensan la calidad de la voz pero tienen un costo elevado creciente por más retraso. Se puede considera que la red es un red de banda ancha que los usuarios conectan a través de un modem ADSL a la red IP. La manera en la cual la red IP conecta con la red PSTN es un Gateway. Figura 1. La arquitectura basica de voip. F. Mousavipour and M. J. Khosravipour VoIP Quality Enhancement with Wideband Extension Method in Broadband Networks E 1190 IEEE LATIN AMERICA TRANSACTIONS, VOL. 10, NO. 1, JAN. 2012

Upload: mohammad-javad

Post on 11-Dec-2016

213 views

Category:

Documents


1 download

TRANSCRIPT

Abstract— Voice over Internet Protocol (VoIP) is one of the most important technologies in the world of communication. In this work, end-users connect via ADSL modem to broadband IP network and a variety of multimedia services utilized in this network. VoIP is the most important services in the broadband network and attempts focused on improving quality of voice in VoIP toward the quality of voice in PSTN. Perceived voice quality is an important function in VoIP applications. The main aim is to find an efficient speech enhancement method for perceptual optimization of voice quality. In this work, use band-width extension (BWE) method to estimate wideband envelope and improve quality and intelligibility. This method applies to some common codecs (e.g. G.711/ G.726/ G.729/ iLBC, speex) and then evaluates quality with ITU P.862.2 (wideband PESQ). Simulation takes under both low packet loss conditions and non packet loss conditions. The results illustrate that the BWE algorithm can achieve reliable perceived voice quality in comparison with the previous condition.

Keywords— VoIP, Bandwidth Extension, Voice Codec, Quality Improvement, Broadband Network.

I. INTRODUÇÃO

l crecimiento rápido del Protocolo de Internet (IP) basó las redes y el acceso ofrecido de red de banda anchas con

un precio bajo ha dirigido muchos intereses hacia los servicios Voz sobre IP (VoIP). VoIP es simplemente una manera para hacer llamadas telefónicas vía internet. Es decir VoIP transmite el sígnalo de la voz vía una unidad de información cambiada y basada en la red en la cual las unidades de información de la voz pueden escoger el camino más eficaz.

En este artículo, la red principal usada es una red de banda ancha que diseñó para la multimedia, la aplicación de la transmisión como VoIP.

La cuestión más importante en una red de VoIP es la calidad del sígnalo de la voz. Por los avances tecnológicos durante años, la comunicación tradicional de la voz sobre PSTN está caracterizada por alta calidad, a menudo referida como la calidad toll.

En las redes VoIP , la calidad de la voz está afectada por dos factores. Primero la calidad de los servicios (QoS) y el segundo códec de la voz.

Las averías de QoS en una red de VoIP son el retraso y jitter. VoIP está principalmente averiada por el retraso largo lado-a-lado. En general el retraso de las redes de VoIP pueden

F. Mousavipour, Universidad Shahab Danesh, Qom, Iran,

[email protected] M. J. Khosravipour, Universidad Sáciense Tecnologica Nacional, Tehran,

Iran, [email protected]

aumentar por dos factores: (a) cuando se comunican dos códec distintos de la voz. (b) cuando el usuario reside detrás de un Gateway residencial.

En [1-2] ITU-T y ETSI se recomienda algunos límites de retrasos para las conexiones de VoIP.

Jitter es el resultado de la congestión de la red y alineamiento inoportuno. Por la parte del remitente, las unidades de información de la voz están transmitidas en un ritmo constante, mientras en otro lado, las unidades de información pueden recibirse en un ritmo desigual. Los valores de jitter entre 30 y 75ms también pueden estar admitidos.

El retraso lado-a-lado y jitter causan la falta de las unidades de información. En una red de VoIP los datos del discurso están segmentados en márgenes y cada margen está empaquetado para la transmisión sobre la red. Si el retraso y jitter son más que la limitación, la falta de las unidades de información ocurre.

Los códec trabajan bajo tres condiciones: banda ancha, banda estrecha y banda ultra ancha. Los sistemas tradicionales del cambio transmiten los sígnalos de la voz usando solamente una banda estrecha de códec G.711(PCM).

En una red de VoIP con la banda ancha o ultra ancha los códec pueden usarse, PSTN impuso la condición de códec de la banda estrecha en la red de VoIP.

Recientes estudios han discutido sobre los métodos de estimar los datos perdidos y esconderlos. Estos métodos normalmente compensan la calidad de la voz pero tienen un costo elevado creciente por más retraso.

Se puede considera que la red es un red de banda ancha que los usuarios conectan a través de un modem ADSL a la red IP. La manera en la cual la red IP conecta con la red PSTN es un Gateway.

Figura 1. La arquitectura basica de voip.

F. Mousavipour and M. J. Khosravipour

VoIP Quality Enhancement with Wideband Extension Method in Broadband Networks

E

1190 IEEE LATIN AMERICA TRANSACTIONS, VOL. 10, NO. 1, JAN. 2012

En tal red, las unidades de información de VoIP están transmitidas vía un cambio de la unidad de información que basaron red de banda ancha en el cual las unidades de información de la voz pueden escoger el camino más eficaz. Red de banda ancha transmite el trafico del dato y típicamente lleva a cabo eficazmente esta tarea.

El cálculo de la calidad es ITU-T P.862.1 y ITU-T P.862.2 que están referidos a la banda estrecha PESQ y la banda ancha PESQ [6-7]. La banda ancha PESQ está solamente usada para el modelo de la escucha de la banda ancha.

II. CÓDECS DE VOZ

Los códecs de voz son los algoritmos que permiten al sistema llevar la voz análoga sobre líneas digitales. Hay varios códecs, que varían en complejidad, exigencia de amplitud de banda y calidad de voz. La mayoría de los sistemas PSTN domésticos funcionan con la voz probada en el esquema de cuantificación no lineal de 8 kilohercios y de 8 trozos según [8], que codifica en 64 kb/s. Hay algunos códecs de voz conocidos, clasificados en tres categorías. A saber, códecs de banda estrecha que funcionan en señales de audio filtradas a una variedad de frecuencia de 300 a 3400 Hz y probado en 8 kilohercios, códecs de banda ancha que funcionan en señales de audio filtradas a una variedad de frecuencia de 50 a 7000 Hz, y probado en 16 kilohercios y códecs de multimodo que pueden funcionar en señales de banda ancha o en banda estrecha. En estos códecs de banda estrecha de papel y códecs de multimodo usados.

A. Códecs de Banda estrecha G.711 El G.711 es un esquema PCM que produce un valor de 8

trozos cada 125 µ s, causando un 64 flujo de bit kb/s. Este estándar tiene dos formas, µ - ley y A-ley. La forma de A-ley se convierte las muestras de PCM lineales de 13 trozos de largo en 8 trozos comprimieron muestras de PCM en el codificador, y el decodificador realiza la conversión viceversa.

G.726 Este códec desarrollado después de G.723 y descarte esto.

Esto trabaja en 4 tasa de bitss, es decir, 16, 24, 32, 40 kb/s. Con este trabajo 40 kb/s tasa de bits solían ganar la calidad fina. El G.726 es un discurso de forma de onda coder que usa la Modulación por Impulsos Codificados Diferencial Adaptable (ADPCM) y tiene la complejidad muy baja la menos de 1 tardanza de códec y MIP es igual a G.711. Esto también es el códec estándar usado en sistemas telefónicos inalámbricos DECT.

G.729 El códec G.729 permite que el relleno de más entre a la

amplitud de banda limitada [10]. El algoritmo básico de G.729 usa la estructura conjugada el código algebraico excitó la predicción lineal (CS-ACELP) algoritmo que corre en 8 kb/s. En la esencia, esto contiene un módulo VAD y un módulo

DTX que actualiza parámetros del ruido de fondo durante períodos de silencio.

iLBC El iLBC denota el Internet Bajo Códec de tasa de bits y es

un códec de discurso de banda estrecha sin derechos, desarrollado por el Sonido de IP global (GIPS) [11]. Este códec es usado en algunas aplicaciones famosas como: Skype, Conversación de Google, Se abren Wengo. EliLBC usa 30 longitud de marco de Sra. en 13.33 kb/s. Este códec usa un algoritmo LPC independiente de bloque. El hecho de codificar cada bloque de muestras independientemente de los anteriores hace este códec resistente para enmarcar pérdidas.

B. Códecs de multimodo Speex El códec de Speex es un formato de compresión de audio

sin patente de la Fuente Abierto diseñado para el discurso [12]. El Speex es principalmente diseñado para tres velocidades de muestreo diferentes: 8, 16 y 32 kilohercios. Su modo de banda estrecha está basado en CELP y es el diseño para comprimir la voz en untasa de bits de 15 kb/s. Esto es también uno de los pocos códecs que pueden cambiar su tasa de bits dinámicamente, en cualquier momento. El Speex también emplea la ocultación de pérdida de paquete, que lo hace un candidato interesante por el ambiente inalámbrico.

La Fig. 2 muestra la comparación entre el resultado de MOS de códecs mencionados. Con este trabajo, la base de datos de discurso de referencia fue tomada del ITU-T dataset [13]. Estas muestras fueron abajo probadas a 8 kilohercios sin la pérdida de paquete y luego la evaluación de calidad fue realizada. Nuestro método de evaluación objetivo es PESQ-MOS para el discurso de señal de banda estrecha.

Para los susodichos códecs de discurso, los resultados

femeninos y machos fueron comparados para evaluar la interpretación de algoritmo. Con este trabajo, los resultados muestran que ninguna diferencia clara existe entre ellos.

Figura 2. Codecs MOS (Hombre, Mujer, Medio).

3.2

3.3

3.4

3.5

3.6

3.7

3.8

3.9

4

4.1

4.2

G.726 G.729 iLBC speex G.711

N-B

-PE

SQ

Male

Female

Average

MOUSAVIPOUR AND KHOSEAVIPOUR : VOIP QUALITY ENHANCEMENT WITH 1191

La Fig. 2 muestra que tanteos machos y femeninos son cercanos juntos. El G.711 y speex (4 superiores) tienen el mejor resultado mientras G.726 tiene el resultado peor (cerca 3.6). Una puntuación promedio fue obtenida por hacer un promedio sobre todas las muestras de discurso (unas 16 muestras totales, consista en 8 machos y 8 hembras).

III. EFECTO DE PÉRDIDA DE PAQUETE

En esta sección, el efecto de pérdida de paquete en la calidad de voz es contemplado. La pérdida de paquete representa significativo métrico. La pérdida de paquete puede ocurrir debido a muchos motivos. Un paquete puede ser perdido debido a la congestión en la red de IP, es decir, un gestor de tráfico es inundado de un número enorme de paquetes que esto no puede manejar. Un paquete también puede desechar en el destino, por ejemplo, cuando un paquete llega demasiado tarde para ser llevado a su fin. Las pautas típicas para el precio de pérdida de paquete son el 3 % o menos [14].

La pérdida de paquete puede ocurrir cuando la señal original codificada y quiere transmitir sobre la red pero no puede. En el lado de receptor, los paquetes perdidos pueden ser perjudicados la calidad de códecs de voz descifrados. Los sistemas de VoIP pueden emplear su propia ocultación de pérdida de paquete como: réplica de paquete o substitución de silencio.

Un sistema VoIP puede ser configurado en varios modos de unión respectivamente: ordenador personal a ordenador personal, Telefonía a Telefonía y ordenador personal a Telefonía. Además, la telefonía puede ser el tipo digital o un tipo análogo.

Con este trabajo, un precio de pérdida de paquete fue generado del 0 % al 3 %, en un paso incremental del 1 % con PESQ de banda estrecha, el resultado también incluyó para la comparación. La Fig. 3 muestra el resultado de PESQ de los códecs en condiciones de pérdida de paquete bajas. La calidad G.711 es el más afectado mientras hay la menor parte de impacto en la interpretación speex. En este paquete de papel la ocultación de pérdida no es usada para ningún códec .

Figura 3. Codecs qualidad frente de a la tasa de perdida de paquetes.

Cuando señal original codificada en codificador y luego transmitiendo sobre la red. Después de Que los paquetes de IP pasan el codificador, la pérdida de paquete puede ser ocurrida.

En el plomo de pérdida de paquete de lado de receptor a la calidad de daño de la voz descifrada los .Codecs emplean su propia ocultación de pérdida de paquete como: réplica de paquete o substitución de silencio.

El G.726 tiene un resultado bajo cerca 3.6 para ninguna condición de pérdida de paquete y con su calidad degradó hasta más cuando hay pérdida de paquete. Los resultados adicionales no hacen el resultado de G.726 contenido debido a la calidad baja de este códec.

El speex tiene la interpretación eficaz en la condición de pérdida de paquete baja, sin embargo si el precio de pérdida de paquete es más del 5 %, la calidad de este códec es afectada más que otros códecs.

Algunos Códecs como G.711 y G.726 son la muestra basada que cada muestra en la red de banda ancha. Otros códecs como iLBC y speex son el marco basado. Este significa la señal de discurso segmentada a 20 o 30 marcos de Sra. y luego codificado. Si la pérdida arbitraria se aplicara a cada muestra, el daño es la pérdida de marco bastante arbitraria demasiado eficaz.

IV. MÉTODO DE EXTENSIÓN DE ANCHURA DE CINTA

es producir el discurso de banda ancha del discurso de telefonía de banda estrecha porque se conoce que la banda ancha parece más natural y es generalmente preferida. El trabajo reciente ha mostrado que este es factible [15]. Nuestro objetivo es un método que no confía en la formación de modo que el algoritmo sea robusto a la variación en condiciones de canal. Al mismo tiempo un sistema con la complejidad baja es deseable.

Figura 4. ancho de banda tipica de systema de extencion.

Un sistema típico es mostrado en la Fig. 4. Ya que la cinta

baja ya existe, la señal de entrada tiene que ser retrasada antes de que pueda ser combinado con una señal de banda ancha sintetizada.

Por su parte la señal de band ancha es típicamente creada generando una señal de banda ancha en primer lugar y luego usando sólo la porción ancha de esta señal sintética. La mayor parte de técnicas de extensión de amplitud de banda usan el libro de códigos que traza un mapa de métodos para la extracción de las cintas ausentes de la información disponible. Los parámetros del sobre espectral ausente y excitación en las cintas más altas son obtenidos de libros de códigos entrenados en vectores de rasgo articulados del discurso de banda estrecha y de banda ancha. La representación de sobre espectral para la correlación de libro de códigos está basada en la línea la frecuencia espectral (LSF) parámetros que sacamos de un coeficiente de predicción lineal del discurso.

La inicialización consiste en segmentar el discurso en marcos (20-30 Sra.), y luego estimar coeficientes de LP con la orden 18. Los coeficientes de LP podrían ser utilizados durante la

0 0.5 1 1.5 2 2.5 3

2.6

2.8

3

3.2

3.4

3.6

3.8

4

4.2

Packet Loss Rate

N-B

PE

SQ

G.711G.726iLBCspeex

1192 IEEE LATIN AMERICA TRANSACTIONS, VOL. 10, NO. 1, JAN. 2012

formación, pero ya que los coeficientes espectrales tienen mejores propiedades de cuantificación y decorrelacion bueno, los coeficientes de LP son transformados en la línea coeficientes de frecuencia espectrales. El rasgo de cinta ampliado generado con un algoritmo de libro de códigos. Este método puede usar la iteración para ganar la mejor calidad, sin embargo este resulta en la complejidad aumentada y la naturalidad de disminuciones de discurso.

V. RESULTADOS DE SIMULACIÓN

A fin de comparar la señal de banda ancha mejorada con la banda estrecha descifró la señal de discurso, un libro de códigos el algoritmo de BWE fue puesto en práctica [16]. Las muestras de discurso de banda ancha del ITU-T eran muestrean a 8 kilohercios, transmitidos sobre códecs y luego ancha samplado a 16 kilohercios. Entonces las señales de salida fueron salvadas como señales de discurso de banda ancha degradadas. Las señales degradadas fueron introducidas al algoritmo BWE mostrado en la Fig. 5 y luego ahorraron como señales de discurso de banda ancha mejoradas.

Fs=8kHz improved Signal

Figura 5. libro de códigos que comprende algoritma de systema de extencion en una ancho de banda.

El procedimiento de libro de códigos es un algoritmo de complejidad bajo descrito en .[5]

El procedimiento de libro de códigos tiene la tardanza de complejidad muy baja. Otros métodos como GMM y HMM y red de los nervios tienen el algoritmo complejo lo que resulta aumentando juntando los dos extremos la tardanza de la red. Los factores principales de la pérdida de paquete son la inquietud y juntando los dos extremos tardan.

Un resultado de calidad ha sido calculado basado en PESQ de banda ancha para G.711, G.726, iLBC y códecs speex.

La Fig. 6 muestra el resultado de PESQ de banda ancha proporcionado por el libro de códigos método de BWE. El G.711 tiene el resultado más bajo con respecto a los otros códecs. Cada color indica la proporción de pérdida de paquete (Negro: el 1 %, Blanco: el 2 %, lloriqueado: el 3 .(%

En algunos papeles tratan con la extensión de banda ancha artificial, distancia de Itakura-Saito solicitada midiendo la interpretación de métodos.

Este criterio no muestra la inteligibilidad de la señal de voz realzada. Los Itakura-Saito distancian sólo el espectáculo la diferencia entre espectros de poder de marcos de voz. Este procedimiento calculó espectros de poder de diferencia de señal de banda ancha y señal de síntesis y luego haciendo un promedio entre todos los marcos.

Figura 6. PESQ de banda ancha proporcionada por el algoritmo de WBE. (Negro: 1%, blanco: 2%, canoso: 3% la tasa de pérdida de paquetes).

El códec speex tiene la mejor interpretación tanto en

términos de pérdida de paquete como mejora WBE. Ya que uso en un broadband común conectan a la red esto los usuarios finales se unen con un módem ADSL a la red de IP, el speex es el mejor códec en la condición de pérdida de paquete baja. El speex tasa de bits es bajo y su relación de compresión es alta. Sin embargo una de las desventajas del códec speex es su complejidad alta comparada a otro códec como: G.711, G.726.

VI. CONCLUSIONES.

En una red de banda ancha diseñada para la aplicación de transmisión multimedia, los usuarios finales se unen vía el módem ADSLa la red con una aplicación significativa que es VoIP. La calidad de la voz transmitida es una cuestión importante en la red de VoIP. Este trabajo intenta mejorar la calidad de señales de voz en VoIP hacia la calidad de voz proporcionada en PSTN. El método BWE ha sido usado para mejorar la calidad de voz basada en PESQ de banda ancha.

Con este trabajo, en primer lugar varios códecs de voz modernos fueron seleccionados para evaluar la calidad de voz bajo no condiciones de pérdida de paquete. El Speex y G.711 fueron encontrados para proporcionar la mejor calidad sin la diferencia clara entre machos y hembras. El G.726 tiene la calidad peor cuando esto es el códec más comprimido. Nuestro resultado de medida de evaluación está basado en PESQ de banda estrecha.

El siguiente paso implicó aplicar una condición de pérdida

de paquete baja a los códecs. En esta condición, todos los códecs perjudicaron la señal pero la interpretación de speex permanece en un nivel aceptable, solo entre todos los códecs .

Se ha propuesto un algoritmo de cálculo de coste bajo para la extensión de amplitud de banda para aumentar la inteligibilidad y la calidad de señales de voz de banda ancha. En este caso, PESQ de banda ancha fue usado como la medida de evaluación. Los resultados muestran que el método de extensión de amplitud de banda de libro de códigos mejora la inteligibilidad y la naturalidad de la señal de discurso. Con la mejora del resultado de PESQ de banda ancha de más de 1 mientras la pérdida de paquete baja tiene un impacto muy bajo en este códec.

El códec speex tanto en pérdida de paquete baja como en condiciones de pérdida de no paquete expone la interpretación fina. La desventaja principal de este códec es su cálculo de complejidad alto, y latencia aumentada en codificador y operación de decodificador (30 Sra. para cada marco).

Window 20ms, 50% LPC LS Codebook

Procedure

MOUSAVIPOUR AND KHOSEAVIPOUR : VOIP QUALITY ENHANCEMENT WITH 1193

Después de esto iLBC es el códec bueno que tiene el algoritmo de ocultación de pérdida de paquete internamente y funcionar en sistemas de comunicación inalámbricos. El algoritmo de ocultación de pérdida de paquete que iLBC usado está basado en reproducir el marco anterior o haciendo un promedio entre el marco anterior y siguiente y luego reproduciéndose con el marco perdido.

Finalmente, este trabajo demostró speex como el mejor códec para la aplicación VoIP en redes de banda ancha que tienen la

proporción de pérdida de paquete de alta calidad y baja.

RECONOCIMIENTO

El trabajo es apoyado en la parte de una subvención de ITRC en la Escucha y la Forma de gobierno de Diseño y Realización

Piloto de investigación para red de banda ancha en la tecnología, Red y Proyecto de Áreas de Usuario.

REFERENCIAS [1] ITU-R Recommendation G.114, General Characteristics of International

Telephone Connections and International Telephone Circuits: One-way Transmission Time, February 1996.

[2] ETSI TIPHON, End-to-End Quality of Service in TIPHON Systems; Part 2: Definition of Quality of Service (QoS) Classes, TS 101 329-2, July 2000.

[3] ETSI DTR/TIPHON-05001, Telecommunications and Internet Protocol Harmonization Over Networks (TIPHON); General Aspects of Quality of Service (QoS), TR 101 329 Ver. 1.2.5, October 1998.

[4] K. Fujimoto, S. Ata, and M. Murata, "Adaptive Playout Buffer Algorithm for EnhancingPerceived Quality of Streaming Applications, " Spinger: Telecommunication Systems,vol. 25, pp. 2337-2342, March 2004.

[5] Nels Rohde, Svend Aage Vedstesen, “Artificial Bandwidth Extension of Narrowband Speech”, Master’s thesis, Aalborg University Department of Electronic Systems, 2007.

[6] ITU-T Recommendation P.862, Perceptual Evaluation of Speech Quality (PESQ), An Objective Method for End-to-End Speech Quality Assessment of Narrowband Telephone Networks and Speech Codecs, February 2001.

[7] ITU-T Recommendation P.862.2, “Wideband extension to recommendation P.862 for the assessment of wideband telephone networks and speech codecs,” 2005.

[8] ITU-T Recommendation G.711, Pulse Code Modulation (PCM) of Voice Frequencies, November 1988.

[9] ITU-T Recommendation G.726, 40, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM), December 1990.

[10] ITU-T Recommendation G.729, Coding of Speech at 8 kbit/s using Conjugate-structure Algebraic-Code-Excited Linear Prediction (CSACELP), March 1996.

[11] S. Andersen, A. Duric, H. Astrom, R. Hagen, W. Kleijn, J. Linden, Internet Low Bit Rate Codec (iLBC), IETF RFC 3951, December 2004.

[12] Speex Official Website. <http://www.speex.org>. [13] International Telecommunicaion Union, “Objective measuring

apparatus, Appendix 1: Test signals,” ITU-T Recommendation P.50, Feb 1998.

[14] ITU-T Contribution D. 110, 1999, Subjective Results on Impairment Effects of Packet Loss, September 1999.

[15] R. Hu, V Krishnan, D. V. Anderson, “Speech bandwidth extension by improved codebook mapping towards increased phonetic classification”, Interspeech 2005 – pp. 1501-1504M.

Farid Mousavipour received the B.S. degree in Biomedical Engineering and M.S. degrees in Electrical Engineering from Shahed University in 2007 and 2011, respectively. From 2011 he has been working for ITRC as a member of R&D Project Engineer. His Interest research field is speech processing, speech enhancement, voice codecs, and communication systems.

Mohammad Javad Khosravipour was born on 14 february,1987 in Kangavar, Iran.he received B.Sc. degree in Electrical and Electronic Engineering from Shahed University,Tehran, iran in 2010 and M.Sc. student in communication Systems from the University of Science and technology, Tehran, Iran. His research interests include Wireless sensor network,Cooperative communication, Information

theory,Coding and Adaptive filters.

1194 IEEE LATIN AMERICA TRANSACTIONS, VOL. 10, NO. 1, JAN. 2012