synthesis of nasal consonants and …...vol. 5 no. 18 電波研究所季報 研究...

12
Vol.5No.18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESISOFNASALCONSONANTSAND UNVOICEDFRICATIVES By KazuoNAKATA January 1959 UDC 534. 78 A maindisadvantageofanarrow-bandwidthtransmissionsystemofspeech is its poor intelligibilityforcertainclassesofconsonants. Thepurposeofthisstudyistrytofind out somecuestoimprovetheperceptionofconsonants,mainlynasalsand unvoiced fricatives, bymeansofasyntheticapproach. Theprincipalndingsforthenasalswere ; (1) Verylow(about 200 cps)frequencyand broad bandwidth for the rst formant are adequatecuesfordistinguishingnasalconsonantsfromotherconsonants. (2) Nasalconsonantscanbedistinguishedeachotheronthebasisofstarting frequency of thesecondformanttransition(F2locus)andwell-definedfrequencyrange for the F2 locus are associatedwitheachofthenasalconsonants,namelyaround 900 cps for 1m1, 1, 700 cpsfor ,n1 and 2, 400 cpsfor i 守/・ (3) Durationoftheinitialnasalsegment and transitiontime have asmall through significant effectsonidenti cationofthenasals. It isreasonabletoassumefromtheaboveresults that the nasal consonantsintelligibility ofFormantCodingSpeechCompressionSystem shouldbeimproved by sending of the extrainformationconcerningtheformantbandwidth. Theprincipalfindingsfortheunvoicedfricativeswere; (1) A simpleresonantcircuitwithzeroaboutanoctavebelowtheresonantfrequency and white noise sourceareadequatetosynthesize 1J/, /Sf and//, 8/ inisolationandadditionof vowelsynthesizedbytheresonanceanalogsynthesizerwithnecessary controls is adequate tosynthesizetheseunvoicedfricativesinsyllables. (2) The /J/, 1s1 and jf ,。/ sounds are characterized by at least oneimportantspectral peakintherangefrom 2, 000 cpsto8, 000 cps,probablyaround 2, 500 cpsfor 1J1. 5, 000 cps for /sf andveryhighfor //,,。/・ (3) Thebest///responsesareobtainedwitha 15 or -25 dbrelativenoiselevel, a 8, 000 cps resonance and a rising second formant transition whereasafallingsecond formant transitiongavebest /8/ response. (4) Levelesof -5 or -15 dbwithfallingformanttransitionsyieldbest;//and /Sf responses. (5) Ingeneraltheadditionoflow-frequencynoisedoesnotgreatly modify the pattern of responsesinthecaseofsyllablesbutimprovesthe ;f ,。J responsesin isolation. 本通信方式研究室 3

Upload: others

Post on 31-Dec-2019

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

Vol. 5 No. 18 電波研究所季報

研究

鼻子音及び無声摩擦音の合成

中田和男・〉

SYNTHESIS OF NASAL CONSONANTS AND

UNVOICED FRICATIVES

By

Kazuo NAKATA

January 1959

UDC 534. 78

A main disadvantage of a narrow-bandwidth transmission system of speech is its poor

intelligibility for certain classes of consonants. The purpose of this study is try to find out

some cues to improve the perception of consonants, mainly nasals and unvoiced fricatives,

by means of a synthetic approach.

The principal古ndingsfor the nasals were ;

(1) Very low (about 200 cps) frequency and broad bandwidth for the 五rst formant are

adequate cues for distinguishing nasal consonants from other consonants.

(2) Nasal consonants can be distinguished each other on the basis of starting frequency of

the second formant transition (F2 locus) and well-defined frequency range for the F2 locus are

associated with each of the nasal consonants, namely around 900 cps for 1m1, 1, 700 cps for

,n1 and 2, 400 cps for i守/・

(3) Duration of the initial nasal segment and transition time have a small through significant

effects on identi自cationof the nasals.

It is reasonable to assume from the above results that the nasal consonants intelligibility

of“Formant Coding Speech Compression System ”should be improved by sending of the

extra information concerning the formant bandwidth.

The principal findings for the unvoiced fricatives were;

(1) A simple resonant circuit with zero about an octave below the resonant frequency and

white noise source are adequate to synthesize 1J/, /Sf and //, 8/ in isolation and addition of

vowel synthesized by the resonance analog synthesizer with necessary controls is adequate

to synthesize these unvoiced fricatives in syllables.

(2) The /J/, 1s1 and jf,。/ sounds are characterized by at least one important spectral

peak in the range from 2, 000 cps to 8, 000 cps, probably around 2, 500 cps for 1J1. 5, 000 cps

for /sf and very high for //,,。/・

(3) The best /// responses are obtained with a 15 or -25 db relative noise level, a 8, 000

cps resonance and a rising second formant transition whereas a falling second formant

transition gave best /8/ response.

(4) Leveles of -5 or -15 db with falling formant transitions yield best ;// and /Sf responses.

(5) In general the addition of low-frequency noise does not greatly modify the pattern of

responses in the case of syllables but improves the ;f,。Jresponses in isolation.

本通信方式研究室

3

Page 2: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

4

緒 言

最近音声の狭帯域伝送方式の 1つとして,パラメータ

ー型の Vocoder“Formant Coding Speech Com-

pression System ”が試作実験されているが,乙の方式

の欠点は伝送された子音の明瞭度がわるいことであ

る。∞その他いわゆる音声の自動識別装置もいろいろと

考えられ実験されているが,乙 ζでもやはり子音の特性

を我々が十分に理解していないことによっていろいろの

困難にぶつかっている。

M. I. T.の R.L. E.キの音声研究クソレープでも子音

の特性をよりよく理解し,乙れらの欠点を改善するため

に合成的な方法による子音の研究を行っている。〈の研究

の方法として合成を選んだのは各子音の物理音響的な構

成要素を個々独立に自由に変化させ,その効果から ζれ

らの要素の情報要素としての重要さを知るととができ

るからである。

乙乙に M.I. T.で K.N. Stevens_教授の指導の下

に,筆者の行った鼻子音Im/,I川,/甲/および無声

摩擦音 /J/,/sf, If/, /fJ/ の合成結果について述べ

る。キ*

1. .子音の合成

1. 1. 予備的考察

1. 1. 1. 発声機構

鼻子音 /m/,/n/,/ 平/は有声破裂音 /bf,/d/, jg/

と同じような口の型で,口をとじ軟口蓋(Velum)を下

げて鼻腔(nasalcavity)を口腔(ouralcavity)に結

合させ空気を鼻孔から出して発声される。乙の時の音源

は普通の母音と同じく声帯(glottis)の振動による周期

音である。

1.1. 2. 等価回路の伝達函数とその特性

一般に音声は線型回路の出力,すなわち音源で励振さ

れた声道(Vocaltract)の出力と考えられる。的鼻子音

の場合その簡単な電気的等価回路は第1図のようにな

る。 YI>Y2. Y3はそれぞれ軟口蓋のととろからみた後

声道(Pharynx),口腔および鼻腔の等価アドミタンスで

ある。 乙の回路からわかるように, 乙の等価回路の電

流木材伝達函数は Y1+Y2十Y3=0に極点を, Y2=ooに

零点をもっ。

可解 M.I. T.は MassachusettsInstitute of Technologyの略。R. L. E. I主ResearchLaboratory of Electronicsの略。

電波研究所季報

鼻腔

鼻腔

後戸道〔Pharynx)

軟口蓋(Velum)

属腔(叉は口

第 1関鼻f音発生申曹価周路

極点: Y1+Ys十Ys園。容点; y.盟国

鼻腔と声道の大いき,型,軟口蓋の位置が分ればこれ

らの極点および零点の周波数を計算する乙とができる。

平均的な値を代入して計算した結果および analogvo・

cal tractの nasalcoupling によるインピダンス測定

の結果からρ〉鼻子音の伝達爾数の特性として次のよう

な点があげられる。

(1) 200~300cpsの低い周波数範囲に第1の共振があ

り,乙の範囲で ImIの共振周波数が一番低く,/甲/の

共振周波数が一番高い。

(2) 800~1500cpsの範囲に第2の共振があり, 2,000

cps~3,000cpsの範囲に第3の共振がある。

(3)以上の他にもう 1対の共振と零点とがあり,その

周決数は /m/,/n/川町で異り,第2,第3の共振と

結合してあらわれる。

とれらは大体次のような範囲にある。

/m/では 800cps~1, 500 cpsの範囲, /n/では 2,000

cps~2, 500 cpsの範囲,/甲/では 3,000cps より高い

周波数域。

(のすべての共振は母音の場合にくらべて,鼻腔の大

きな減衰特性によって帯域巾が広いが,零点は閉じた口

腔によるものだから減衰が小さく急峻な反共振特性であ

る。

1. 2. 合成装置

乙の実験の合成装置としては “Terminal analog

synthesizer "(5J (or Resonance-analog synthesizer)

を用いた。

**Im/ l土 manのnの発音' /n/ は name.のnの発音!11/ は kingのngの発音.r Jf l主shipのshの発音/sf I土田nのsの発音, !flfanのfの発音181は thankのthの発音

***電荷l主音声気械の容積速度(VolumeVelocity)に相当する。

Page 3: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

列に結合させたもので,その各

々がそれぞれ第1から第4まで

の声道共振すなわちホルマント

をあらわしている。制御回路は

第3図の intensity-frequency-

time パタンであらわされるよ

うに合成出力を制御する。との

合成装置の出力は第3図のよう

に子音部分,過渡部分,母音部

分の 3つの部分からなっている。

過渡部分では共振周波数が子音

部分の値から後続の母音部分の

値にほぼ指数的にうつり変って

行く。音源の buzzの周波数も

変える乙とができるが,本実験

ではほぼ 125cps に固定した。

第3図のパタンで制御可能な

ものは,

(1)子音部分と母音部分の 4

5

mwH出力

|ト4

10札

Vol. 5 No. 18 January 1959

ヨ1}ヨ・-

12AU7 12AU7•2 6BA6•2

22

つの共振周波数とその帯域巾,

(2) buzz音源励振の始めの時

刻 T,と終りの時刻 T3

(3)過渡部分の始まる時刻むと過渡部分の時間であ

る。なお合成出力の各ホルマント聞の相対強度は,可変

同調同路直列結合であるために,ホルマントの周波数と

その帯域巾とによって定まってしまい,第 1ホルマント

の周波数が低く帯域巾が広い時は合成出力全体の強度は

弱くなる。

14

14

第 2関 Terminal-Analog Synthesizerの電子制御可変同調回路

との合成装置は電気的な“ buzz”音源で励振される

電子的可変同調回路と制御回路とからなっている。電子

的可変同調同路は第2図のような可変向調同路を 4つ商

周渡歓

合成音の関取試験1. 3.

第4ホルマント

第 1の予備実験

鼻子音のスペクトJレを特徴づける零点の効果をしらべ

るため,まづ次のような予備実験を行った。第4図に示

すような零点を挿入するための附属回路を合成装置に附

1. 3. 1.

第3串Jレマン t

切。ーム

判。l上

第2ホルマルト

第1ホルマ y ト

ll一志i

l

時間13 τ

ll

見12AU71 1

零点周波数 fo恒三ZF需工L1《L0,C1》c.

第 4図零点挿入のための附属回路

均 12AU7母音部分

第 3図合成出カの H ip脂 psityfrequency-time”パタン

過渡加mAT

子音部分

Page 4: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

6

加し,鼻子音としての聞き取りに対する零点の効果をし

らべた。関取試験の結果,零点の効果は鼻子育の聞き取

りに対しては有意でないと思われた。

1. 3. 2. 第2の予備実験

奥子音のスペクトJレを特徴づける第2の要因である,

ホルマントの帯域巾の効果をしらべ,又第3図に示すよ

うな零点をもたない合成音で輿子音として聞き取られる

ような音を合成し得る可能性をしらべるために次のよう

な条件のもとで合成音を録音し, 5人の人に対して間取

試験を行った。

(1)子音部分のホルマント周波数

第1ホルマント; 200cpsと 730cps

第2ホルマント; 900cps, 1, 500 cpsと 2,000cps

第3ホルマント; 2,500cps

第4ホルマント; 3,500cps

(2)母音部分のホルマント周波数;母音 /a/

第1ホルマント; 730cps

第2ホルマント; 1,090cps

第3ホルマント; 2,500cps

第4ホルマント; 3,500 cps

(3) ホルマントの帯域巾

第1ホルマント; 50cpsと 300cps

第2,3,4ホルマント; 30cps~lOOcps

(4) 過渡部分の時間

20 m sec, 50 m secと lOOmsec

(5)子音部分の時間,(T「 Ti)

-30 m sec, 0 m secと 100m sec

(6) 合成音の総数, 99

ζの予備実験の結果,子音部分の第1ホルマント局波

数が 200cpsの時合成音は有声破裂音又は鼻子音とし

て聞き取られ,その中でその第1ホルマントの帯域巾が

広い時に主として(70%以上の平均レスポンスで〉鼻音

として聞き取られるととがわかった。

I. 4. 3.音節頭における鼻子音の関取試験

予備実験で第3図のようなパタンの合成音で鼻子音を

合成するととができるととがわかったので,つづいて次

のような合成音で音節頭における鼻子音の関取試験を行

電波研究所季報

っfニ。

(1)子音部分のホルマント周波数

第1ホルマント; 200cps

第2ホルマント; 900cpsから 2,300cpsまで 200cps

おきに8段階

第3ホルマント; 2,500cps

第4ホルマント; 3,500 cps

(2) 母音部分のホルマント周波数,母音 Ia/ 上述

(3) ホルマントの帯域巾

第1ホルマント; 300cps

第2,3,4ホルマント; 30cps~lOOcps

(4)過渡部分の時間

20 m sec, 50 m sec, 100 m sec

(5)子育部分の時間

20 m sec, 50 m sec, 100 m sec

(6)合成音の総数, 72

(7)聞き取りの instruction

" During this test you will hear 72 speech sounds.

For each, write the most similar response: ma, na

or nga"

各合成音をランダムに録音し5人の関取者に聞かせた。

その結果を第5図に示す。各点は5人について,子音部

100

70

平均 60由I/

~ so ,, ス

40

" )

30

20

,。。初0 1100 日∞

Fs locus (cps)

第 5鴎 F曾 locusの幽数1:1.,てあらわした Imat, fna /• l'T)a/

の出l&取りの平均のレスポy ス

Page 5: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

7

第1ホルマント;初Ocps

第2,3,4ホルマント; 30~lOOcps

(4)過渡部分の時閥

20 m sec, 50 m sec, 100 m sec

(5)子育部分の時間

30 m sec, 70 m sec

分の時間,過渡部分の時間について平均した値である。

との結果から第2ホルマントの周波数の移行のはじま

る周波数(いわゆるむ locusとよばれているもの仰の

高低が jm/,In/,'曹/の聞き取りに大きな効果をもっ

ているととが分る。

乙の試験につづいて同じような音節頭における鼻子育・

の関取試験を,母音 Ii,尻島 :J,u Iについて次のよう

な条件で行った。

(1)子育部分のホルマント周波数

第1ホルマント; 200cps

第2ホルマント;後母音

Vol. 5 No. 18 January 1959

合成育の総数,各母音につき 48

(7)聞き取りの instruction,母音 Iiiの例

“During this test you will hear 48 speech sounds.

For each, write the most similar response: mi, ni,

ngi or none them ".

(6〕

900cps

から 2,100 cpsまで 200cpsおきに7段階,前母音 Ii,

I, e Iに対しては l,lOOcpsから 2,300まで 200おき

に7段階

I :J, u Iに対しては

第3,4ホルマント;後続母音の第3,4ホルマント周波数

に同じ間取試験の方法,間取者は母音 ;a/ の時と同じであ

試験の結果を過渡部分の時間,子音部分の時間をそれ

ぞれパラメターとして第6図と第7図に示す。む locus

の効果は先の母音 /a/の時とよく一致しており,過渡

部分の時間については 20msec~50msecが /m/ に.

50 m sec~100 msecが in,甲/に,又子音部分の時間

については 30msecが InIに, 70msecが /m,甲/

により適しているととが分る 0(7)

る。

第 4

cps

3,500

3,500

3,500

3,500

3,500

cps

3,000

2,500

2,500

2,500

2,500

(2)母音部分のホルマント周波数

母音 第 1 第2 第 3

cps cps

270 2,290

390 1,990

530 1,840

570 900

300 900

,,., , 11

Is I

/:>!

I u I

rat・/J/ tat

ホルマント帯域巾

. ’色。。。

20回

(3)

ug日)

Q令

2.1

X-l哩i

17 ll 9 1.l 17 21 ?日 1.7 21 9 1.3

F, I白凶作• c.) ・-/m/, 0-/n/,

第 6関各母音位対して.過渡節骨の時聞をパ':?"' ータとし Fa locusの函数としてあらわした Jm/,In/,

および /1/Jの平均のνスポYス(%)

15 且

9

Page 6: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

電波研究所季報

写4 I i I II I /[/ I at lコl JUI II I¥ , ト、. ・, , 干、 、d \ 「、 1 ト、 /\

胆/ 、;'

\ ' 「 ¥ J 「、7

30 白、,

J 6

40 I¥

d ¥_ J_ ハ 文:>Cl

. う ー区

|\ ν トぐb. 、

八 7 ミ示トJ。 レA 〆

ト、 i' ト、\ ¥ ド』

90 I ,’\

I I ト ' 八 l '/' λ

70曲 I I II ¥ γ v Y. / 40

』-0.

I¥ I / 八 J ¥ I トポ\20 。

レ |ペ ¥ トJ I 間

凡=c

審母

8

uSE)璽泣Q令国圃

hmι巾

2 I 17

Fo I町田(k.c.) ・-'m/, 0-'n,, ,71'

第 7関各母音に対して,子音部分の時開をパラ dータιして F2locusの因数としてあらわした Im(, 'n}

および/甲fの平均のVヌポシエ(循)

IJ 9 21 17 1.3 9 21 17 13 9 2.1 1.7 1.3 ? 2 I 17 1.3 .9 2.1 1.7 1.3 .9

(1)子音部分の第2ホルマント周波数

/ m /; 900 cpsから 1,500 cpsまで lOOcpsおきに7段

/n/; l,400cpから 2,000 cpsまで lOOcps おきに7

段階

川/; l, BOO cpsから 2,400cpsまで 100cpsおきに7

段階

(2)子音部分の時間; 70msec

(3)過渡部分の時間; 50m sec

(4〕合成音の総数 ;各鼻子音につき 42対

(5) 聞き取りの instruction;例.Im Iについて

“During this test you will hear 42 pairs of speech

1. 3. 4. む locusに対する PairedComparison Tests.

以上の聞き取り試験の結果,第2ホル7 ントの移行の

はじまる周波数いわゆるむ locusが鼻子育の聞き取り

に大きな効果のあることが分ったので,もっと精密に乙

の Fzlocusをきめるために次のような PairedCom-

parison Testsを行った。

母音 /a/ についてすでに第5図の結果から推定され

る各鼻子音のむ locusの範囲内に子音部分の第2ホル

マントの周波数があるような 2つの合成背を一対として

聞かせ,その後者が前者にくらべてより明瞭な鼻子育で

あるかどうかを各鼻子育ごとに試験した。

合成音の条件は

第 2合成音の FtI。cus(k. c.)

(-

ud)

ω5。-ahQhm銭。同様

区3 仁コ ~ ~· ;,,etter "のレスポンスが 7何以上の "bet町・のνスポYスが 30婦から ••better '’のレスポYスが 3時以下の

70"までの区域 区a ’ 第 8図 PairedComparison Testsの結果齢制1土pairの第 1の合成音の F,I。cus,構輸は pair 第 2の合成音の F2locus

Page 7: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

9

広くした合成音でくり返した結果を第9図に示す。乙の

時の方が前よりはっきりと鼻子音として聞き取り,又相

互によく区別できるととが分る。

,。。

70

90

"40

言。

6コ

50

平均のレヌボンヌ(dp)

sounds like 1 ma/, For each, judge whether the

second member of the pair is a better or worse

version of natural ; ma 1 and write "b" for

better judgement and “W ”for worse judgement."

乙れ以外の条件は先の音節としての聞取該験の場合と

同じである。

乙の PairedComparison Testsの結果を第8図に

示す。 betterの responseが 30%から 70%の聞で,

各鼻子音のむ locusの範囲と考えられる区域内ではほ

とんど有意の差を認める乙とができなかった。乙の結果

からも各鼻子音に対してそれぞれ適したむ locusの範

囲があるととが分り,その範囲は,

/ma/;伺O~1,lOOcps

j n a j; 1, 600~1,800 cps

/曹 a/;2,300~(2, 500) cps (又は 2,300cps以上)であ

る。

同じような試験を母音 ju/

んど同じ結果が得られた。

Vol. 5 No. 18 January 1959

についても行ったがほと

20

1100 1300 1500 1700 1900 2100 第 2ホルマY ト周波放(cps)

第 9関第 2ホルマYF周波数の歯車買としてあらわした

isolation testの結果

以上の各種聞き取り試験の結-果分った主な点は,

(1)輿子育を他の子音特によく似た有声破裂音から区

別するものは,周波数の低い(200cps程度)帯域の広

い(200cps程度以上)第1ホルマントである。(manner

of productionの cue)

(2) 3つの鼻子育 /mj,/n/, /曹/を相互に区別する

ものは第1に,第2ホルマントの移行のはじまる周波数

いわゆる F~ locusである。(mannerof articulation

の cue)

(3)子育部分の時間,過渡部分の時間も鼻子育の聞き

取りに第2の要素として重要である。

(4)単音としても低い周波数の帯域巾の広い第1ホル

マントをもっ合成音は鼻子音として聞き取られ,第2ホ

ルマントの周波数によってある程度相互に聞き取り区別

する乙とができる。

(5)第5,6,8図から分るように,各鼻子音に対する最

適の F2locusは後につづく母音の第2ホルマントの周

波数の高低につれてある程度変化するが,乙の変化は余

り大きくなく ;mj,Jn/ および j守/のむ locusはそ

れぞれ 900cps, 1, 700 cpsおよび 2,300cpsの附近に

言結

10

。”。

1. 4.

単車子育のみの関取試験

合成音の鼻子音だけとしての聞き取りの可能性を調べ

るため,子育部のみの次のような IsolationTests を

行った。

(1)ホルマント周波数

第1ホルマント; 200cps

第2ホルマント;伺Ocpsから 2,300cpsまで 200cps

おきに8段階

第3ホルマント; 2,500cps

第4ホルマント; 3,500cps

1. 3. 5.

(2) ホルマント帯繊巾

第1ホルマント; 300""'

第2,3,4ホルマント; 50cps~lOOcps

(3)合成音の総数; 8

(4)聞き取りの instruction

“During this test you will hear 32 speech sounds.

For each, write the most similar response; m, n,

ng or non of them.”

数回の関取試験の結果,第1ホルマントの低い周波数

と広い帯域巾によって各合成音を鼻子音として聞き取

り,第2ホルマントの周波数によってある程度各鼻子音

を区別できる乙とが分った。各鼻子育に対する最大レス

ポンスは jm j; 1, 100 cpsで 65%,/nj; 1,700cpsで

52%, /甲/; 2,300cpsで 41'}もである。

次に同じ試験を第2ホルマントの帯域巾も 200cpsに

Page 8: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

10

あるというととができ,乙の結果は Haskinsの結果的

と一致する。

(6)子育部分の時間については比較的長い 70msec

程度が Im,7/ Iに,比較的短い 30msec程度が jn/

に適している。

(7)過渡部分の時間については,比較的短い 20msec

程度が ImIに,比較的長い 50mS伐程度が In, 7/ I

に適している。

第9図の IsolationTestsの結果を,同じような試験

を単独に発音された自然の音声を使ってやったMalecot

の実験的と比較すると,明らかに合成音の方が特に InI

および/甲/について区別されやすいことになるが, 乙

れは合成音の方が区別に必要な要因を人工的に強調して

いる結果と考えられる。

音節頭における/甲/の音は英米語には存在しないの

で,その聞き取りはやや不自然であるるという難点があ

る。又有声の破裂音 jg/ におけるような,前母音と後

母音とによる F2locusの不連続な移動仰はみとめられ

ない。

又音節頭における結果がそのまま音節尾の場合にも成り

立っかどうかわからないが, Haskins<n の研究とくら

べて大差はないものと考えられる。又ζの実験では合成

音の後続母音の第1ホルマントも広帯域化されているの

で,母音も鼻音化されている可能性がある。

上述の試験の結果,ホルマントの帯域巾を特に第1ホ

ルマントの帯域巾を広くする ζ とによって, Formant

C冶dingSpeech Compression Systemの鼻子音の明瞭

度を改善する乙とができると推論される。今までとの

Systemでは鼻子育を他の母音と同じように取扱って狭

い帯域巾のホルマントで合成し,したがって直列型のホ

ルマント合成装置では鼻子音の他の母音に対する相対強

度も不適当であったため明瞭度がわるかったものと考え

られる。

2. 無声摩擦菅の合成

2. 1, 予備的考察

2. 1.1. 発声機構

無声摩擦音 JJ/,/sf, If/, /fJ/などは声道を狭ばめ

るζとによって生ずる気流の乱れによる雑音によって発

声される。無声摩篠音 If,fJ, s, JI の各々についてそ

の発声時の声道の形と最大収縮点の位置を第10図の断

面図で示す。乙の気流の乱れによる雑音は,最大収縮点,

歯裏,底などで発生されるが, /JIや /sfの時は歯裏

によるものが, If/や Ifl Iでは最大収縮点である歯裏

によるものと他に居によるものとが主要である。とれら

電 波 研 究 所 季 報

の雑音源によって声道の最大収縮点から底までの部分が

励振されるが,最大収縮点から奥の部分は無声摩擦音の

特性をきめるのには余り重要ではない(高い周波数に対

して低インピダンス終端と考えられる)。

第 10図録芦摩擦音 If,9• sf発戸時の戸j自由形

2.1.2. 等価回路の伝達函数とその特性

無声摩擦音の簡単な等価回路は第11図のように考え

られる。低インピダンス電圧源 E.*は雑音音圧源をあ

らわし,出力電流 Ioは犀における音の容積速度をあら

わしている。 Zi.z~ は電源から両方向をみたインピダ

ンスである。

篇 11図無声摩録音発生の等価回路

極点 Z1+Zs園 O,零点 Zs回国

との系の伝達アドミタンス函数の極点の周波数は電圧

源の位置に関係しないが,零点の周波数は電圧源の位置

によって変る(Z2の極点が零点である)。平均約な声道

の大いきと形から計算して,音源が最大収縮点にある時

には,零点の周波数は 2,000cpsから 4,000cpsの間

にあり,音源が歯裏にある時には,声道の形が /Jjか

らjs/ ぞへて If,fJ Iへうつるにつれて l,OOOcps付

近から 6,000cps位まで変化する。

音源が属にある時は音源と声道との結合は疎で零点は

高い周波数(8,000cps付近)にある。

本電庄は音声気街の音匡(Pressure)に相当する。

監,e’

Page 9: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

Vol. 5 No. 18 January 1959

K. N. Stevens と J.M. Heinzは乙のような斑論

的計算をうらづける analogなモデルによる実測を行い,

W. Hughes と M.Halleとによって報告されている

無声摩擦音のスペクトルの実測結果とよく一致する結果

を得ている。(2)(10)

2.2. 合成装置

できるでけ簡単な回路で十分な明瞭度令もつ合成音を

作るのに必要な最小の情報を得るために,第 12図のよ

うな簡単な回路と白い雑音のスペクトルを用いた。 ζ

の回路は一対の極と零点とをもち,白い雑音で励振し

た時のスペクトルが第 13図の実線でその 1例を示すよ

うなものになる。 乙の雑音スペクトルと Terminal

Analogy Synthesizerによる母音との組合せで音節と

しての各成音を作った。

対相

,、- ク

sν ν へ. (~)

0.'3h

15mh

第 13関 繰戸摩擦音合成周の鎗音スペクトル覇軍周路

中心周波紋 f回 Jー__.!__ー日 ‘le布三五了

?.:点周波数 fo「 ι一一Lー&轟‘I c(lh)

40

20

、。

0 2 , 3 4 5 6 789 2 3 4. 5 6 789 ,。。。 10000

周波数(cps)

第 13閲共畿周波数が 8kcで白い雑音で属機した時の

出カ総音スdタトルo 点線i主付加偏周波雑音R

ベクトル。 獄価は低周波書量音乃商周波雑音に対

する栂対強度。

2. 3. 合成音の関取試験

2. 3. 1. Isolation Tests

次のような条件で第 12図の回路の雑音出力である合

11

成音について, まず子音・のみとしての聞取誠験(isola-

tion test)を行った。

(1)雑音スペクトルの共振周波数とその帯域巾

2,000 cpsで 300cps, 3, 500 cpsで 600cps, 5, 000 cpsで

800 cps, 6, 500 cpsで1,000 cps, 8, 000 cpsで1,500 cps

(2)雑音スペクトルの零点周波数

共振周波数の約1オクターブ下(第 12図参照)

(3)低周波雑音

共振周波数が 6,500cps と 8,000cpsの場合には低周

波の雑音を加えた。

その高周波雑音に対する相対強度とスベクトルの形を

第 13図の点線で示す。

乙れらの合成音をランダムな順序に録音し, 5人の関

取者に1つづっ聞かせて /I.~. s, o, JIの中のどれか

1つとして判断させた。 (Ir;Iは独語“ Ich”の ch の

発音)

乙の聞取裁験の結果を,低周波雑音を加えない場合に

ついて第 14図に示す。 IfjとIfJ Iの区別はとの誠験で

は困難だったので,両者のレスポンスを 1つにして示し

てある。

100

訟関与り

均平 50 ν ;I.

rl< y

" 。

〆〆

I , , , , , , , 。〆

戸+8

2000 3000 5000 8000

雑音スペクトルの共銀周波数

第 14図合成§Ji声摩様音の Is。JationTestの結果

(付加低周波雑音なLの場合)

雑自スペクトルの共振周波数によって/J/,/r;/, /s/

と 1!,。/がlぎ月I]される ζ とが分る。低周波雑音を加え

た時の効巣令第 15凶に示す。低周波雑音を加える乙と

によって /SJのレスポンスカ三 ;J,o Iのレスポンスに

変るととが分る。

2.3.2. 音節頭における関取誠験

上にのべた合成無声摩擦音を Terminal Analog

Synthesizerによる合成母音と組合せて音節とし,音節

頭における無声摩僚音の関取誠験を行った。子音と母音

との組合せの時間的関係は,予備の間取誠験で最適と恩

Page 10: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

電波研究所季報

(_5) ホルマントの移行のはじまる周波数(過渡部分のホ

ルマント周波数)

第1ホルマント; 200cps

第2ホルマント; 900 cps (低)

(む locus) 1, 700 cps (中)

2, 400 cps (高)

第3,4ホルマント;後続母音のそれらに同じ

s -。』~~ー~

(_6)母音 Ia Iホルマント周波数

730 cps, 1, 090 cps, 2, 500 cps, 3, 600 cps

。ィ:~,,, ,,

,,, ,,〉三喝、

。”’--

?ーー~ー~。

12

100

50

聞き取りの平均

νZポyR

(%)

(7)合成音の総数; 81

各合成音をランダムに録音し, 5人の関取者に、//, (},

s, JIのいづれか1つとして聞き取らせた。

。-20 -、。低周滋雑音の高局波書量音に対する義母瞳強度(db)

一一 8,000cps, -----6,SOO cps ’ll 15図柑加低周波雑音の合成無声摩擦音の聞き取りに

およぽす~響

5人の平均のレスポンスを雑音スペクトルの共振周波

数の函数としてあらわし, F2locusと母音 ia/に対す

る雑音の相対強度をパラメータとして第 17図と第 18図

に示す。

低周波の付加雑音は音節の場合有意の効果を示さなか

ったので,平均した価であらわす。

雑音スペクトルの共振周波数の効果の他に, If/ と

I (}Iがむ locusで区別される ζ乙とがよく分り,又

/JIや IsIが IfIや IfJ Iより強い発音である乙とも

分る。(11)

sαコ150 200 300

時 間(m sec)

第 16図合成無声摩擦音音節の noise,buzz, formant

transition の相対時間関係およひ’ :i:~ベロープ強

度の:it:上り,下関係

トJoise84. ISO

330

T回n9tior)

400 IQ(コ。

以上の合成音の関取試験の結果分った主な乙とは

(1〕第12図のような簡単な一対の極と零とをもっI昼l路

と白色雑音とで無声摩擦音の合成が可能であり, Termi-

nal Analog Synthesizerによる母音との組合せで音節

としての合成が可能で・ある。

結2.4.

(2)雑音スペクトルの中心周波数を 2.5kcから 8kc

まで変化させると,聞き取りのレスポンスは /JIから

/s/ をへて If,o Iへうつる。

われる第 16凶のようにきめ,又母&としては /ai告別

いた。

合成音の条件は次のようである。

(1) 雑音スペクトルの共振周波数と帯減巾

2, 500 cpsで 400cps, 3, 500 cpsで 600cps, 5, 000 cps

で 800cps, 6, 500 cps で l,000 cps, 8, 000 cps で

1, 500 cps

(3) If IとIoIとは音節としては後続母音への第2ホ

ルマントの移行のはじまる周波数,いわゆるむ locus

によって区別される。

(2)摩擦音の後続母音に対する相対強度-5db,-15

db, -25db

(4) JI. s IとIf,o Iとは母音に対する相対強度によ

ってもある程度区別される。

(3)雑音スペクトルの共振周波数 6,000cps と8,000

cpsとにおける付加低周波雑音の高周波雑音に対する相

対強度

Odb, -lOdb, -20db (5) If, o Iの場合の付加低周波雑音は IsolatienTest

の場合には If,o Iの聞き取り率をますが,音節の場合

には有意の効果を示さない。

ホルマント移行の影響は If,o Iの方が受け易い。(6)

(4)雑音スペクトJレの零点周波数

中心周波数のほぼ1オクターブ下

Page 11: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

Vol. 5 No. 18 January 1959

(7)無声摩践者l/J/,/Sf, If/, /fJ!/

は下表のような要因で区別される。

音声の狭帯域伝送方式において無声摩

擦音を伝送する場合,合成田路は第12図

のような一対の極点と零点とをもっ簡単

な回路でよく,主要な制御パラメータは

雑音スペクトルの中心局波数, F2locus,

母音との相対強度などでよい乙とが分る。

実際には乙の他に特に有声摩擦音,そ

の他との比較において,雑音部分の時間,闘

100

’)0

80

70

60

so

40

百0

雑音強度のエンベロプ波形,後続母音と 主20

の時間的関係などが重要である。 ~ 10 平均

一 i子i

LI/

/ \ /

ヘ/|/

13

/8/

/ M

Mt YI

7 ノ

/づゲ し

llf.......--’ .J.」 ~ 、\

ι

υO 謝辞 主

~ 90

ζれらの研究は M.I. T.の R.L. E. ス

2 3 4 ! 6 7 8 2~5 4 5 6 7 j

/Sf ff/ で K.N. Stevens教授の指導のもとに t 80 A て1行ったもので, K.N. Stevens教授, M.

Halle教授および R.L. E. の副所長

H. Zimmerman教授の適切な指導と,

Speech Re舵 archGroupの全員の親切

な協力に感謝する。

又とのような研究の機会を与えられた

甘利所長はじめ研究所の方々,国連,米

国務当省および F.C.C.の関係者にも深

く感謝する。

~ 中必周置童数雑

cps lρ1 2,500

/s/ 5,000

/fl 8,000

/0/ 8,000

w 、 M¥ 、ll 、H

//'"て\ 日\ え\ ¥ L\可

70

60

so

40

富。 、\ \

20

\\ f¥¥ .i 、 \ 可、ー、』

10

4

02 5 4 5 6 7 8 2 3 4 5 6 7 8

雑音スペク ~}IIの中心周波紋(k. c. p. s】

第 17図合成無声摩僚音音節の聞き取りと FaI町田(母音 /al)

・←・・L,F• locus 900 cps,

O-M, F• locus 1700 cps.

X-H, F舗 E。cus240 0 cps,

音 ス へー ク ,ν

Fs locus

客席周波数 借銭巾 相対富島度

cps cps 'db 1,370 400 -5--15 高

2,750 800 -5--15 高

4,400 1,500 -15,ー-25 低

4,400 1,500 -15--25 高

Page 12: SYNTHESIS OF NASAL CONSONANTS AND …...Vol. 5 No. 18 電波研究所季報 研究 鼻子音及び無声摩擦音の合成 中田和男・〉 SYNTHESIS OF NASAL CONSONANTS AND UNVOICED

14

文 献

( 1) ]. L. Flanagan;]. Acoust. Soc.

Amer., 28, 6, pp. 1099~1106.

( 2) Acoustics Laboratory, M. I. T.;

Sci. Rep. No. 17, March 1958.

( 3) C. G. Fant; Acoust. Lab., M.

I. T. Tech. Rep., No. 12.

( 4) A. S. House and K. N. Stevens;

J. Speech and Hearing Di百・

order, 21. 2, pp. 218~232.

100

90

Bo

70

60

50

40

30

(5〕 ]. L. Flanagan; ]. Acou札~ 20

Soc. Amer., 29, 2, pp. 306~310. 専の,。( 6) P. C. Delattre et. al.;]. Acoust. 3(c

UJ -Soc. Amer., 27, 4, pp. 769~773. ~ Q

( 7 ) A. M. Liberman et. al. ; J ; ~ 90

Exper. Psych., 52, 2, pp. 127~ス

言 80137.

( 8 ) A. M. Liberman et. al. ; Psy-

chological Monographs, 88, 8.

( 9) A. Malecot; Language, 32, pp.

274~284.

(10〕 M.Halle et al.; ]. Acoust. Soc.

Amer., 28, 1, pp. 303~310.

(11) K. S. Harris; ]. Acoust. Soc.

Amer., 28, 1, pp. 160~163.

70

。。50

40

30

20

10

0

Ht波研究所季報

/f / /8/

-25 tフ五/ 』/

阪/

/。~ νr . 、 / 、

う/ レ/・/v r\..~ ,,,,,

.”= ー・-- 〆~ ~ ~

17' にZ2 吉 4 5 6 7 8 2 '3 4 5 t)’ o

I sf . /!/

メて,斗 \

'I 1-s \ 、ト'I ¥ -25¥ ど\

\ ¥ -2! 、・5

卜\ \ 、\ぐ~』、←~ 』

23456 78 2345678

雑Iiスイクトルの中・む周波数(k.c. p. s.)

第 18図合成然,u摩擦音音節のllH書取りと雑肖スペクトルω掬対強度

。ー:ー25db,①ー;ー15db,・-; -5db.

・1111・........・M・IUlll・M・S・-・・・・・・M・M・Ill・a・Ill・H・Ill・a・11111・a・---””・1111・u