mmse (精神状態短時間検査 日本版)原法の妥当性と信頼性

20
91 認知神経科学 Vol. 20 No. 2 2018 原  著 1王子こころのクリニック 2美原記念病院 3国立病院機構宇多野病院 4日本赤十字看護大学 5船橋市立医療センター 6国立循環器病センター 7東京医科歯科大学 MMSE - J(精神状態短時間検査 - 日本版)原法の妥当性と信頼性 杉下 守弘 1、腰塚 洋介 2、須藤 慎治 3、杉下 和行 1、逸見  功 4唐澤 秀治 5、猪原 匡史 6、朝田  隆 7、美原  盤 2Key words : MMSE - JMMSE 原法、ADNI、認知症、妥当性、注意・計算課題 【要旨】Mini - Mental State Examination(略称 MMSE)は世界で最も使用されている認知症ス クリーニング検査(原版は英語)といわれている。しかし、その日本語版は、翻訳や文化的 適応が適切でないものが多く、十分な標準化も行われていなかった。MMSE 原版は国際的 に使用されているので、日本のデータと世界の他の国のデータを比較するために、MMSE 原版と等価な MMSE 日本語版の作成は急務と考えられた。そこで、2006 年、原版に忠実な 翻訳と適切な文化適応を目指した MMSE 日本語版(MMSE - J)が作成された。MMSE - J 国際研究「アルツハイマー病神経画像戦略(ADNI)」の日本支部(J - ADNI)で使用され、 そのデータを基に、2010 年、MMSE - J の妥当性と信頼性が検討された。 ところが、2012 3 月、日本の ADNIJ - ADNI)データの改ざんが指摘され、2014 3 月には東京大学調査委員会に改ざんやプロトコル違反など問題例が報告された。その後、第 三者委員会報告書はこれらの問題例を問題ないとした。しかし、この判断は誤りであること が明らかにされた 11 - 13杉下ら 2016)は、杉下らの論文(2010)の J - ADNI データのうち改ざんやプロトコル違 反などの問題例を削除して MMSE - J の妥当性と信頼性の訂正をした。また、次の 3 つの問 題を指摘した。1)日本の被験者では 100 - 7 課題が難しくはないので、100 - 7 の代わりに逆唱 を行うのは適切でない。2J - ADNI のデータには、ADMCI および健常者の診断が MMSE 得点を見て行われている例があり、算出された妥当性に問題がある。3J - ADNI データは MCI AD への変換率が通常の研究に比べ約 2 倍であるなど問題があるので、日本の ADNI のデータを使用せず、新たにデータを集め、信頼性と妥当性を検討する必要がある。本研究 ではこれら 3 つの問題を解決し、MMSE - J の標準化を完成するため、1100 - 7 と逆唱の問 題は MMSE2001)の注意・計算課題を施行して検討した。2)妥当性の検討では、外的基 準として DSM - 5 FAST を用い、その後、 MMSE - J を行った。3J - ADNI のデータを使わず、 新たに 381 例のデータを集め、標準化を行なった。妥当性と信頼性は 100 - 7 を拒否した 2 を除き 379 例を対象として検討した。 その結果、MCI 群と軽度 AD 群では性別、年齢、教育年数は得点に影響しなかった。健常 者群では教育年数が低い場合と、年齢が高い場合、MMSE - J 得点が低かったが、性別は得点 に影響しなかった。被験者で 100 - 7 課題が出来ない者は 5 名、拒否した者は 2 名でごく少数 であった。ROC 分析で、MCI 群と軽度 AD の最適カットオフ値は 23/24(感度 68.7%、特異 78.8%)、健常者群と MCI 群の最適カットオフ値は 27/28(感度 83.9%、特異度 83.5%)で あった。MMSE - J 原法の最適カットオフ値の弁別力は健常者と MCI との弁別には満足のい くものである。しかし、MCI AD との弁別は満足できる程度より低い。これらの結果は、 MMSE - J 原法が高くはないが妥当性があることを示している。再検査を行った 67 例の test - retest の相関係数は 0.77 であり、再検査信頼性は高い。本研究で得られた MMSE - J 原法の妥 当性と信頼性は、MMSE - J 原法が認知症のスクリーニング検査として使用可能であることを 示している。

Upload: others

Post on 04-Nov-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

91認知神経科学 Vol. 20 No. 2 2018

原  著

1)王子こころのクリニック2)美原記念病院3)国立病院機構宇多野病院4)日本赤十字看護大学5)船橋市立医療センター6)国立循環器病センター7)東京医科歯科大学

MMSE-J(精神状態短時間検査-日本版)原法の妥当性と信頼性

杉下 守弘1)、腰塚 洋介2)、須藤 慎治3)、杉下 和行1)、逸見  功4)、 唐澤 秀治5)、猪原 匡史6)、朝田  隆7)、美原  盤2)

Key words : MMSE-J、MMSE原法、ADNI、認知症、妥当性、注意・計算課題

【要旨】Mini-Mental State Examination(略称MMSE)は世界で最も使用されている認知症スクリーニング検査(原版は英語)といわれている。しかし、その日本語版は、翻訳や文化的適応が適切でないものが多く、十分な標準化も行われていなかった。MMSE原版は国際的に使用されているので、日本のデータと世界の他の国のデータを比較するために、MMSE原版と等価なMMSE日本語版の作成は急務と考えられた。そこで、2006年、原版に忠実な翻訳と適切な文化適応を目指したMMSE日本語版(MMSE-J)が作成された。MMSE-Jは国際研究「アルツハイマー病神経画像戦略(ADNI)」の日本支部(J-ADNI)で使用され、そのデータを基に、2010年、MMSE-Jの妥当性と信頼性が検討された。 ところが、2012年 3月、日本の ADNI(J-ADNI)データの改ざんが指摘され、2014年 3月には東京大学調査委員会に改ざんやプロトコル違反など問題例が報告された。その後、第三者委員会報告書はこれらの問題例を問題ないとした。しかし、この判断は誤りであることが明らかにされた11-13)。 杉下ら (2016)は、杉下らの論文(2010)の J-ADNIデータのうち改ざんやプロトコル違反などの問題例を削除してMMSE-Jの妥当性と信頼性の訂正をした。また、次の 3つの問題を指摘した。1)日本の被験者では 100-7課題が難しくはないので、100-7の代わりに逆唱を行うのは適切でない。2)J-ADNIのデータには、AD、MCIおよび健常者の診断がMMSE 得点を見て行われている例があり、算出された妥当性に問題がある。3)J-ADNIデータはMCIの ADへの変換率が通常の研究に比べ約 2倍であるなど問題があるので、日本の ADNIのデータを使用せず、新たにデータを集め、信頼性と妥当性を検討する必要がある。本研究ではこれら 3つの問題を解決し、MMSE-Jの標準化を完成するため、1)100-7と逆唱の問題はMMSE(2001)の注意・計算課題を施行して検討した。2)妥当性の検討では、外的基準として DSM-5 と FASTを用い、その後、MMSE-Jを行った。3)J-ADNIのデータを使わず、新たに 381例のデータを集め、標準化を行なった。妥当性と信頼性は 100-7を拒否した 2例を除き 379例を対象として検討した。 その結果、MCI群と軽度 AD群では性別、年齢、教育年数は得点に影響しなかった。健常者群では教育年数が低い場合と、年齢が高い場合、MMSE-J得点が低かったが、性別は得点に影響しなかった。被験者で 100-7課題が出来ない者は 5名、拒否した者は 2名でごく少数であった。ROC分析で、MCI群と軽度 AD の最適カットオフ値は 23/24(感度 68.7%、特異度 78.8%)、健常者群とMCI群の最適カットオフ値は 27/28(感度 83.9%、特異度 83.5%)であった。MMSE-J原法の最適カットオフ値の弁別力は健常者とMCIとの弁別には満足のいくものである。しかし、MCIと ADとの弁別は満足できる程度より低い。これらの結果は、MMSE-J原法が高くはないが妥当性があることを示している。再検査を行った 67例の test-retest の相関係数は 0.77であり、再検査信頼性は高い。本研究で得られたMMSE-J原法の妥当性と信頼性は、MMSE-J原法が認知症のスクリーニング検査として使用可能であることを示している。

Page 2: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

92 Japanese Journal of Cognitive Neuroscience

内容目次はじめにI. 方法 1. 対象とした被験者 2. 被験者の分類 3. MMSEの注意・計算課題の施行法 4. 本研究で検討した 4つの研究課題II. 結果 1. MMSE-J原法の「計算・注意課題」の検討 2. MMSE-J原法得点 への性別、年齢および教育年数の影響  1) 健常者のMMSE-J原法得点への性別、年齢および教育年数の影響     健常者 A群 175名(23-88歳)の分析     健常者 B群 127名(55-88歳)の分析  2) MCI群のMMSE-J原法得点への性別、年齢および教育年数の影響  3) 軽度 AD群のMMSE-J原法得点への性別、年齢および教育年数の影響   4) 健常者の年齢別のMMSE-J原法得点 3. MMSE-J原法の妥当性とカットオフ値  1) 健常者 B群(55歳以上)対MCI群の最適カットオフ値  2) MCI 群 対 軽度 AD 群の最適カットオフ値  3) 健常者 BおよびMCI群 対 軽度 AD 群の最適カットオフ値 4. MMSE-J原法の信頼性III. 考察 1. MMSEの翻訳の問題点  1) MMSE1975年版の翻訳の問題点  2) MMSE2001年版と日本語版MMSE 2. 日本語版MMSEの著作権 3. MMSE-J原法の標準化の長所 4. MMSE-J原法の「計算・注意課題」について 5. MMSE-J原法得点への性別、年齢および教育年数の影響 6. 妥当性およびカットオフ値について  7. 再検査信頼性について 8. MMSE-J原法のスクリーニング検査としての役割おわりに

はじめにMini Mental State Examination(略称MMSE)(精神状態短時間検査) (Folstein et al. 19751)、Folstein

et al. 20012))は英語の認知症スクリーニング検査であり、世界で最も使用されているといっても過言ではないであろう。MMSEは多くの国際的研究や治験で使用されているので、英語が母国語でない国々ではその国の自国版を作成せざるを得ない状況である。このようなことは、過去には、ビネー知能検査、ウェクスラー知能検査、MMPIなどの国際的に使われた検査で起こったことである。MMSEの日本語版はMMSE原版が公刊された 10年後の 1985年森らによってMMSE日本語

版が作成された(森・他 19853))。ついで、 1991

年北村により改良されたMMSE日本語版が公刊された(北村 19914) ワールドプランイング)。これらの日本語版の翻訳や文化的適応は原版をより鋭敏な検査にすることを目指しており、原版と日本語版との等価性への志向が欠けていた。これは、 2000年より前にはMMSEは現在ほど国際的に使用されていなかったからであろう。2000年に小海・他(2000)5)は、原版と日本語版との等価性が欠けていることを指摘し新しい日本語版を作成した。しかし、この検査でも原版との等価性に問題があった。また、日本語版の標準化に関して、従来の 3つのMMSE日本語版は、現在、検

Page 3: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

93認知神経科学 Vol. 20 No. 2 2018

査対象として最も多い、軽度アルツハイマー病患者(AD)、軽度認知障害患者(MCI)、及び健常者という組み合わせを対象としていないという問題があった 3,5,6)。

MMSE原版は国際的に使用されているので、認知機能に関する日本のデータと世界の他の国のデータの比較を可能にするため、MMSE原版と等価なMMSE日本語版の作成は急務と考えられた。そこで、2006年になって、原版との等価性をめざし、原版に忠実な翻訳と適切な文化適応を試みた日本語版、MMSE-J (精神状態短時間検査-

日本版)(杉下守弘 20067))が作成された。そして、同年、国際プロジェクト「アルツハイマー病神経画像戦略」(「Alzheimer Disease Neuroimaging Ini-

tiative」(略称 ADNI、アドニ)が日本で J-ADNI

(ジェイ-アドニ)として始まった。日本のADNI(J-ADNI)で原版と等価性のある MMSE

日本語版を使用する必要があり、MMSE-J(杉下20067))が採用された。日本の ADNI(J-ADNI)は 2007年から軽度 AD、MCI及び健常者のデータの収集をはじめ、2010年 7月には 313例のデータが集まったので、このデータを用いて、MMSE-Jの標準化がなされ (杉下、逸見 JADNI

研究 20108))、MMSE-Jの使用者の手引きと記録用紙が 2012年 2月に出版された(杉下 20129)、杉下 201210)、日本文化科学社)。ところが、2012年 3月日本の ADNI(J-ADNI)のデータに改ざんがあることが指摘され、2014

年 3月には東京大学調査委員会に杉下、朝田によって、改ざんやプロトコル違反など問題例 105

例が報告された。その後、2014年 10月に第三者委員会に問題例として 129 例が報告された。第三者委員会 報告書はこれらの問題例を調べ、問題ないと判断した。しかしながら、筆者(杉下)による 4回にわたる第三者委員会に対する反論により、第三者委員会の問題がないという判断は誤りであることが明らかにされた(http://www.geocities.

jp/shinjitunodentatu/daisannsyaiin.html参照11)。詳細

は杉下、逸見、竹内(2016)12)、および http://

sinjitunodentatu.web.fc2.com/ を参照13))。しかし、J-ADNI の研究代表者岩坪威氏は 2016

年 1 月末に J-ADNI のMMSE-Jのデータを是正することなく日本科学技術振興機構から研究者に

制限公開した(http://humandbs.biosciencedbc.jp/

hum0043-v1)14)。これに対し、杉下、逸見、竹内(2016)12)は、杉下らの論文(2010)8)の J-ADNIデータのうち改ざんやプロトコル違反などがあった問題例を削除してMMSE-Jの妥当性と信頼性の訂正をした。また、この論文(2016)12)で次の 3つの問題を指摘した。1)MMSEの下位検査である「注意・計算課題」において、日本の被験者では

100-7課題が難しいわけではないので、100-7の代わりに逆唱課題を行うのは適切でない。2)J-ADNIのデータには、アルツハイマー病(AD)、軽度認知障害(MCI)および健常者の診断がMMSE得点を見てなされている被験者がおり、算出された妥当性に問題がある。3)日本のADNI データには、MCIから ADへの変換率が通常の研究に比べ約 2倍であること(Petersen et al.

201015)、朝田 201116))など問題があるので、日本の ADNI のデータを使用しないで、新たに

MMSE-J のデータを集め、MMSE-J の信頼性と妥当性を検討する必要がある。本研究では杉下、逸見、竹内論文(2016)12)で指摘した 3つの問題を解決し、MMSE-J の標準化を完成させるため、1)「注意・計算」課題の施行方法を 2001年版MMSEの注意・計算課題の施行方2)でおこない、100-7課題の難しさ、100-7課題の拒否はどのくらいあるかなどを検討した。2001年版MMSEの注意・計算課題の施行方法とは、被験者が 100-7課題を行うことを拒否した場合、被験者に “worldという単語の(アルファベットの)綴りを前から言ってください。それから、後ろから言ってください(backward spelling)”と求めるというものである。しかし、日本語では綴り名がなく、backward spellingが出来ないので、

Page 4: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

94 Japanese Journal of Cognitive Neuroscience

代わりに単語の逆唱課題をすることにした。2)妥当性の検討のため、外的基準として DSM-5

(2013)17)と FAST(1988)18)を用いた。3)日本の

ADNI のデータを 使用しないで、新たに MMSE-J

のデータを集め、 MMSE-J の妥当性と信頼性を検討した。

I. 方法1. 対象とした被験者MMSE-J原法の標準化のために対象とした被験者は 6つの病院あるいはクリニック(美原記念病院、 王子こころのクリニック、国立病院機構宇多野病院、船橋市立医療センター、国立循環器病センター病院、メモリークリニックお茶の水)に受診している患者および健常者の志願者で、合計381名であった。すべて、教育年数8年以上であり、被験者からは書面で研究に参加することについて承諾を得た。研究計画については 6施設の倫理委員会の承諾を得た。注意/計算課題の施行法の原法を被験者 381例の被験者に行ったところ、軽度ADの 2名が 100-7を行うのを拒否したので、この 2例には単語「世界地図」の逆唱課題もおこなった。このような例は 2 名しかなかったので、

MMSE-J得点への性別、教育、年齢の影響を検討する研究課題、妥当性や信頼性妥当性の研究課題では被験者から除外した。したがって、これら 3

つの研究課題では全被験者は 379名である。その内訳は健常者 175名(23歳-54歳の健常者 48名、55歳~88歳の健常者 130名)、MCI例(56歳から 89歳)137名、軽度 AD(60歳から 89歳)67

名である。全被験者 379名の健常者群、MCI群、軽度 AD

群をくらべると、MCI群、軽度 AD群は 55歳から 89歳の範囲であるが、健常者は 23歳から 88

歳の健常者に及んでいる。MMSE-J得点は年齢の影響を受けるので、健常者 175名(健常者 A群)のうち 23歳から 54歳の 48名を除き、55歳~88

歳の 127名からなる健常者群 Bを作り、3群の年齢範囲を同じにした。MMSE-Jの妥当性と信頼性を検討する際はこの 3群、合計 331名を対象とした。その内訳は、健常者 127名(健常者 B群)、軽度MCI例 137名、軽度 AD 67名である(Table

1)。55 歳-89 歳の被験者 331 名のうち初回の

MMSE-Jの検査の後に再検査を受けた被験者が67例(健常者 37名、MCI 22名 軽度 AD 8名)であった。この 67例は 2015年 7月から 2017年

Table 1 全被験者 379例(23歳-89歳)

AgeClassification 23-54 55-64 65-74 75- Total

Normal 48 35 50 42 175 Male 23 15 15 15 68 Female 25 20 35 27 107MCI 0 9 41 87 137 Male 0 3 21 32 56 Female 0 6 20 55 81Mild AD 0 2 18 47 67 Male 0 2 5 17 24 Female 0 0 13 30 43Total 48 46 109 176 379 Male 23 20 41 64 148 Female 25 26 68 112 231

Page 5: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

95認知神経科学 Vol. 20 No. 2 2018

5月までに検査された例である。初回検査と再検査の間隔は 3-9カ月(平均 144.4日、SD 38.8)であった。

2. 被験者の分類被 験 者 は DSM-5(2013)17)、FAST(1988)18)、およびWAIS知能検査の標準化における除外基準(2006)19)を用いて選ばれ、健常者群、MCI群及び軽度 ADの 3群に分類された。DSM-5(2013)17)

の認知症と軽度認知障害の診断基準では「標準化された神経心理学検査あるいは、定量化された臨床的評価を行うことが望ましい。」としている。しかし、日本では、神経心理学検査の多く、例えば、CDR, ADAS-COG原版などは標準化されていないので施行しなかった。なお、FAST(1988)18)

はアルツハイマー病の重症度を見るために施行した。本研究の軽度 ADとは、厳密に言うと、DSM-5

の probable ADの軽度の例である。まず、アルツハイマー病(AD)については、DSM-5の診断基準で診断し、ADの重症度を FASTで評価し、FASTの 4点の場合、probable ADの軽度、すなわち、軽度 probableAD(Mild AD)とした。軽度認知障害(MCI)とは、厳密には possible

アルツハイマー病による健忘型軽度認知障害である。Possible MCIは DSM-5の診断基準により診断した。軽度認知障害(MCI)が健忘型か否かは、問診、情報提供者からの病歴、現症についての情

報に基づき Petersenの定義(Petersen 1999)20)を参照して、評定した。健常者の定義はWAIS知能検査の標準化における除外基準(2006)19)に従った。

3. MMSEの注意・計算課題の施行法MMSEの下位検査である注意・計算課題の施行法には、本来、1975年版MMSE1)の注意・計算課題の施行法と 2001年版MMSE2)の注意・計算課題の施行法しかない。しかし、実際には 5つの方法が用いられている。5つの方法のうちどれを採用するかによって、MMSEの得点が変化する可能性があり、混乱を招いている。以下にその5つの方法を述べ、本研究でどれを採用したかを述べる。

1) 第一の方法は、1975年版MMSEの注意・計算課題の施行法(Folstein et al. 19751))で、「患者が 100-7課題を行うことが出来なかったり、しようとしなかったりした場合、worldという単語の backward spelling (単語の語尾から語頭に向かってアルファベットの綴りを言うこと)が求められる。」というものである。この方法の第 1の問題点は 100-7課題が出来ない場合、100-7課題よりやさしい backward spellingを行うことである。米国では、100-7課題が出来なくても、back-

ward spellingは易しいので、2点をとれることがしばしばある。一方、100-7課題が 1題出来た被験者は、1点取れるだけであり、不公平になると

Table 2 再検査した 67例

AgeClassification 55-64 65-74 75- Total

Normal 8 14 15 37 Male 4 6 3 13 Female 4 8 12 24MCI 0 6 16 22 Male 0 4 7 11 Female 0 2 9 11Mild AD 0 0 8 8 Male 0 0 3 3 Female 0 0 5 5

Page 6: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

96 Japanese Journal of Cognitive Neuroscience

いう欠点がある。第 2の問題点は、100-7課題が出来ないことを確かめ、その後、backward spell-

ingを行うと、100-7課題だけ行うのより、記銘課題と再生課題の間が長くなるので、再生課題の得点が下がる可能性があるという欠点がある。第 3の問題点は、日本語の文字には文字に付随する発音はあるが、綴り名(アルファベットの/

エイ/、/ビー/、/シィー/など)はなく、綴りを言うことはできないので、backward spellingはできない点である。そこで、日本語で 1)の方法をおこなうには backward spellingの代わりに類似課題である「単語の逆唱」課題を行うしかない。MMSE日本語版の北村版はこの第 1の方法を採用している。

2) 第 2の方法は、2001年版 MMSEの注意・計算課題の施行法(Folstein et al. 20012))で、「被験者が 100-7課題を行うことを拒否した場合、被験者に worldという単語の forward spelling(単語の語頭から語尾へアルファベットの綴り)を言うように求め、それから、backward spellingを求める。」というものである。日本語の場合は「単語の逆唱や順唱」を行わざるを得ない。第 2の方法が第 1の方法より改善しているのは、100-7課題をおこなって出来なかった場合、backward spell-

ingや逆唱は行わない点である。第 2の方法の問題点は、拒否された時、back-

ward spellingや逆唱をすることになる。100-7をやらずに、拒否すると、逆唱が 100-7よりやさしいので得点が高くなる点にある。第 2の方法を日本語でおこなうと生ずる第 2の問題点は、back-

ward spellingや forward spellingの代わりに類似課題である「単語の逆唱や順唱」を行わざるを得ない点である。

3) 第 3の方法は、100-7課題を行わず、代わりに worldという単語の backward spellingを行う手続きである。米国では 100-7が出来ない被験者がかなり存在するので第 3の手続きを用いることが多い。国際プロジェクト「アルツハイマー病神

経画像戦略」(略称 ADNI)は米国やカナダなどでこの方法を用いた。

4) 第 4の方法は、100-7課題のみを行ない、world という単語の backward spellingは行わないというものである。MMSE日本語版の森版と小海版はこの方法を採用している。

5) 第 5の方法は 100-7課題と単語「world」の backward spellingの両方を行う方法である。この方法では、両方のデータが取れるので、第 3の方法や第 4の方法のデータと比較出来るし、100-7課題と backward spelling課題のうち良い方の成績を採用することも可能である。しかし、この方法は第 1の方法と同様、記銘課題と再生課題の間が長くなるので、再生課題の得点が下がる可能性があるという欠点がある。国際プロジェクト「アルツハイマー病神経画像戦略」は日本(J-ADNI)では第 5の方法が用いられた。2010

年(杉下、他の論文8))や 2016年の論文(杉下、逸見、竹内、201612))は J-ADNIのデータを用いたので第 5の方法について妥当性と信頼性を検討した。注意・計算課題の施行法は上述したように 5つある。このうち、第 1と第 2の方法がMMSEの原著者が発表した方法である。2つのうち、2番目の 2001年MMSE2) 注意・計算課題の施行法の方が改良されており、適切な方法と考えられるので、本研究では、2001年MMSE2) 注意・計算課題の施行法を用いることにした。そして、「日本の被験者では 100-7課題が難しいわけではないので、100-7課題の代わりに逆唱課題を行うのは適切ではないという指摘」を検討する研究課題すなわち、「MMSE-J原法の計算・注意課題の検討」だけでなく、以下に述べる 3つの研究課題の検討にも用いた。なお、本研究では、100-7課題を拒否した場合、world の forward spelling backward

spellingの代わりに、「世界地図」という単語の順唱と逆唱を行わせることにした。2001年版MMSEの注意・計算課題の施行法を使った

Page 7: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

97認知神経科学 Vol. 20 No. 2 2018

MMSE-Jを「MMSE-J原法」と略称することにする。

4. 本研究で検討した 4つの研究課題本研究の 4つの研究課題を 2001年版MMSEの

注意・計算課題の施行法を使ったMMSE-Jすなわち「MMSE-J原法」を用いて検討した。

1)  MMSE-J原法を用いた注意/計算課題の検討

MMSE-J原法をもちいて「日本の被験者では

100-7課題が難しいわけではないので、100-7課題の代わりに逆唱課題を行うのは不適切である。」という指摘を検討することとした。具体的に言うと、日本の被験者では 100-7課題が難しくないことは 2016年の研究でもわかっていたが、本研究で、具体的な数字を出し、さらに、100-7課題を拒否する被験者数を出す。そして、このような具体的な数字が出たところで、注意/計算課題をどのように行うべきかを検討するなどである。

2)  MMSE-J原法得点に及ぼす性別、年齢別及び、教育年数の影響

性別、年齢別及び、教育年数がMMSE-J原法

得点に影響を及ぼすか否か検討した。この課題は、23-88歳の健常者 A群 175名、55-88歳の健常者B群 127名、55-89歳のMCI群 137名 55-89歳の軽度 AD群 67名の 4群に分けて検討した。被験者の得点は正規分布しないので、性別、教育歴別の比較にはWilcoxon rank sum testを用い、年齢別の比較には、年齢層が 2つなら Wilcoxon rank

sum testを、 3つなら Kruskal- Wallis testを用いた。多重比較は Bonferroni法(対比較に Wilcoxon rank

sum testを利用)を行った。3) MMSE-J 原法の妥当性とカットオフ値MMSEは認知症を検出する選抜(スクリーニング)検査として用いられることが多い。そこで、MMSE-Jの妥当性を検討するのに、55~89歳までの 331例(健常者群 127名、MCI 群 137名。軽度 AD 67名)を対象として ROC分析を行い、

健常群 対MCI群の最適カットオフ値、MCI群 対

軽度AD群の最適カットオフ値を求めた。そして、それらのカットオフ値の感度と特異度を妥当性の指標とした。

4) MMSE-J原法 の再検査信頼性

被験者のうち、初回検査だけでなく再検査をした 67名(健常者 37名、MCI 22名、軽度 AD 8名)を対象として、MMSE-J原法 の初回検査得点と再検査時の検査得点の相関係数を計算した。初回検査と 3-9カ月後の再検査のいずれも同じ検査者が検査をした。

II. 結果

1.  MMSE-J原法の「計算・注意課題」の検討MMSE-J原法の注意/計算課題の施行法を被験者 381 例(健常者 A 群 175 名、MCI 群 137 名。軽度 AD 69名)の被験者に行ったところ、100-7

課題がまったく出来なかった例は 381例中 5例であった。この 5例はすべて、軽度 AD であった。(MMSE1975年の注意・計算課題では、100-7課題が出来なかった場合には逆唱問題をすることになるが、この 5例には逆唱問題をすることを検査者は求めなかった。)日本人で 100-7課題が出来ない被験者は健常者や MCIにはなく、軽度 AD

67名中 5例のみであるから、日本人にとっ

て、 100-7課題は易しい課題であることがわかる。なお、100-7課題をやろうとしない被験者はひとりもいなかった。次に、381例の被験者のうち、 100-7課題を行

うことを拒否した被験者数を見てみると、軽度ADの 2名(上述の 5例とは別の被験者である。)が 100-7課題を行うのを拒否した。この 2例には単語「世界地図」の逆唱課題を行なった。本研究のように、軽度 AD、MCI,及び健常者を対象とした場合、100-7課題を拒否する被験者はほとんどいないわけである。いいかえれば、100-7課題のみをおこなう方法と同じになるという結果である。

Page 8: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

98 Japanese Journal of Cognitive Neuroscience

100-7課題を拒否した 2例は 100-7課題にデータはなく、逆唱課題のデータしかないので、本研究の課題 4つのうち、以下の 2~4の研究課題では被験者から除外した。

2.  MMSE-J原法得点への性別、年齢および教育年数の影響

健常者 A群 23-88歳 (175名)から 23-54歳の48名を除いた健常者 B群 55-88歳 (127名)、軽度認知障害群 55-89 歳(137 名)、軽度 AD 群55-89 歳(67 名)の 3 群について検討した。55-88歳の健常者 B群 127名を設定したのは、軽度MCI群と軽度 AD群の年齢が 55-89歳なのでこれに合わせるためである。

1)  健常者のMMSE-J原法得点への性別、年齢および教育年数の影響

健常者 A群 23-88歳(175名)の分析性別 : 健常者 A群 175名ではMMSE-J原版得

点に男女による有意差は認められなかった(p=0.12、Wilcoxon rank sum test、Table 3 参照)。教育年数 : 教育年数 8-15年の群の方が教育年

数 16年以上の群より平均得点が 5%水準で有意に低かった(p<0.001、Wilcoxon rank sum test)。得点と教育年数との Spearmanの順位相関係数は0.45(p<0.001)と正の相関が認められた。年齢別 : 健常者 A群でMMSE-Jの得点に年齢による有意な差がみられた(p<0.001、Kruskal-

Wallis test)。Bonferroni 法の多重比較を行ったところ、 23-54歳の群の得点は 55-74歳の群の得点より有意に高く(p<0.001、Bonferroni法)、23-54

歳の群の得点は 75 歳以上の群の得点より有意に高かった(p<0.001、Bonferroni法)。しかし、55-

74歳の群と 75歳以上の群では、55-74歳の群のほうが得点が高い傾向は認められたが 5%水準で有意でなかった。(p=0.089、Bonferroni 法)。健常者 A群における得点と年齢との Spearmanの順位相関係数は-0.44(p<0.001)と負の相関が認められた。健常者 B群 55-88歳(127名)の分析性別 : MMSE-J原法得点に男女による有意差はな か っ た( 健 常 者 Wilcoxon rank sum test、p=0.39、Table 4参照)。教育年数別 : 教育年数 8-15 年の群が教育年数

16 年以上の群より平均得点が 5%水準で有意に低かった(p=0.026, Wilcoxon rank sum test)。得点と教育年数との Spearmanの順位相関係数は0.33(p<0.001)で正の相関が認められた。年齢別 : 健常者 B群は健常者 A群から 23歳-54

歳の被験者を除いた群なので、健常者 A群と B

群の 55-74歳の群と 75歳以上の群の被験者は同じである。したがって、健常者 B群の 55-74歳の群と 75歳以上の群の得点の比較結果は健常者A群と同じである。55-74歳の群と 75歳以上の

Table 3  健常者 A群(23-88歳)のMMSE-J原法得点への性別、年齢および教育年数の影響

 Normal A 175名   N Mean(SD) p value

Sex Male 68 29.3 (1.1) 0.12*Female 107 29.0 (1.3)

Years of Education 15 under 120 28.8 (1.3) <0.001*16 over 55 29.6 (0.7)

Age ① 23~54 48 29.8 (0.5) <0.001**② 55~74 85 29.0 (1.2) ①>② ***①>③ ***③ 75 over 42 28.6 (1.4) ②=③ ***

* Wilcoxson rank sum test, ** Kruscal-Wallis test, Multiple comparison by Bonfferoni correction ①>② (p<0.001), ①>③(p<0.001), ②=③ (p=0.089).

Page 9: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

99認知神経科学 Vol. 20 No. 2 2018

群では、55-74歳の群のほうが得点が高い傾向は認められたが 5%水準で有意でなかった。(p=0.089、Bonferroni法)。得点と年齢との Spearman

の順位相関係数は-0.27(p=0.002)と負の弱い相関が認められた。健常者群は、 23-88歳の健常者 A群 175例で

MMSE-J原法得点は年齢と教育年数によって影響をうけていた。23-54歳を除いた健常者 B群 127

例では年齢の影響はなかったが、教育年数によって影響をうけていた。そこで、年齢と教育年数とでは有意な関連があるかどうか検討した。年齢と教育年数との Spearmanの順位相関係数は-0.28

(p=0.001)で、有意な負の弱い相関が認められた。2)  MCI群(55歳-89歳)のMMSE-J原法得点への性別、年齢および教育年数の影響

性別 : MCI群(137名)では、MMSE-J原法

の平均得点は男女で 5%水準での有意な差はなかった(p=0.16、Wilcoxon rank sum test)。教育年数別 : 教育年数 16 年以上の群と教育年数 8-15年の群で平均得点に 5%水準で有意差はなかった(p=0.61、Wilcoxon rank sum test)。得点と教育年数との Spearmanの順位相関係数は0.10(p=0.26)で相関は認められなかった。年齢別 : 75歳以上の群と 55-74歳の群で平均得点に有意差はなかった(p=0.90、Wilcoxon rank

sum test)。得点と年齢との Spearmanの順位相関係数は-0.09(p=0.29)で相関は認められなかった。

3)  軽度 AD群 55-89歳のMMSE-J原法得点への性別、年齢および教育年数の影響

性別 : 軽度 AD群(67名)では、MMSE-J原法得点に男女による有意差はなかった(健常者

Table 4  健常者 B群(55-88歳)のMMSE-J原法得点への性別、年齢および教育年数の影響

Normal B 127名N Mean(SD) p value

Sex Male 45 29.0(1.2) 0.39*Female 82 28.7(1.4)

Years of Education 15 under 101 28.7(1.4) 0.026*16 over 26 29.3(0.9)

Age ① 55~74 85 29.0(1.2) 0.089**② 75 over 42 28.6(1.4)

  * Wilcoxson rank sum test, ** Kruscal-Wallis test

Table 5  MCI群(137名)のMMSE-J原法得点への性別、年齢および教育年数の影響

MCI 137名    N Mean(SD) p value

Sex Male 56 25.7(2.1) 0.14Female 81 25.2(2.3)

Years of Education 15 under 119 25.4(2.3) 0.6116 over 18 25.7(2.1)

Age ① 55~74 50 25.3(2.5) 0.90② 75 over 87 25.4(2.1)

Page 10: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

100 Japanese Journal of Cognitive Neuroscience

Wilcoxon rank sum test、p=0.65)。教育年数 : 教育年数 16 年以上の群と教育年数

8-15 年の群とで平均得点に有意差はなかった(p=0.73、Wilcoxon rank sum test)。得点と教育年数との Spearmanの順位相関係数は 0.12(p=0.33)で相関は認められなかった。年齢 : 75歳以上の群と 55-74歳の群とで平均

得点に有意差はなかった(p=0.41、Wilcoxon rank

sum test)。得点と年齢との Spearmanの順位相関係数は-0.17(p=0.17)で相関は認められなかった。健常者 A群(23歳-88歳)175名では年齢と教育年数が得点に影響を及ぼすことが明らかになった。しかし、性別による得点への影響はみとめられなかった。年齢が得点に及ぼす影響について詳しく述べると、25-54歳の群と 55-74歳の群、25-54歳の群と 75 歳以上の群の二つの対の間には有意差(いずれも p<0.001、Bonferroni法)が認められたが、55-74歳の群と 75 歳以上の群の間には有意差はなかった。健常者 B群(55歳-88歳)127名では教育年数が得点に影響を及ぼしていた。しかし、性別と年齢の得点に影響はみとめられなかった。年齢の得点に影響はみとめられなかった理由は、健常者 B

群では、健常者 A群の 23歳から 54歳の被験者が除かれているからである。

MCI 群(55歳-89歳)137名と軽度 AD群(55

歳-89歳)67名では、性別、教育年数、年齢のいずれも得点への影響はなかった。健常者群では年齢や教育年数が得点に影響を及ぼすことが明らかになったので次に健常者の年齢別のMMSE-J原法の得点を示す。

4)  健常者の年齢別のMMSE-J原法得点、平均値および標準偏差

健常者 A群では性別の得点に影響はみとめられなかったが、年齢や教育年数が得点に影響を及ぼすことが明らかになった。健常者 B群では性別と年齢の得点に影響はみとめられなかったが、教育年数が得点に影響を及ぼしていた。年齢は23-54歳、55-74歳、75歳以上の 3層に分けて、MMSE-J原法の得点の平均値と標準偏差を Table

7 に示した。3. MMSE-J原法の妥当性 とカットオフ値被験者 379例のうち、54~89歳までの 331例(健常者 B群 125名、MCI群 137名。軽度 AD 67名)を対象に ROC 分析をおこない、健常者 B群 対MCI群、MCI群 対 軽度 AD群、健常者 B群+MCI群 対 軽度 AD群の 3対について、MMSE-J

得点の最適カットオフ値を Receiver Operating

Characteristic Curve Analysis(ROC 分析) によって求めた。

Table 6  軽度 AD群(55-89歳)のMMSE-J原法得点への性別、年齢および教育年数の影響

Mild AD 群 67名N Mean(SD) p value

Sex Male 24 22.2 (3.4) 0.65Female 43 21.9 (2.8)

Years of Education 15 under 56 22.0 (2.8) 0.7316 over 11 21.9 (4.1)

Age ① 55~74 20 22.5 (3.6) 0.41② 75 over 47 21.8 (2.8)

Page 11: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

101認知神経科学 Vol. 20 No. 2 2018

1)  健常者 B群(55歳-88歳)対MCI群(55

歳-89歳)の最適カットオフ値ROC曲線(Fig. 1)の曲線下面積は 0.907(95%

信頼区間 0.868-0.939)であった。健常者(55歳以上)とMCI群(アルツハイマー病による pos-

sible健忘型MCI群)の最適カットオフ値は 27/28

であり、その感度は 83.9%で、特異度は 83.5%

であった。感度が最大値のカットオフ値は 29/30

で、その感度 97.8%であり、特異度は 40.2%であった。したがって、MCIの 100人中、MMSE-J30

点は 2人ということになる。特異度が最大値のカットオフ値は 19/20であり、その特異度 100%

であり、感度は 0%であった。したがって、健常者の 100人中、MMSE19点は一人もいないということになる。

2)  MCI 群 (55歳-89歳) 対 軽度 AD群(55

歳-89歳の最適カットオフ値ROC曲線(Fig. 2)の曲線下面積は 0.814(95%

信頼区間 0.751-0.870)であった。MCI群(possible

アルツハイマー病による健忘型MCI群)と軽度AD群(軽度 probable AD群)の最適カットオフ値は 23/24 で、その感度は 68.7%、特異度は78.8%であった。感度が最大値のカットオフ値は29v30であり、その感度 100%、特異度は 2.2%であった。したがって、100人の軽度 AD のうちMMSE-J原法 30点は一人もいないということになる。特異度が最大値のカットオフ値は 14/15であり、その特異度は 100%、感度は 0.0%、であった。したがって、100人の MCI のうち MMSE-

J14点は一人もいないということになる。

Fig. 1 ROC曲線健常者 B群(55歳-88歳) 対 MCI群(55歳-89歳)

Specificity

Sen

sitiv

ity

1.0 0.8 0.6 0.4 0.2 0.0

0.0

0.2

0.4

0.6

0.8

1.0

23.000 (0.788, 0.687)

Fig. 2 ROC曲線 MCI群(55歳-89歳) 対 軽度 AD群(55歳-89

歳)

Table 7  健常者 A群 23歳-88歳(175名)、MCI群 55歳-89歳(137名)および軽度 AD群 55歳-89歳(67名)における年齢別の人数、MMSE-J原法得点、平均値および標準偏差

Age 23-54 55-74 75- Total

n・M(SD) n M(SD) n M(SD) n M(SD) n M(SD)

NormalMCIMild AD

48NA*NA*

29.8(0.5)NA*NA*

855020

29.0(1.2)25.3(2.5)22.5(3.6)

428747

28.6(1.4)25.4(2.1)21.8(2.8)

175137 67

29.1(1.2)25.4(2.2)22.0(3.0)

  NA : not available

Page 12: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

102 Japanese Journal of Cognitive Neuroscience

3)  健常者 BおよびMCI群(55歳-88歳)対

軽度 AD 群(55歳-89歳)の最適カットオフ値

ROC曲線(Fig. 3)の曲線下面積は 0.897(95%

信頼区間 0.86-0.934)であった。健常者およびMCI群 対 軽度AD 群の最適カットオフ値は 24/25

であった。その感度は 79.1%、特異度は 82.2%であった。健常者群(55歳以上)対 MCI群(possibleア

ルツハイマー病による健忘型MCI群)の最適カットオフ値は 27/28で、感度 83.9%、特異度 83.5%

であり、いずれもかなり高い。MCI 群(possible

アルツハイマー病による健忘型MCI群) 対 軽度AD 群(軽度 probable AD群)の最適カットオフ値 23/24で、感度 68.7%、特異度 78.8%であり、いずれも高いとは言えない。これらの結果はMMSE-J原法が高くはないが妥当性があることを示している。

MCI群と軽度 AD群との最適カットオフ値は23/24であるから、MMSE-J原法で 23点以下ならば、軽度 probableアルツハイマー病(AD)であることを示唆している。また、健常者群MCI群との最適カットオフ値は 27/28であるから、24点

以上 27点以下ならば possibleアルツハイマー病による健忘型MCIを、28点以上なら健常者であることを示唆している。

4. MMSE-J原法の信頼性55-89歳までの 331名のうち、3-9カ月後の再検査を受けた 67例(NL 37名、MCI 22名、AD 8

名)を対象とした。67例は男性 27名、女性 40名、年齢は 57-87歳で、平均年齢 75.0(SD 7.49)であった。2回検査を受けた 67例の群は 2回とも注意計算課題で 100-7課題を拒否しなかったので100-7課題をおこなった。MMSE-J原法得点、1

回目と 2回目の散布図が Fig.4に示してある。MMSE-J原法の信頼性を算出するため、初回検査のMMSE-J原法得点と 3-9カ月後の再検査時の得点との相関係数(Pearsonの product-moment

correlation)を算出したところ、test-retest の相関係数は、0.77(95%信頼区間 0.65~0.86、t=10.03、df=65、p<0.001)であった。この結果はMMSE-J

原法に高い再検査信頼性があることを示している。以前の研究(2016)の 100-7版の結果は 0.80

であり、今回の結果とほぼ同じである。

III. 考察本研究の考察を始めるにあたり、まず、以前の

MMSEの日本語への翻訳、版権、カットオフ値

Specificity

Sen

sitiv

ity

1.0 0.8 0.6 0.4 0.2 0.0

0.0

0.2

0.4

0.6

0.8

1.0

24.000 (0.822, 0.791)

Fig. 3  ROC曲線  健常者 BおよびMCI群(55歳-89歳) 対 軽

度 AD群(55歳-89歳)

Fig. 4 MMSE-J原法得点、1回目と 2回目の散布図    重なる点はずらして表示してある。

Page 13: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

103認知神経科学 Vol. 20 No. 2 2018

などの問題点を明らかにし、MMSE-Jが従来のMMSE日本語版の問題点をどのように改善したかを述べたい。

1. MMSEの翻訳の問題点1) MMSE1975年版の翻訳の問題点MMSEが発表された 1975年の 10年後の 1985

年、森、他(1985)3)によってMMSE1975年版の日本語版としてMMSE-森版が発表された。1991

年、北村俊則(1991)4)によってMMSE1975版の日本語版としてMMSE-北村版が発表された。その後、2000年に、小海・他(2000)5)は、森版や北村版では原版と相違する点があることを指摘し、それらを是正してMMSE-小海版を作成した。しかし、これら 3つの日本語版はMMSEを日本文化に適応させるためいろいろ工夫されているが、原版と異なる点があるのが問題である。以下各項目についてその問題点を述べ、MMSE-Jでは原版と等価にするためどのように翻訳し、どのように文化的適応をしたかについて述べる。見当識MMSE1975年版では、年、季節、date(日か?)、

day、月を聞いている。一方、日本語版の森版と小海版では、「何時頃」と時間も聞いており、MMSE1975年にない項目が検査されている。原版との等価性を考えると時間は聞かない方が良いと考えMMSE-Jでは、時間は聞いていない。注意と計算MMSE1975年版では、100-7が出来なかったり、

しようとしなかった時には backward spellingをすることになっている。しかし、森版と小海版では100-7課題しか行わない。MMSE-Jでは、MMSE

1975年版ではなく、次節で述べる 2001年版に従い、100-7を行いことを拒否した場合、逆唱問題を行わせた。復唱原版では、復唱課題は「No ifs ands or buts」であるのに、森版は「ちりもつもれば、やまとなる」、

北村版は「みんなで、力を合わせて綱を引きます」、小海版は「海の中に、魚がいます。」となっており、いずれも、原版の「No ifs ands or buts」の翻訳としては適切とは言えない。「No ifs ands or buts」は子供が親に言い訳をしたり、グズグズ言ったりした時、親が子供をたしなめるために使う慣用句である。そして、英米では、失語の復唱障害を検査するときに使用される。これと等価な日本語の慣用句は何かというとかなり難しい。森版の「ちりもつもれば、やまとなる」は良くできているが、適切とはいえない。MMSE-Jでは「つべこべいっても、だめ」を採用した。これは意味も長さも「No

ifs ands or buts」に近いからである。三段階命令原版では「Take a paper in your right hand, and put

it on the floor」という命令課題で、1枚の紙を使用して検査する。一方、森版は「大きい方の紙を取り、半分に折って、床に置く」という翻訳になっている。森版は 25モーラの長さで、長さはよいが、原版では「右手で」となっている部分が、森版は「大きい方の」にと変えられている。また、紙を大小二枚使用している点も原版と異なっている。北村版も小海版も翻訳は正しいが、48モーラあり、命令文の長さが長く、原版にくらべ長すぎる。命令文は長ければ、長いだけ理解が難しくなる。このため、MMSE-Jでは命令文として「紙を右手に取って、それを半分に折り、床においてください。」を用いた。この文は 30モーラであり、森版のように命令文の最後を「床に置く」にすれば、森版と同じ 25モーラになるが、「床においてください」にした。被験者に丁寧であり、理解もしやすいからである。図形の模写原版では重なった 5角形を検査者が描き、それを被験者が模写する課題である。森版では、立方体透視図を模写させており、原版とは異なっている。この図の方が構成失行を検出するには有利と考えたのであろう。しかし、重なった 5角形の模

Page 14: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

104 Japanese Journal of Cognitive Neuroscience

写より立方体透視図の模写の方が難しい。原版との等価性が重要なので、重なった 5角形の模写の方が望ましいと考え、MMSE-Jでは重なった 5角形の模写を採用した。このように、以前の 3つの日本版は 1975年版

MMSEの原版と等価とは言えないという問題点がある。

2) MMSE2001年版と日本語版MMSE2001年、 Forstein et al.によって MMSEについ

て小さな改訂が行われ、2001年版MMSE 原版が公表された(Forstein et al. 2001)。この原版では見当識の day が day of weekに改訂され、曜日であることがはっきりした。また、場所の見当識として、「病院の名前」を尋ねる質問があったが、見当識を検査しているとは言えないので、建物の名前を尋ねる問題に改訂された。さらに、図形の模写課題が 1975年原版では検査者が描いた重なった五角形の模写であったのを、きまった重なった 5角形を提示して、それを模写する形式に変わった。MMSE日本語版のうち、北村版と小海版はMMSE2001年の改訂に先駆けて、見当識の新しい形式を採用していたが、見本の「重なった 5角形」がMMSE2001年と異なり、傾いているのは問題である。MMSE2001年版の図形を用いることが望ましと考え、MMSE-Jではそのようにした。

2000年に入るとMMSEは認知症のスクリーニング検査として世界的に使用され、国際的な研究や治験に欠かせない基幹的検査となってきた。すでに見てきたようにMMSE日本語版は原版との等価性という観点からみると、問題があり、その対処も可能と考えられたので、新たにMMSE日本語版として MMCE-Jを作成することにした。その内容は、MMSE1975年原版と従来の 3つの日本版で異なる点を上述したように是正し、それにMMSE2001年改訂版の改訂をとりいれたものであり、MMSE原版と等価にすることを目指した。

2. 日本語版MMSEの著作権MMSEの著者らがMMSEの著作権を、2000年に Minimental社に移し、2001年には Psychologi-

cal Assessment Resources Inc.(PAR社)に MMSE

の国際的専用実施権を与え、PAR社がMMSEの出版、流通、すべての知的財産権の管理をすることになった。このため、杉下は、作成したMMSE-JをMMSEの日本語版として適切かどうか PAR社に検討してもらい、MMSEの日本語版としての許可を得た。日本文化科学社はMMSE-J

を出版・流通・販売する権利を PAR社から取得し、2012年 2月 10日に出版した(杉下 20129)、杉下

201210))。3. MMSE-J原版の標準化の長所妥当性と信頼性、および正答誤答基準の確立などいわゆる標準化については、MMSE-Jは 2010

年に J-ADNI データを基におこなわれた。しかし、J-ADNI データに改ざんやプロトコル違反が認められたので、2016年、そのような問題例を除いたデータで標準化の再検討が行われた。2016年の再検討で J-ADNIデータを使わず新たに被験者を集めて標準化することと、MCI、AD、健常者の分類がMMSE得点と独立がある必要性が指摘された。本研究では上記の 2項目を満たす形で標準化がおこなわれた。さらに、「計算・注意課題」がいろいろな施行法でおこなわれているので、この課題を 2001年版MMSEの原法でおこなった。現時点のMMSE日本版の標準化において、最

も重要なのは AD、MCI、健常者を対象として、ADとMCIのカットオフ値、MCIと健常者のカットオフ値を明らかにすることである。従来のMMSE日本語版の森版、北村版および小海版では AD、MCI及び健常者という組み合わせを対象とした標準化はしておらず、本研究の MMSE-J

原法が初めてである。以下の 4から 8において、本研究の結果について考察を加える。

4. MMSE-J原法の「計算・注意課題」の検討

Page 15: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

105認知神経科学 Vol. 20 No. 2 2018

5.  MMSE-J原法得点への性別、年齢および教育年数の影響

6. 妥当性およびカットオフ値について

7. 再検査信頼性について

8.  MMSE-J原法のスクリーニング検査としての役割

4. MMSE-J原法の「注意・計算課題」の検討「日本の被験者では 100-7課題が難しいわけではないので、100-7課題の代わりに逆唱課題を行うのは不適切である。」という指摘(杉下、他2016)があり、本研究で日本人の被験者で 100-7

課題が難しいかどうか検討してみると、100-7課題がまったくできないのは、381人中 5例のみであった。したがって、日本人の被験者にとっては易しい課題と考えられる。米国の被験者で 100-7

課題がまったく出来ない被験者はどのぐらいあるかはっきりしないが、100-7課題は出来ない被験者が多いので、Mayo Clinic(メイヨークリニック)では MMSEを施行するとき、100-7課題は止めてしまい、代わりに back-spelling課題のみをするようにしたと言われている。少なくとも、米国の被験者に比べて、日本の被験者にとって、100-7

課題が易しいのは確かである。日本の被験者 381例のうち、100-7課題を拒否

したものは 2例であり、ごく少ない。なお、本研究の結果は、軽度 AD、MCI及び健常者を対象として得られたものである。85歳以上の高齢者や前頭側頭型認知症患者などを対象とした場合は、軽度 AD、MCI及び健常者より 100-7課題の拒否が多いと思われるが、それにしても少数に過ぎないであろう。さ て、1975 年 版 や 2001 年 版 の MMSE で、

100-7課題の代わりに易しい backward spelling課題を行うという方法が採用されたのは、100-7課題が米国の被験者にとって難しいから、それを回避するために backward spelling課題を行うようになったと考えられている。日本の被験者では米国の被験者ほど 100-7課題は難しくないので、

100-7課題が出来ない者や拒否するものは少ない。したがって、日本語版では、「100-7課題のみ施行する方法」も容認できるとおもわれる。特に、健常者、MCI、軽度 ADを対象とする場合はそうである。しかし、85歳以上の高齢者や前頭側頭型認知症患者などのなかには 100-7課題を拒否する例もごく少数ではあるが存在するので、拒否された場合は逆唱課題をやっておく方がよいと考える。ただし、逆唱を行うと、2つの問題点を抱え込むことになる。第一の問題点は、逆唱課題が 100-7課題よりやさしい(両者の得点差は 5%

水準で有意)ので不公平になるという点にある。第 2の問題点は逆唱と backward spellingは類似しているが異なるという点である。米国では、100-7課題が難しいので 100-7課題

のかわりに逆唱課題のみを行うという方法がしばしば用いられる。日本人の被験者では 100-7課題が難しいわけではないので、100-7課題のかわりに逆唱課題を行うのは適切ではないであろう。なお、日本での 100-7課題と逆唱課題の難易の検討(杉下、逸見、竹内、 2016)12)では、251例の場合、 逆唱課題の得点の方が 100-7課題の得点より 5%

水準で有意に高く(p=0.049、Wilcoxon signed

rank test)、逆唱課題の方が 100-7課題よりやさしかった。2回検査をした 115例の場合、一回目(スクリーニング時)および二回目(6カ月後)において、逆唱課題の得点と 100-7課題の得点で有意差はなかった(スクリーニング時 : p=0.13、6カ月後 : p=0.8、Wilcoxon signed rank test)。逆唱課題の方が 100-7課題よりやさしかったとは言えない。251 例では、有意差があるのに 115 例では有意差が無 いのは、標本数が減少したためと考えられる。日本人にとって両者の難易の差はそれほど大きくなく、米国ほどではない。

5.  MMSE-J原法への得点と性別、年齢及び、教育年数の影響

性別とMMSE-J得点との関連は健常者 A群でも B群でも認められなかった。年齢との関連は、

Page 16: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

106 Japanese Journal of Cognitive Neuroscience

健常者 A群(23-54歳を含む)では認められたが、B群(23-54歳を含まない)では認められなかった。言い換えれば、年齢は、55-74歳の群および 75

歳以上の群の得点の方が 23-54歳の群の得点はより有意に低い。しかし、55-74歳の群と 75歳以上の群間に有意差は認められなかった。教育年数は、健常者 A群でも B群でも得点への影響がみとめられた。これらの結果は、従来の結果と一致している。

6. 妥当性およびカットオフ値について J-ADNIのデータ(杉下守弘、逸見功、JADN

研究、2010)8)、ではスクリーニング検査でMMSE-Jなどの 4 つの検査が行われた。 スクリーニング検査前に行うはずの専門医による分類(NL、 MCI および 軽度 AD)については、ある施設では MMSE を施行後にし、その得点を参考にして、MCI、 軽度 AD と診断している事がわかった。また、NL を除き、MCI と軽度 ADらしい症例についてのみ、事前に MMSEを行いその得点を参考にして分類していた施設もあった。このような場合、ADNI の MMSE 心理基準(NLとMCI

は 30-24点、軽度 ADは 26-20点)を参考にしている。いいかえれば、MMSE を前もってやっていない施設では、MMSE を行う前の専門医の分類を外的基準として、MMSEによる「認知障害の疑いの有る群(アルツハイマー病患者)」と「認知障害の可能性のない群」のカットオフ値を検討できる。しかし、分類前に、MMSE を行い、その得点が ADNI の基準(MMSE 30-24 点なら NL

あるいは MCI、26-20 点なら軽度 AD)に合うかどうか見て、健常者、MCI及び軽度 ADに分類していた施設では、MMSEによる「認知障害の疑いの有る群(アルツハイマー病患者)」と「認知障害の可能性のない群」のカットオフ値を検討することはできない。この場合、被験者分類の外的基準は独立性が保たれていないからである。したがって、将来的には、MMSE-J との独立性が高い外的基準を用いて妥当性を検討する必要性が指

摘された(杉下守弘、逸見功、竹内具子、2016)12)。本研究では、DSM-5および FASTを外的基準として、MMSE-J原法より前に施行しており、外的基準とMMSE-J原法は独立している。

ROC分析の結果、次の 3つの結果がえられた。1)  健常者 B群 対 MCI群(possibleアルツハイマー病による健忘型MCI群)の最適カットオフ値は 27/28で、感度 83.9%、特異度

83.5%であった。2)  MCI群 対 軽度 AD 群(軽度 probable AD

群)の最適カットオフ値は 23/24で、感度68.7%、特異度 78.8%であった。

3)  健常者 BおよびMCI(possibleアルツハイマー病による健忘型 MCI)群 対 軽度probable AD 群の最適カットオフ値は 24/25

で、感度 88.7、特異度 83.5%であった。(なお、3)の健常者およびMCI群 対 AD 群の最適カットオフ値を求める方法は健常者の人数とMCIの人数によって最適カットオフ値がかわるのであまり良い方法とはいえない。このため、本研究では MMSE-J

のカットオフ値を決める時に 3)の値は参考にしなかった。しかし、2010年と 2016

年の研究で算出したので参考値として算出した。)

本研究の 1)の結果は、MMSE-J原法が健常者と possible健忘型MCIの弁別において満足できるレベルであることを示している。本研究の 2)の結果は、possibleアルツハイマー病による健忘型MCI群と軽度 probable AD との最適カットオフ値は 23/24であったが、possibleアルツハイマー病による健忘型MCIと軽度 probable ADの弁別については満足できるレベルよりやや低いことを示している。本研究の 1)と 2)の結果をまとめると、MMSE-J原法は高くはないが妥当性があることを示している。

2016年発表の J-ADNIのデータ 251例(注意・計算課題は 100-7課題を使用)について、本研究

Page 17: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

107認知神経科学 Vol. 20 No. 2 2018

と同じように、健常者群 対 MCI群の最適カットオフ値とMCI 群 対 軽度 AD 群の最適カットオフ値を ROC分析で計算すると以下のようになる。

1)  J-ADNI のデータ 251 例中の健常者群

対 MCI群の最適カットオフ値は 28/29(感度 84.3%、特異度 78.7%)であり、 本研究の最適カットオフ値 27/28より 1点高かった。

2)  J-ADNIのデータ 251例中のMCI 群 対 軽度 AD 群の最適カットオフ値は 23/24(感度 85.7%、特異度 81.1%)で本研究の最適カットオフ値 23/24(感度 68.7%、特異度

78.8%)と比べると最適カットオフ値は同じであるが、感度は本研究の方が低かった。

3)  杉下、逸見、竹内(2016)12)では J-ADNI

のデータ 251例中の健常者および MCI

群 対 AD 群の最適カットオフ値は 24/25

(感度 86%、特異度 89%)であるが、本研究のMMSE-J最適カットオフ値は 1点低く 23/24で、その感度(79.1%)と特異度

(82.2%)も低かった。1)、2)及び 3)の結果が本研究の結果と異なるのは、MMSE-Jの得点とは独立に外的基準を取ったためかもしれない。

2003年の Key Symposium 以来MCIの概念は急速に広まり、現在では認知症の診療と研究において欠かせない概念となった。このため、2000年以前のように健常者と認知症しか扱えない認知症検査は存在価値が薄くなった。そこで、MMSE-J

の標準化において健常群、軽度 AD群に加え、MCI群も対象とできるように、軽度 AD群とMCI群の最適カットオフ値と、MCI と健常群の最適カットオフ値を求めることが必要となった。このことは、森版、北村版および小海版などでは行われていないので、今回のMMSE-Jの標準化で試みた。幸い、感度や特異度がある程度確保された最適カットオフ値を得られたので、MMSE-J

の実用性が増したと思う。7. 再検査信頼性について MMSE-J原法の test-retestの相関係数は、0.77

(95% 信 頼 区 間 0.66~0.85、t=10.03、df=67、p<5.744e-15)であり、信頼性が高かった。100-7

版では 0.80(杉下、 逸見、竹内 2016)12)でほぼ同じ値である。MMSEの test-retest の相関係数は 0.79

~0.98と報告されており(Stuss et al. 1996)21)、MMSE-J 原法の相関係数もほぼこの範囲である。6と 7での考察をまとめると、MMSE-J原法の妥当性と信頼性は、MMSE-J原法が認知症のスクリーニング検査として使用可能であることを示していると言えよう。

8.  MMSE-J原法のスクリーニング検査としての役割

本研究ではMMSE-J原法だけでなく、DSM-5

と FASTがおこなわれており、このため、本研究の結果がどのように解釈されるかということについて、上述の 6で述べた。それでは DSM-5、FAST を行わず、MMSE-Jのみを単独で行った場合の結果はどう解釈されるのであろうか? この場合は、DSM-5を行っていないので、アルツハイマー病とか、アルツハイマー病によるMCI とか、possible とか、probableとか、言うことはできない。MMSE-Jで 23点以下であるなら、認知症であることを示唆している。しかし、認知症とするには更なる検査が必要である。また、MCI

群と健常者群との最適カットオフ値は 27/28であった。したがって、24点以上 27点以下ならばMCIであることを示唆しているがMCIであることを確定するには更なる検査が必要である。そして、28点以上なら健常者であることが示唆されるが、更なる検査が必要である。示唆とか必要性とか語句が加えられるのは、MMSEは単独で認知症、MCI、健常者の分類を可能にする検査ではなく、スクリーニング検査であるからである。認知症やMCI であることをはっきり示すには、さらにいろいろな検査をする必要性がある。

Page 18: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

108 Japanese Journal of Cognitive Neuroscience

おわりにMMSEは国際的な共同研究や国際的な治験で

用いられているので、原版である英語版に忠実な翻訳がなされ、日本文化に適切なように文化適用がなされた日本版の普及とその標準化が急務である。今回、妥当性を検証するため外的基準がMMSE-J得点の影響を受けないように、注意計算課題を原法に沿った施行にして、標準化を行った。そして、妥当性、信頼性ともにスクリーニング検査が可能な結果を値を得ることができた。本研究の結果を基にMMSE-J が臨床、研究に活用されることを願っている。

文献 1) Folstein MF, Folstein SE, McHugh PR.(1975) “Mini-

Mental State” : A practical method for grading the cog-nitive state of patients for the clinician. Journal of Psychiatric Research 12, 189-198.

2) Folstein MF, Folstein SE, McHugh PR, Fanjiang G. (2001) Mini-Mental State Examination User’s

Guide. PAR, Inc. 3) 森 悦郎,三谷洋子,山鳥 重.(1985) 神経疾

患患者における日本語版Mini-Mental Stateテストの有用性.神経心理学 1, 2-10.

4) 北村俊則.(1991) Mini-Mental State. In : 大塚俊男,本間昭監修.高齢者のための知的機能検査の手引き.ワールドプランニング : 東京.35-38.

5) 小海宏之,朝比奈恭子,岡村香織,石井辰二,東 真一郎,吉田 祥,津田清重.(2000) 日本語版Mini-Mental State Examination-Ainoの重症度判別基準.藍野学院紀要 14, 59-66.

6) Ideno Y, Takayama M, Hayashi K, Takagi H, Sugai Y.(2012) Evaluation of a Japanese version of the Mini-Mental State Examination in elderly persons. Geriatr Gerontol Int 12(2), 310-316.

7) 杉下守弘.(2006) MMSE-J(精神状態短時間検

査-日本版). 8) 杉 下 守 弘, 逸 見  功,JADN 研 究.(2010) 

MMSE-J(精神状態短時間検査-日本版)の妥当性と信頼性について : A preliminary report. 認知神経科学 12(3-4), 186-190.

9) 杉下守弘.(2012) 精神状態短時間検査-日本版.MMSE-J. 使用者の手引.日本文化科学社 : 東京.

10) 杉下守弘.(2012) 精神状態短時間検査-日本版.MMSE-J.記録用紙.日本文化科学社 : 東京.

11) http://www.geocities.jp/shinjitunodentatu/daisann syaiin.html

12) 杉下守弘,逸見 功,竹内具子.(2016) 精神状態短時間検査-日本版(MMSE-J)の妥当性と信頼性に関する再検討.認知神経科学 18(2&3), 168-

183.13) J-ADNI問題について~真実の追求~.(2016) 

http://sinjitunodentatu.web.fc2.com/14) 日本科学技術振興機構.(2016) JADNI データの

制限公開.(http://humandbs.biosciencedbc.jp/hum00 43-v1)

15) Petersen RC, Aisen PS, Beckett LA, Donohue MC, Gamst AC, et al. (2010) Alzheimer’s Disease N e u r o i m a g i n g I n i t i a t i v e(A D N I): C l i n i c a l characterization. Neurology 74(1), 201-209.

16) 朝田 隆,荒井啓行,杉下守弘,竹内具子.(2013) JADNI 臨床コア・判定委員会から.研究開発委員会 2013年 2月 2日発表.

17) American Psychiatric Association. (2013) Diagnostic and Statistical Manual of Mental Disorders (DSM-5). American Psychiatric Pub Inc.

18) Rosenberg B. (1988) Functional assessment staging (FAST). Psychopharmacol Bull 24, 653-659.

19) Wechsler D., 日本版 WAIS-III 刊行委員会訳編.(2006) 日本版WAIS-III成人知能検査法 理論マニュアル.WAIS-III標準化調査における除外基準.日本文化科学社 : 東京.p. 24.

20) Petersen RC, Smith GE, Waring SC, Ivnik RJ, Tangalos EG, Kokmen E. (1999) Mild cognitive impairment : clinical characterization and outcome. Arch Neurol 56, 303-308.

21) Stuss DT, et al. (1996) Do long tests yield a more accurate diagnosis of dementia than short tests ? A comparison of 5 neuropsychological tests. Archives of Neurology 53(10), 1033-1039.

Page 19: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

109認知神経科学 Vol. 20 No. 2 2018

The Validity and Reliability of the Japanese Version of the Mini-Mental State Examination (MMSE-J) with the original

procedure of the Attention and Calculation Task(2001)

Morihiro Sugishita1), Yousuke Koshizuka2), Shinji Sudou3), Kazuyuki Sugishita1), Isao Hemmi4), Hideharu Karasawa5), Masafumi Ihara6), AsadaTakashi7), Ban Mihara2)

1)Oji Mental Clinic 2)Mihara Memorial Hospital

3)National Hospital Organization Utano Hospital 4)Japanese Red Cross College of Nursing

5)Hunabashi Municipal Medical Center 6)National Cerebral and Cardiovascular Center

7)Tokyo Medical and Dental University

Key words : MMSE, MMSE-J, ADNI, dementia, validity, Attention and Calculation Task

  The validity and test-retest reliability of the Japanese version of the Mini Mental State Examina-tion (MMSE-J)(Sugishita 2006)was preliminarily evaluated in 2010(Sugishita, Hemmi and JADNI, 2010)based on data from the Japanese Alzheimer’s Disease Neuroimaging Initiative(J-ADNI). However, in March, 2014, Drs. Sugishita, M and Asada, T reported a total of 105 cases

with confirmed or suspected falsification of data or protocol violation to the Special Investigative Committee of the University of Tokyo. In June 20, 2014, the Committee confirmed that data had been inappropriately modified by inappropriate persons. In October 2014, 129 cases with confirmed or suspected falsification of data or protocol violation were reported to the Third Party Panel of the Uni-versity of Tokyo. The Third Party Panel examined all 129 subjects and found no falsification of data or protocol violations. However, the four written refutations by Dr. M. Sugishita argued against the criticism of the Third Party Panel and it became clear that the Third Party Panel had made errors in judgement(cf. http://www.geocities.jp/shinjitunodentatu/daisannsyaiin.html, Sugishita et al. 2016, http://sinjitunodentatu.web.fc2.com/).  Consequently, Sugishita et al. (2016) reexamined the validity and reliability of the MMSE-J af-ter excluding cases with confirmed or suspected falsification of data or protocol violations. The pa-per also indicated that 1) Because the serial 7s is rather easy for the Japanese subject, it is not appro-priate to use the backward repetition task instead of the serial 7s. 2) In the previous study(Sugishita et al. 2010), the medical doctor sometimes knew the MMSE-J score in advance, which influenced his diagnosis of the subject. Consequently, the reported validity is problematic. 3) The US-ADNI data showed that the conversion rate of the amnestic type of the MCI to the AD was 16.5% one year after the first examination. However, the J-ADNI data revealed that the conversion rate was extremely high, that is, 29.0%, which suggests that the J-ADNI data is dubious. The validity and reliability of the MMSE-J should be evaluated not on the J-ADNI data but on a new data.  The aim of the present study was to resolve the above-mentioned three problems and complete standardization of the MMSE-J. In the present study, 1) The problem of the serial 7s and the back-ward repetition task was examined using Folstein’s original procedure of the Attention and Calcula-tion task of the MMSE (2001). Folstein’s original procedure is “If the patient refuses to perform the serial 7s task, ask him to spell “world” forwards and then backwards.” (Because one can perform

Page 20: MMSE (精神状態短時間検査 日本版)原法の妥当性と信頼性

110 Japanese Journal of Cognitive Neuroscience

neither backward spelling nor forward spelling in Japanese, we employed the backward repetition and forward repetition of a Japanese word). 2) To estimate the validity, the DSM-5 and the FAST were employed as the external standard. Sensibility and specificity by ROC analysis was employed as index of validity. 3) Instead of the J-ADNI data, 381 subject (Normal 175, MCI 137, Mild AD 69)were newly recruited from the 6 hospital / clinics for standardization of the MMSE-J with Folstein’s origi-nal procedure of Attention and Calculation Task. The validity and reliability of the MMSE-J with are estimated on 379 subjects (Normal 175, MCI 137, Mild AD 67)  The results showed that in the MCI and the Mild AD groups, gender, age and years of education did not influence on the MMSE-J score. In the Normal group, the MMSE score was significantly low, when years of education was low or age was high. Gender did not influence on the MMSE-J score. The number of the subject who could not perform the serial 7s or refused to perform it was very small, 5 and 2 respectively.  ROC analysis showed that the proximal cut-off score between Normal and MCI was 27/28(sensibility 83.9%, specificity 83.5%). That between MCI and Mild AD was 23/24 (sensibility

68.7%, specificity 78.8%). The proximal cut-off score between Normal and MCI is satisfactory for discriminating between healthy old adults and the patients with MCI. However, that between the patients with MCI and the patients with mild AD is less than satisfactory for discriminating the two groups of the patients.  Test-retest reliability was evaluated in 67 subjects who were tested twice, namely, at screening and at 3 to 9 months after screening. the Pearson correlation coefficient was 0.77. Test-retest reli-ability was found to be excellent. The validity and test-retest reliability of the present study were ac-ceptable, which indicates that the MMSE-J using the original procedure of the Attention and Calcula-tion Task of the MMSE(2001) is a clinically applicable screening instrument.