grade ガイドライン作成の流れの解説 ·...

65
GRADE ガイドライン作成の流れ:解説_aihara (2012 6 月~9 ) 1/65 GRADE * ガイドライン作成の流れの解説 *GRADE: Grading of Recommendations Assessment, Development and Evaluation 本内容は、GRADE-Jpn MLブログにおける解説内容(2012 年 6 月~7 月)であり、GRADE システムを利用した診療ガイドライン 1 の作成の流れを理解するために作成しました。 各セクションの項目番号は以下の(1)ファイルに対応しており、「GRADE システムの使い方」 _20120426.ppt、および GRADE 教科書である「診療ガイドラインのための GRADE システム」 (相原守夫 他、凸版メディア、2010 年)を利用して診療ガイドライン作成の流れを解説してい ます。 (1) 「コクランレビュー作成における GRADE システム(アプローチ)の利用・GRADE システム を利用した診療ガイドライン作成チェックリスト:治療介入編 Ver. 2 2012.7.17」 (pdf ファイル名: grade_gl_flow_2012.pdf) 湯浅秀道先生(国立病院機構、豊橋医療センター、歯科口腔外科)と GRADE-Jpn ML メンバーが作成したチェックリストです。pdf 対応のエクセルファイルも公開しています。 http://www.grade-jpn.com/grade_gl_flow_2012.pdf http://www.grade-jpn.com/grade_gl_flow_ma.xls (2) 「GRADE システムの使い方」(PPT ファイル名: how_to_use_grade_aihara_20120426.ppt) http://homepage3.nifty.com/aihara/how_to_use_grade_aihara_20120426.lzh より圧縮 版の DL 可能 (3) 診療ガイドラインのための GRADE システム(相原守夫 他、凸版メディア、2010 年) GRADEシステムに関して日本語で解説している唯一の書籍です。 (以下 GRADE 教科書と略) 相原守夫 平成 24 年 6 月 26 日~9 月 13 日 1 米国医学研究所(Institute of Medicine:IOM)の 1990 年の定義によると,診療ガイドラインは「特定の臨床状況 において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。 2011 年 3 月,IOM は,「診療ガイドラインは患者ケアを最適化するための推奨を含む文書であり,エビデンスのシ ステマティック・レビューと,他の選択肢の利益と害の評価によって作成される」という新たな声明を発表した。 (“Report: Clinical Practice Guideline We Can Trust”)。

Upload: others

Post on 21-May-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

165

GRADEガイドライン作成の流れの解説

GRADE Grading of Recommendations Assessment Development and Evaluation

本内容はGRADE-Jpn MLブログにおける解説内容(2012 年 6 月~7 月)でありGRADE

システムを利用した診療ガイドライン1の作成の流れを理解するために作成しました

各セクションの項目番号は以下の(1)ファイルに対応しており「GRADEシステムの使い方」

_20120426pptおよび GRADE 教科書である「診療ガイドラインのための GRADE システム」

(相原守夫 他凸版メディア2010 年)を利用して診療ガイドライン作成の流れを解説してい

ます

(1) 「コクランレビュー作成における GRADE システム(アプローチ)の利用GRADE システム

を利用した診療ガイドライン作成チェックリスト治療介入編 Ver 2 2012717」

(pdfファイル名 grade_gl_flow_2012pdf)

湯浅秀道先生(国立病院機構豊橋医療センター歯科口腔外科)とGRADE-Jpn ML

メンバーが作成したチェックリストですpdf 対応のエクセルファイルも公開しています

httpwwwgrade-jpncomgrade_gl_flow_2012pdf

httpwwwgrade-jpncomgrade_gl_flow_maxls

(2) 「GRADEシステムの使い方」(PPT ファイル名 how_to_use_grade_aihara_20120426ppt)

httphomepage3niftycomaiharahow_to_use_grade_aihara_20120426lzh より圧縮

版の DL 可能

(3) 診療ガイドラインのための GRADEシステム(相原守夫 他凸版メディア2010 年)

GRADEシステムに関して日本語で解説している唯一の書籍です

(以下 GRADE 教科書と略)

相原守夫

平成 24 年 6 月 26 日~9 月 13 日

1米国医学研究所(Institute of MedicineIOM)の 1990 年の定義によると診療ガイドラインは「特定の臨床状況

において適切な判断を行うため臨床家と患者を支援する目的で系統的に作成された文書」である

2011 年 3 月IOM は「診療ガイドラインは患者ケアを最適化するための推奨を含む文書でありエビデンスのシ

ステマティックレビューと他の選択肢の利益と害の評価によって作成される」という新たな声明を発表した

(ldquoReport Clinical Practice Guideline We Can Trustrdquo)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

265

目次

はじめに

1 GRADE が登場した背景

2 なぜ GRADEが必要なのか

Item - 0 ガイドラインパネル編成プロセス確立

Item - 1 患者臨床医の疑問(CQ)収集

Item - 2 疑問の定式化

Item - 3 アウトカムの選択

Item - 4 アウトカムの相対的な重要度の判定

Item - 5 疾患定義選択基準など

Item - 6 SR網羅的に検索する

Item - 7 SR適格基準(選択基準と除外基準)

Item - 8 SRアウトカムごとにデータを収集する

Item - 9 SR個々の研究および研究全般のrisk of biasを評価する

Item -10 SRコクランの色テーブル(risk of summary)を作成する

附Risk_of_bias_excel

Item -11 SRアウトカムごとに risk of bias summaryを作成する

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)複数の研究全般

のRoB

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたるRoBを評価する

Item -14 メタ解析をする

附メタアナリシスのためのソフトウエア

Item -15 エビデンスの質研究デザイン

附GRADEシステムによるエビデンスの質評価と定義

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Item -17 エビデンスの質(グレードダウンの5要因) inconsistency

Item -18 エビデンスの質(グレードダウンの5要因) indirectness

Item -19 エビデンスの質(グレードダウンの5要因) imprecision

Item -20 エビデンスの質(グレードダウンの5要因) publication bias

Item -21 エビデンスの質(グレードアップの3要因) 効果の程度が大きい

Item -22 エビデンスの質(グレードアップの3要因) 交絡因子

Item -23 エビデンスの質(グレードアップの3要因) 用量反応勾配

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Item -25 エビデンスプロファイル作成SOF表作成

Item -26 医療資源に関する資料作成

Item -27 アウトカムの相対的な重要度の再評価

Item -28 そのCQの全体(overall)のエビデンスの質の判定

Item -29 推奨決定(4要因) 全体的なエビデンスの質

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

365

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Item -31 推奨決定(4要因) 価値観と好み

Item -32 推奨決定(4要因) 資源の利用(コスト)

Item -33 推奨度評価の合意形成(RAND法 必要なら GRADEgrid)

Item -34 診療ガイドライン作成

Item -35 レビューと外部評価

Item -36 配布および普及

Item -37 ガイドラインの管理

Item -38 質の改善および実行

最後に

GRADEを採用する場合の注意

GRADEを利用したとする基準

GRADE JCEシリーズとは

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

465

[はじめに] -(1) GRADEが登場した背景 ML発言番号00994

(2012626)

Guyatt らがJAMA-Users Guides 初版から述べていたにもかかわらずエビデンスの質と推

奨の評価において「エビデンスの階層(RCT 至上主義のような)」だけが注目されてしま

って診療ガイドラインがrdquo研究デザインによって分類されたエビデンスの質rdquoに依存するよう

になってしまいました

この状況は日本だけではなく海外でも共通したものでしたのでEBM working group の

Guyatt と当時 Cochrane のリーダーだった Oxman が一緒になって2000 年に GRADE

working group を立ち上げたという歴史です

Guyattがたはコクラングループが GRADEを採用し(2003年ごろ)2008年の BMJシリーズ

を発表してこれで適切な方向に向かうと思ったようですがその期待は大きく裏切られ今

でも GRADE改変論文や誤った GRADE利用による診療ガイドラインが次々と発表されていま

すそこでGRADE はガイドラインに特化した GRADE を解説すべくJCE シリーズを 2011

年から発表しているというわけです2012年6月の時点では20~22連載予定のうち12まで

が出版されています

まとめると

gtGRADEの登場してきた背景はなにか

上記のような背景で

rdquo研究デザイン主体のエビデンス分類rdquoと

rdquoエビデンス依存の推奨決定rdquoを修正することが目的です

「GRADEはエビデンスの質と推奨を分離する」

gtSRGL ともにGRADE はどのような状況に対して作られたのか

rdquo世界中にたくさんあるグレーディングシステムをひとつに統一するrdquo

「エビデンスの質評価と推奨決定プロセスを簡潔なものとしてその透明性を高める」

参考

1 GRADE教科書の FAQ

2 httpwwwgrade-jpncomgrade-faq-test1html

3 httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[1]

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

565

[はじめに] -(2) なぜ GRADE が必要なのか ML 発言番号 00--- (627)

1EBMを指導する方の視点

2患者の視点

3臨床医の視点

4政策決定者の視点

[1] EBMを指導する方の視点では

医学文献からの論文を診療のガイドとして使用するための通常の3ステップアプローチ(結果

は妥当か結果は何か患者ケアに適用できるか)のほとんどをGRADE の枠組みで評価で

きるということが「エビデンスの質評価に GRADE を使う論拠」です (スライド 11)

しかも評価をひとつの表(エビデンスプロファイル EP)に提示すると長々とした文章を読ま

なくても一目瞭然で研究の数患者数イベント数そして効果の大きさやエビデンスの質

評価の理由を理解できるというわけです

EP の例 httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

効果推定値の確信の程度がldquoエビデンスの質rdquoです

[2] 患者の視点では

GRADE による推奨の強さはstrongか weak (conditional)の 2 種類のいずれかです

ldquo強い推奨rdquoならばほぼ全員が推奨される介入を希望するでしょうldquo弱い推奨rdquoならば大

多くの患者が提案される介入を希望するだろうし希望しない患者も多いということです

[3] 臨床医の視点では

ldquo強い推奨rdquoならばほぼ全ての患者が推奨される介入を受けるようにすべきでありガイドラ

インに準じた推奨を遵守しているかどうかは医療の質評価にも利用できます ldquo弱い推奨rdquoな

らば推奨される介入を提案し患者が意思決定できるように支援する必要があり価値観や

好みに基づいてエビデンスやエビデンスの要約を各自で吟味することになります

[4] 政策決定者の視点では

ldquo強い推奨rdquoならばほとんどの状況下で推奨事項をパフォーマンス指標として政策に採用

できますldquo弱い推奨rdquoならば政策決定のためには多数の利害関係者を含めてより実質的

な論議を重ねる必要があります

ちなみにGRADE を採用している ACCP はパフォーマンス指標はGRADE の 1A 1B と

評価された推奨事項を基準とすべきで1C 2A2B2C と評価された推奨事項はパフォー

マンス指標としては使用してはならないとしています()

参考

1 GRADE教科書 p98

2 ACCP ガイドラインのパフォーマンス指標と免責事項の記載 GRADE教科書 p127

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

665

Item -0 ガイドラインパネル編成プロセス確立 発言番号 00953

Blog 20120622

ガイドライン作成のためのグループ編成は(WHO に準じた)以下の仮想チームとしています

(GRADE 教科書の p148 参照)

(1)ガイドライン運営委員会

(2)専門ガイドライン作成グループ(パネル)

(3)特別作業班(タスクフォース)

(4)事務局

(5)外部専門家

当仮想パネルには癌専門医臨床医統計学者ガイドライン作成経験のある人システマ

ティックレビュー作成者(最低 2 人)費用効果分析者エンドユーザーである患者(あるいは

患者代表者)そして GRADE working group member がそろっていますすばらしいチ

ームです

=========

ガイドラインパネルは全員利益相反の公表が必要(GRADE 教科書 p152)

パネル全員はGRADE を使うということに同意する必要があります

これはとても重要なことでありある介入に関する推奨を決定する際の投票など

に参加すべきではないメンバーがでてくる可能性があります

例えばある薬剤の開発に関与した人はエビデンスの質評価には参加できても当該薬

剤の推奨決定には関与できないガイドラインに示す推奨決定結果によってメン

バー脱退ということは許されないという原則です当然ながらガイドライン作

成者リストに名前だけを乗せるだけの参加はよろしくないということです

参考

1ガイドラインパネル編成プロセス確立

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[1]

2利益相反の公表 GRADE 教科書 p152

これらは上記リンク「1」の下図に示す ref 3 (GRADE システムがはじめて公開された WHO 資料)を翻訳した

ものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

765

Item -1 患者臨床医の疑問(CQ)収集

Blog 20120702

GRADE ガイドラインの作成の流れを説明するために利用するシナリオは「GRADE システ

ムの使い方」 _20120426ppt にあるように( 2012622 に内容を改変した

how_to_use_grade_aihara_20120426lzh を web 上にアップしましたので古いデータ

利用の方は気をつけてください)

スライド17 にあるようなシナリオから1つの臨床疑問を作成して GRADE ガイドラインを作

成してみるという作業です

ldquo固形癌患者において非経口的抗凝固療法を実施すると癌患者の死亡率が低下できて生

存延長につながるのだろうかrdquoというldquo治療rdquoに関する疑問です

臨床研究には目的に応じて5つの分野(治療害鑑別診断診断予後)がありそれぞ

れに適した研究デザインがあるたとえば治療に関する研究にはランダム化比較試験(RCT)

やシステマティックレビュー害の研究にはRCTや観察研究診断研究には横断研究や

RCT などが適している(GRADE教科書 p29)

注 クリニカルクエスチョン(臨床上の疑問臨床疑問)という用語が EBMでは多用されますが

GRADE 論文においてはより広い意味のヘルスケアクエスチョンが記載されることもありますこ

れはldquo対象が必ずしも患者ではないことがあるldquoという理由です(GRADE 教科書 p28)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

865

Item -2 疑問の定式化 Blog 20120703

ほとんどの疑問は患者(P)介入(I)比較(C)アウトカム(O)に分けられる

患者の治療について決断をしなくてはならない臨床医が想起するヘルスケアクエスチョン(特に

前景疑問)は関連する患者集団治療方法や曝露および治療や曝露によって生じるldquo 患者

にとって重要なアウトカムrdquo を特定したものであり基本的にはPICOの4 要素から成っている

非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

(注)

通常はPICO 形式の中の特にPIO(Patient Intervention Outcomes)について明確にして検

索すると関連するエビデンスを見つけやすい

Patient 癌患者(肺癌大腸癌前立腺癌など)

Intervention parenteral anticoagulation (ヘパリン)

Comparison プラセボno heparin

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

965

Item -3 アウトカムの選択 Blog 20120705

アウトカムとは転帰や帰結のことで研究の目的測定項目を意味する特に臨床研究では評価項

目指標を意味するエンドポイントという用語を用いて主要(1次)エンドポイント副次(2次)エン

ドポイント複数の指標を組み合わせた複合エンドポイントなどの表現が使われるアウトカム変数

には2値(dichotomous)変数と連続(continuous)変数の2種類がある

患者にとって重要なアウトカムとは次のような質問に「はい」という答えが出るようなアウトカムと定

義される

「患者がこの治療によって変化する唯一のアウトカムがこのアウトカムであると知った場合それ

に副作用やコストを伴うのだとしても患者はその治療を受けることを考慮するだろうか」

スライド 20

患者にとって重要なアウトカムとは以下のカテゴリーのⅠⅡⅢでありⅣは患者にとって重要なも

のではない

本シナリオでは(システマティックレビューにおける 「重要」なアウトカム)

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

(注)

患者にとって重要なアウトカムに関する情報が入手できない状況では代替アウトカムを考慮すべ

きであるがヘルスケアクエスチョンのリストには代替アウトカムではなく本来の重要なアウトカムを

記載すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1065

Item -4 アウトカムの相対的な重要度の判定 Blog 20120705

GRADE ではアウトカムの重要度を9段階の点数で相対的に評価しそれらを3点きざみで3つ

に分類する意志決定にとって「重大7〜9点」「重要4〜6点」「重要ではない1〜3点」の分

類である

この3つの分類の中でシステマティックレビューに関係するアウトカムは「重大」なものと「重要」

なものであり両者をGRADEエビデンステーブルに含まなければならない

ガイドラインの推奨に影響するアウトカムは「重大」なアウトカムのみである

(注)

1通常どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に

着手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネル

は研究計画書の作成後または分析の実施後になってアウトカムの重要度を再評価すべきである

(GRADE 教科書 p32 参照)

2診療ガイドライン作成においては「重大」なアウトカムだけを検討するため小出血や QOL血

小板減少のアウトカムは考慮しない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1165

Item -5 疾患定義選択基準など Blog 20120706

疾患や介入の定義とともに採用するエビデンスの種類(研究デザイン)を決断する

異なるタイプの疑問に取り組むためはどんな種類のエビデンスが使われるべきかを明確にすること

が大切である

引用文献

Improving the use of research evidence in guideline development 7 Deciding what evidence to

include Oxman AD Schuumlnemann HJ and Fretheim A

httpwwwhealth-policy-systemscomcontentpdf1478-4505-4-19pdf

シナリオの場合以下のようになる

Types of studies Randomized controlled trials (RCTs)

Types of participants

Patients with cancer with no indication for prophylactic or therapeutic anticoagulation

Types of interventions

Experimental intervention parenteral anticoagulants such as UFH LMWH and fondaparinux

Comparator intervention placebo or no intervention

Outcomes

All-cause mortality Symptomatic venous thromboembolism Health-related quality of life

Major bleeding Minor bleeding Thrombocytopenia

bull The study designs to be included in a review should be dictated by the interventions and

outcomes being considered A decision about how broad a range of study designs to

consider should be made in relationship to the characteristics of the interventions being

considered what evidence is available and the time and resources available

bull Decisions about the range of study designs to include should be made explicitly

bull Great caution should be taken to avoid confusing a lack of evidence with evidence of no

effect and to acknowledge uncertainty

bull Expert opinion is not a type of study design and should not be used as evidence

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 2: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

265

目次

はじめに

1 GRADE が登場した背景

2 なぜ GRADEが必要なのか

Item - 0 ガイドラインパネル編成プロセス確立

Item - 1 患者臨床医の疑問(CQ)収集

Item - 2 疑問の定式化

Item - 3 アウトカムの選択

Item - 4 アウトカムの相対的な重要度の判定

Item - 5 疾患定義選択基準など

Item - 6 SR網羅的に検索する

Item - 7 SR適格基準(選択基準と除外基準)

Item - 8 SRアウトカムごとにデータを収集する

Item - 9 SR個々の研究および研究全般のrisk of biasを評価する

Item -10 SRコクランの色テーブル(risk of summary)を作成する

附Risk_of_bias_excel

Item -11 SRアウトカムごとに risk of bias summaryを作成する

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)複数の研究全般

のRoB

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたるRoBを評価する

Item -14 メタ解析をする

附メタアナリシスのためのソフトウエア

Item -15 エビデンスの質研究デザイン

附GRADEシステムによるエビデンスの質評価と定義

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Item -17 エビデンスの質(グレードダウンの5要因) inconsistency

Item -18 エビデンスの質(グレードダウンの5要因) indirectness

Item -19 エビデンスの質(グレードダウンの5要因) imprecision

Item -20 エビデンスの質(グレードダウンの5要因) publication bias

Item -21 エビデンスの質(グレードアップの3要因) 効果の程度が大きい

Item -22 エビデンスの質(グレードアップの3要因) 交絡因子

Item -23 エビデンスの質(グレードアップの3要因) 用量反応勾配

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Item -25 エビデンスプロファイル作成SOF表作成

Item -26 医療資源に関する資料作成

Item -27 アウトカムの相対的な重要度の再評価

Item -28 そのCQの全体(overall)のエビデンスの質の判定

Item -29 推奨決定(4要因) 全体的なエビデンスの質

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

365

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Item -31 推奨決定(4要因) 価値観と好み

Item -32 推奨決定(4要因) 資源の利用(コスト)

Item -33 推奨度評価の合意形成(RAND法 必要なら GRADEgrid)

Item -34 診療ガイドライン作成

Item -35 レビューと外部評価

Item -36 配布および普及

Item -37 ガイドラインの管理

Item -38 質の改善および実行

最後に

GRADEを採用する場合の注意

GRADEを利用したとする基準

GRADE JCEシリーズとは

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

465

[はじめに] -(1) GRADEが登場した背景 ML発言番号00994

(2012626)

Guyatt らがJAMA-Users Guides 初版から述べていたにもかかわらずエビデンスの質と推

奨の評価において「エビデンスの階層(RCT 至上主義のような)」だけが注目されてしま

って診療ガイドラインがrdquo研究デザインによって分類されたエビデンスの質rdquoに依存するよう

になってしまいました

この状況は日本だけではなく海外でも共通したものでしたのでEBM working group の

Guyatt と当時 Cochrane のリーダーだった Oxman が一緒になって2000 年に GRADE

working group を立ち上げたという歴史です

Guyattがたはコクラングループが GRADEを採用し(2003年ごろ)2008年の BMJシリーズ

を発表してこれで適切な方向に向かうと思ったようですがその期待は大きく裏切られ今

でも GRADE改変論文や誤った GRADE利用による診療ガイドラインが次々と発表されていま

すそこでGRADE はガイドラインに特化した GRADE を解説すべくJCE シリーズを 2011

年から発表しているというわけです2012年6月の時点では20~22連載予定のうち12まで

が出版されています

まとめると

gtGRADEの登場してきた背景はなにか

上記のような背景で

rdquo研究デザイン主体のエビデンス分類rdquoと

rdquoエビデンス依存の推奨決定rdquoを修正することが目的です

「GRADEはエビデンスの質と推奨を分離する」

gtSRGL ともにGRADE はどのような状況に対して作られたのか

rdquo世界中にたくさんあるグレーディングシステムをひとつに統一するrdquo

「エビデンスの質評価と推奨決定プロセスを簡潔なものとしてその透明性を高める」

参考

1 GRADE教科書の FAQ

2 httpwwwgrade-jpncomgrade-faq-test1html

3 httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[1]

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

565

[はじめに] -(2) なぜ GRADE が必要なのか ML 発言番号 00--- (627)

1EBMを指導する方の視点

2患者の視点

3臨床医の視点

4政策決定者の視点

[1] EBMを指導する方の視点では

医学文献からの論文を診療のガイドとして使用するための通常の3ステップアプローチ(結果

は妥当か結果は何か患者ケアに適用できるか)のほとんどをGRADE の枠組みで評価で

きるということが「エビデンスの質評価に GRADE を使う論拠」です (スライド 11)

しかも評価をひとつの表(エビデンスプロファイル EP)に提示すると長々とした文章を読ま

なくても一目瞭然で研究の数患者数イベント数そして効果の大きさやエビデンスの質

評価の理由を理解できるというわけです

EP の例 httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

効果推定値の確信の程度がldquoエビデンスの質rdquoです

[2] 患者の視点では

GRADE による推奨の強さはstrongか weak (conditional)の 2 種類のいずれかです

ldquo強い推奨rdquoならばほぼ全員が推奨される介入を希望するでしょうldquo弱い推奨rdquoならば大

多くの患者が提案される介入を希望するだろうし希望しない患者も多いということです

[3] 臨床医の視点では

ldquo強い推奨rdquoならばほぼ全ての患者が推奨される介入を受けるようにすべきでありガイドラ

インに準じた推奨を遵守しているかどうかは医療の質評価にも利用できます ldquo弱い推奨rdquoな

らば推奨される介入を提案し患者が意思決定できるように支援する必要があり価値観や

好みに基づいてエビデンスやエビデンスの要約を各自で吟味することになります

[4] 政策決定者の視点では

ldquo強い推奨rdquoならばほとんどの状況下で推奨事項をパフォーマンス指標として政策に採用

できますldquo弱い推奨rdquoならば政策決定のためには多数の利害関係者を含めてより実質的

な論議を重ねる必要があります

ちなみにGRADE を採用している ACCP はパフォーマンス指標はGRADE の 1A 1B と

評価された推奨事項を基準とすべきで1C 2A2B2C と評価された推奨事項はパフォー

マンス指標としては使用してはならないとしています()

参考

1 GRADE教科書 p98

2 ACCP ガイドラインのパフォーマンス指標と免責事項の記載 GRADE教科書 p127

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

665

Item -0 ガイドラインパネル編成プロセス確立 発言番号 00953

Blog 20120622

ガイドライン作成のためのグループ編成は(WHO に準じた)以下の仮想チームとしています

(GRADE 教科書の p148 参照)

(1)ガイドライン運営委員会

(2)専門ガイドライン作成グループ(パネル)

(3)特別作業班(タスクフォース)

(4)事務局

(5)外部専門家

当仮想パネルには癌専門医臨床医統計学者ガイドライン作成経験のある人システマ

ティックレビュー作成者(最低 2 人)費用効果分析者エンドユーザーである患者(あるいは

患者代表者)そして GRADE working group member がそろっていますすばらしいチ

ームです

=========

ガイドラインパネルは全員利益相反の公表が必要(GRADE 教科書 p152)

パネル全員はGRADE を使うということに同意する必要があります

これはとても重要なことでありある介入に関する推奨を決定する際の投票など

に参加すべきではないメンバーがでてくる可能性があります

例えばある薬剤の開発に関与した人はエビデンスの質評価には参加できても当該薬

剤の推奨決定には関与できないガイドラインに示す推奨決定結果によってメン

バー脱退ということは許されないという原則です当然ながらガイドライン作

成者リストに名前だけを乗せるだけの参加はよろしくないということです

参考

1ガイドラインパネル編成プロセス確立

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[1]

2利益相反の公表 GRADE 教科書 p152

これらは上記リンク「1」の下図に示す ref 3 (GRADE システムがはじめて公開された WHO 資料)を翻訳した

ものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

765

Item -1 患者臨床医の疑問(CQ)収集

Blog 20120702

GRADE ガイドラインの作成の流れを説明するために利用するシナリオは「GRADE システ

ムの使い方」 _20120426ppt にあるように( 2012622 に内容を改変した

how_to_use_grade_aihara_20120426lzh を web 上にアップしましたので古いデータ

利用の方は気をつけてください)

スライド17 にあるようなシナリオから1つの臨床疑問を作成して GRADE ガイドラインを作

成してみるという作業です

ldquo固形癌患者において非経口的抗凝固療法を実施すると癌患者の死亡率が低下できて生

存延長につながるのだろうかrdquoというldquo治療rdquoに関する疑問です

臨床研究には目的に応じて5つの分野(治療害鑑別診断診断予後)がありそれぞ

れに適した研究デザインがあるたとえば治療に関する研究にはランダム化比較試験(RCT)

やシステマティックレビュー害の研究にはRCTや観察研究診断研究には横断研究や

RCT などが適している(GRADE教科書 p29)

注 クリニカルクエスチョン(臨床上の疑問臨床疑問)という用語が EBMでは多用されますが

GRADE 論文においてはより広い意味のヘルスケアクエスチョンが記載されることもありますこ

れはldquo対象が必ずしも患者ではないことがあるldquoという理由です(GRADE 教科書 p28)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

865

Item -2 疑問の定式化 Blog 20120703

ほとんどの疑問は患者(P)介入(I)比較(C)アウトカム(O)に分けられる

患者の治療について決断をしなくてはならない臨床医が想起するヘルスケアクエスチョン(特に

前景疑問)は関連する患者集団治療方法や曝露および治療や曝露によって生じるldquo 患者

にとって重要なアウトカムrdquo を特定したものであり基本的にはPICOの4 要素から成っている

非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

(注)

通常はPICO 形式の中の特にPIO(Patient Intervention Outcomes)について明確にして検

索すると関連するエビデンスを見つけやすい

Patient 癌患者(肺癌大腸癌前立腺癌など)

Intervention parenteral anticoagulation (ヘパリン)

Comparison プラセボno heparin

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

965

Item -3 アウトカムの選択 Blog 20120705

アウトカムとは転帰や帰結のことで研究の目的測定項目を意味する特に臨床研究では評価項

目指標を意味するエンドポイントという用語を用いて主要(1次)エンドポイント副次(2次)エン

ドポイント複数の指標を組み合わせた複合エンドポイントなどの表現が使われるアウトカム変数

には2値(dichotomous)変数と連続(continuous)変数の2種類がある

患者にとって重要なアウトカムとは次のような質問に「はい」という答えが出るようなアウトカムと定

義される

「患者がこの治療によって変化する唯一のアウトカムがこのアウトカムであると知った場合それ

に副作用やコストを伴うのだとしても患者はその治療を受けることを考慮するだろうか」

スライド 20

患者にとって重要なアウトカムとは以下のカテゴリーのⅠⅡⅢでありⅣは患者にとって重要なも

のではない

本シナリオでは(システマティックレビューにおける 「重要」なアウトカム)

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

(注)

患者にとって重要なアウトカムに関する情報が入手できない状況では代替アウトカムを考慮すべ

きであるがヘルスケアクエスチョンのリストには代替アウトカムではなく本来の重要なアウトカムを

記載すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1065

Item -4 アウトカムの相対的な重要度の判定 Blog 20120705

GRADE ではアウトカムの重要度を9段階の点数で相対的に評価しそれらを3点きざみで3つ

に分類する意志決定にとって「重大7〜9点」「重要4〜6点」「重要ではない1〜3点」の分

類である

この3つの分類の中でシステマティックレビューに関係するアウトカムは「重大」なものと「重要」

なものであり両者をGRADEエビデンステーブルに含まなければならない

ガイドラインの推奨に影響するアウトカムは「重大」なアウトカムのみである

(注)

1通常どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に

着手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネル

は研究計画書の作成後または分析の実施後になってアウトカムの重要度を再評価すべきである

(GRADE 教科書 p32 参照)

2診療ガイドライン作成においては「重大」なアウトカムだけを検討するため小出血や QOL血

小板減少のアウトカムは考慮しない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1165

Item -5 疾患定義選択基準など Blog 20120706

疾患や介入の定義とともに採用するエビデンスの種類(研究デザイン)を決断する

異なるタイプの疑問に取り組むためはどんな種類のエビデンスが使われるべきかを明確にすること

が大切である

引用文献

Improving the use of research evidence in guideline development 7 Deciding what evidence to

include Oxman AD Schuumlnemann HJ and Fretheim A

httpwwwhealth-policy-systemscomcontentpdf1478-4505-4-19pdf

シナリオの場合以下のようになる

Types of studies Randomized controlled trials (RCTs)

Types of participants

Patients with cancer with no indication for prophylactic or therapeutic anticoagulation

Types of interventions

Experimental intervention parenteral anticoagulants such as UFH LMWH and fondaparinux

Comparator intervention placebo or no intervention

Outcomes

All-cause mortality Symptomatic venous thromboembolism Health-related quality of life

Major bleeding Minor bleeding Thrombocytopenia

bull The study designs to be included in a review should be dictated by the interventions and

outcomes being considered A decision about how broad a range of study designs to

consider should be made in relationship to the characteristics of the interventions being

considered what evidence is available and the time and resources available

bull Decisions about the range of study designs to include should be made explicitly

bull Great caution should be taken to avoid confusing a lack of evidence with evidence of no

effect and to acknowledge uncertainty

bull Expert opinion is not a type of study design and should not be used as evidence

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 3: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

365

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Item -31 推奨決定(4要因) 価値観と好み

Item -32 推奨決定(4要因) 資源の利用(コスト)

Item -33 推奨度評価の合意形成(RAND法 必要なら GRADEgrid)

Item -34 診療ガイドライン作成

Item -35 レビューと外部評価

Item -36 配布および普及

Item -37 ガイドラインの管理

Item -38 質の改善および実行

最後に

GRADEを採用する場合の注意

GRADEを利用したとする基準

GRADE JCEシリーズとは

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

465

[はじめに] -(1) GRADEが登場した背景 ML発言番号00994

(2012626)

Guyatt らがJAMA-Users Guides 初版から述べていたにもかかわらずエビデンスの質と推

奨の評価において「エビデンスの階層(RCT 至上主義のような)」だけが注目されてしま

って診療ガイドラインがrdquo研究デザインによって分類されたエビデンスの質rdquoに依存するよう

になってしまいました

この状況は日本だけではなく海外でも共通したものでしたのでEBM working group の

Guyatt と当時 Cochrane のリーダーだった Oxman が一緒になって2000 年に GRADE

working group を立ち上げたという歴史です

Guyattがたはコクラングループが GRADEを採用し(2003年ごろ)2008年の BMJシリーズ

を発表してこれで適切な方向に向かうと思ったようですがその期待は大きく裏切られ今

でも GRADE改変論文や誤った GRADE利用による診療ガイドラインが次々と発表されていま

すそこでGRADE はガイドラインに特化した GRADE を解説すべくJCE シリーズを 2011

年から発表しているというわけです2012年6月の時点では20~22連載予定のうち12まで

が出版されています

まとめると

gtGRADEの登場してきた背景はなにか

上記のような背景で

rdquo研究デザイン主体のエビデンス分類rdquoと

rdquoエビデンス依存の推奨決定rdquoを修正することが目的です

「GRADEはエビデンスの質と推奨を分離する」

gtSRGL ともにGRADE はどのような状況に対して作られたのか

rdquo世界中にたくさんあるグレーディングシステムをひとつに統一するrdquo

「エビデンスの質評価と推奨決定プロセスを簡潔なものとしてその透明性を高める」

参考

1 GRADE教科書の FAQ

2 httpwwwgrade-jpncomgrade-faq-test1html

3 httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[1]

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

565

[はじめに] -(2) なぜ GRADE が必要なのか ML 発言番号 00--- (627)

1EBMを指導する方の視点

2患者の視点

3臨床医の視点

4政策決定者の視点

[1] EBMを指導する方の視点では

医学文献からの論文を診療のガイドとして使用するための通常の3ステップアプローチ(結果

は妥当か結果は何か患者ケアに適用できるか)のほとんどをGRADE の枠組みで評価で

きるということが「エビデンスの質評価に GRADE を使う論拠」です (スライド 11)

しかも評価をひとつの表(エビデンスプロファイル EP)に提示すると長々とした文章を読ま

なくても一目瞭然で研究の数患者数イベント数そして効果の大きさやエビデンスの質

評価の理由を理解できるというわけです

EP の例 httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

効果推定値の確信の程度がldquoエビデンスの質rdquoです

[2] 患者の視点では

GRADE による推奨の強さはstrongか weak (conditional)の 2 種類のいずれかです

ldquo強い推奨rdquoならばほぼ全員が推奨される介入を希望するでしょうldquo弱い推奨rdquoならば大

多くの患者が提案される介入を希望するだろうし希望しない患者も多いということです

[3] 臨床医の視点では

ldquo強い推奨rdquoならばほぼ全ての患者が推奨される介入を受けるようにすべきでありガイドラ

インに準じた推奨を遵守しているかどうかは医療の質評価にも利用できます ldquo弱い推奨rdquoな

らば推奨される介入を提案し患者が意思決定できるように支援する必要があり価値観や

好みに基づいてエビデンスやエビデンスの要約を各自で吟味することになります

[4] 政策決定者の視点では

ldquo強い推奨rdquoならばほとんどの状況下で推奨事項をパフォーマンス指標として政策に採用

できますldquo弱い推奨rdquoならば政策決定のためには多数の利害関係者を含めてより実質的

な論議を重ねる必要があります

ちなみにGRADE を採用している ACCP はパフォーマンス指標はGRADE の 1A 1B と

評価された推奨事項を基準とすべきで1C 2A2B2C と評価された推奨事項はパフォー

マンス指標としては使用してはならないとしています()

参考

1 GRADE教科書 p98

2 ACCP ガイドラインのパフォーマンス指標と免責事項の記載 GRADE教科書 p127

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

665

Item -0 ガイドラインパネル編成プロセス確立 発言番号 00953

Blog 20120622

ガイドライン作成のためのグループ編成は(WHO に準じた)以下の仮想チームとしています

(GRADE 教科書の p148 参照)

(1)ガイドライン運営委員会

(2)専門ガイドライン作成グループ(パネル)

(3)特別作業班(タスクフォース)

(4)事務局

(5)外部専門家

当仮想パネルには癌専門医臨床医統計学者ガイドライン作成経験のある人システマ

ティックレビュー作成者(最低 2 人)費用効果分析者エンドユーザーである患者(あるいは

患者代表者)そして GRADE working group member がそろっていますすばらしいチ

ームです

=========

ガイドラインパネルは全員利益相反の公表が必要(GRADE 教科書 p152)

パネル全員はGRADE を使うということに同意する必要があります

これはとても重要なことでありある介入に関する推奨を決定する際の投票など

に参加すべきではないメンバーがでてくる可能性があります

例えばある薬剤の開発に関与した人はエビデンスの質評価には参加できても当該薬

剤の推奨決定には関与できないガイドラインに示す推奨決定結果によってメン

バー脱退ということは許されないという原則です当然ながらガイドライン作

成者リストに名前だけを乗せるだけの参加はよろしくないということです

参考

1ガイドラインパネル編成プロセス確立

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[1]

2利益相反の公表 GRADE 教科書 p152

これらは上記リンク「1」の下図に示す ref 3 (GRADE システムがはじめて公開された WHO 資料)を翻訳した

ものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

765

Item -1 患者臨床医の疑問(CQ)収集

Blog 20120702

GRADE ガイドラインの作成の流れを説明するために利用するシナリオは「GRADE システ

ムの使い方」 _20120426ppt にあるように( 2012622 に内容を改変した

how_to_use_grade_aihara_20120426lzh を web 上にアップしましたので古いデータ

利用の方は気をつけてください)

スライド17 にあるようなシナリオから1つの臨床疑問を作成して GRADE ガイドラインを作

成してみるという作業です

ldquo固形癌患者において非経口的抗凝固療法を実施すると癌患者の死亡率が低下できて生

存延長につながるのだろうかrdquoというldquo治療rdquoに関する疑問です

臨床研究には目的に応じて5つの分野(治療害鑑別診断診断予後)がありそれぞ

れに適した研究デザインがあるたとえば治療に関する研究にはランダム化比較試験(RCT)

やシステマティックレビュー害の研究にはRCTや観察研究診断研究には横断研究や

RCT などが適している(GRADE教科書 p29)

注 クリニカルクエスチョン(臨床上の疑問臨床疑問)という用語が EBMでは多用されますが

GRADE 論文においてはより広い意味のヘルスケアクエスチョンが記載されることもありますこ

れはldquo対象が必ずしも患者ではないことがあるldquoという理由です(GRADE 教科書 p28)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

865

Item -2 疑問の定式化 Blog 20120703

ほとんどの疑問は患者(P)介入(I)比較(C)アウトカム(O)に分けられる

患者の治療について決断をしなくてはならない臨床医が想起するヘルスケアクエスチョン(特に

前景疑問)は関連する患者集団治療方法や曝露および治療や曝露によって生じるldquo 患者

にとって重要なアウトカムrdquo を特定したものであり基本的にはPICOの4 要素から成っている

非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

(注)

通常はPICO 形式の中の特にPIO(Patient Intervention Outcomes)について明確にして検

索すると関連するエビデンスを見つけやすい

Patient 癌患者(肺癌大腸癌前立腺癌など)

Intervention parenteral anticoagulation (ヘパリン)

Comparison プラセボno heparin

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

965

Item -3 アウトカムの選択 Blog 20120705

アウトカムとは転帰や帰結のことで研究の目的測定項目を意味する特に臨床研究では評価項

目指標を意味するエンドポイントという用語を用いて主要(1次)エンドポイント副次(2次)エン

ドポイント複数の指標を組み合わせた複合エンドポイントなどの表現が使われるアウトカム変数

には2値(dichotomous)変数と連続(continuous)変数の2種類がある

患者にとって重要なアウトカムとは次のような質問に「はい」という答えが出るようなアウトカムと定

義される

「患者がこの治療によって変化する唯一のアウトカムがこのアウトカムであると知った場合それ

に副作用やコストを伴うのだとしても患者はその治療を受けることを考慮するだろうか」

スライド 20

患者にとって重要なアウトカムとは以下のカテゴリーのⅠⅡⅢでありⅣは患者にとって重要なも

のではない

本シナリオでは(システマティックレビューにおける 「重要」なアウトカム)

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

(注)

患者にとって重要なアウトカムに関する情報が入手できない状況では代替アウトカムを考慮すべ

きであるがヘルスケアクエスチョンのリストには代替アウトカムではなく本来の重要なアウトカムを

記載すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1065

Item -4 アウトカムの相対的な重要度の判定 Blog 20120705

GRADE ではアウトカムの重要度を9段階の点数で相対的に評価しそれらを3点きざみで3つ

に分類する意志決定にとって「重大7〜9点」「重要4〜6点」「重要ではない1〜3点」の分

類である

この3つの分類の中でシステマティックレビューに関係するアウトカムは「重大」なものと「重要」

なものであり両者をGRADEエビデンステーブルに含まなければならない

ガイドラインの推奨に影響するアウトカムは「重大」なアウトカムのみである

(注)

1通常どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に

着手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネル

は研究計画書の作成後または分析の実施後になってアウトカムの重要度を再評価すべきである

(GRADE 教科書 p32 参照)

2診療ガイドライン作成においては「重大」なアウトカムだけを検討するため小出血や QOL血

小板減少のアウトカムは考慮しない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1165

Item -5 疾患定義選択基準など Blog 20120706

疾患や介入の定義とともに採用するエビデンスの種類(研究デザイン)を決断する

異なるタイプの疑問に取り組むためはどんな種類のエビデンスが使われるべきかを明確にすること

が大切である

引用文献

Improving the use of research evidence in guideline development 7 Deciding what evidence to

include Oxman AD Schuumlnemann HJ and Fretheim A

httpwwwhealth-policy-systemscomcontentpdf1478-4505-4-19pdf

シナリオの場合以下のようになる

Types of studies Randomized controlled trials (RCTs)

Types of participants

Patients with cancer with no indication for prophylactic or therapeutic anticoagulation

Types of interventions

Experimental intervention parenteral anticoagulants such as UFH LMWH and fondaparinux

Comparator intervention placebo or no intervention

Outcomes

All-cause mortality Symptomatic venous thromboembolism Health-related quality of life

Major bleeding Minor bleeding Thrombocytopenia

bull The study designs to be included in a review should be dictated by the interventions and

outcomes being considered A decision about how broad a range of study designs to

consider should be made in relationship to the characteristics of the interventions being

considered what evidence is available and the time and resources available

bull Decisions about the range of study designs to include should be made explicitly

bull Great caution should be taken to avoid confusing a lack of evidence with evidence of no

effect and to acknowledge uncertainty

bull Expert opinion is not a type of study design and should not be used as evidence

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 4: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

465

[はじめに] -(1) GRADEが登場した背景 ML発言番号00994

(2012626)

Guyatt らがJAMA-Users Guides 初版から述べていたにもかかわらずエビデンスの質と推

奨の評価において「エビデンスの階層(RCT 至上主義のような)」だけが注目されてしま

って診療ガイドラインがrdquo研究デザインによって分類されたエビデンスの質rdquoに依存するよう

になってしまいました

この状況は日本だけではなく海外でも共通したものでしたのでEBM working group の

Guyatt と当時 Cochrane のリーダーだった Oxman が一緒になって2000 年に GRADE

working group を立ち上げたという歴史です

Guyattがたはコクラングループが GRADEを採用し(2003年ごろ)2008年の BMJシリーズ

を発表してこれで適切な方向に向かうと思ったようですがその期待は大きく裏切られ今

でも GRADE改変論文や誤った GRADE利用による診療ガイドラインが次々と発表されていま

すそこでGRADE はガイドラインに特化した GRADE を解説すべくJCE シリーズを 2011

年から発表しているというわけです2012年6月の時点では20~22連載予定のうち12まで

が出版されています

まとめると

gtGRADEの登場してきた背景はなにか

上記のような背景で

rdquo研究デザイン主体のエビデンス分類rdquoと

rdquoエビデンス依存の推奨決定rdquoを修正することが目的です

「GRADEはエビデンスの質と推奨を分離する」

gtSRGL ともにGRADE はどのような状況に対して作られたのか

rdquo世界中にたくさんあるグレーディングシステムをひとつに統一するrdquo

「エビデンスの質評価と推奨決定プロセスを簡潔なものとしてその透明性を高める」

参考

1 GRADE教科書の FAQ

2 httpwwwgrade-jpncomgrade-faq-test1html

3 httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[1]

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

565

[はじめに] -(2) なぜ GRADE が必要なのか ML 発言番号 00--- (627)

1EBMを指導する方の視点

2患者の視点

3臨床医の視点

4政策決定者の視点

[1] EBMを指導する方の視点では

医学文献からの論文を診療のガイドとして使用するための通常の3ステップアプローチ(結果

は妥当か結果は何か患者ケアに適用できるか)のほとんどをGRADE の枠組みで評価で

きるということが「エビデンスの質評価に GRADE を使う論拠」です (スライド 11)

しかも評価をひとつの表(エビデンスプロファイル EP)に提示すると長々とした文章を読ま

なくても一目瞭然で研究の数患者数イベント数そして効果の大きさやエビデンスの質

評価の理由を理解できるというわけです

EP の例 httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

効果推定値の確信の程度がldquoエビデンスの質rdquoです

[2] 患者の視点では

GRADE による推奨の強さはstrongか weak (conditional)の 2 種類のいずれかです

ldquo強い推奨rdquoならばほぼ全員が推奨される介入を希望するでしょうldquo弱い推奨rdquoならば大

多くの患者が提案される介入を希望するだろうし希望しない患者も多いということです

[3] 臨床医の視点では

ldquo強い推奨rdquoならばほぼ全ての患者が推奨される介入を受けるようにすべきでありガイドラ

インに準じた推奨を遵守しているかどうかは医療の質評価にも利用できます ldquo弱い推奨rdquoな

らば推奨される介入を提案し患者が意思決定できるように支援する必要があり価値観や

好みに基づいてエビデンスやエビデンスの要約を各自で吟味することになります

[4] 政策決定者の視点では

ldquo強い推奨rdquoならばほとんどの状況下で推奨事項をパフォーマンス指標として政策に採用

できますldquo弱い推奨rdquoならば政策決定のためには多数の利害関係者を含めてより実質的

な論議を重ねる必要があります

ちなみにGRADE を採用している ACCP はパフォーマンス指標はGRADE の 1A 1B と

評価された推奨事項を基準とすべきで1C 2A2B2C と評価された推奨事項はパフォー

マンス指標としては使用してはならないとしています()

参考

1 GRADE教科書 p98

2 ACCP ガイドラインのパフォーマンス指標と免責事項の記載 GRADE教科書 p127

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

665

Item -0 ガイドラインパネル編成プロセス確立 発言番号 00953

Blog 20120622

ガイドライン作成のためのグループ編成は(WHO に準じた)以下の仮想チームとしています

(GRADE 教科書の p148 参照)

(1)ガイドライン運営委員会

(2)専門ガイドライン作成グループ(パネル)

(3)特別作業班(タスクフォース)

(4)事務局

(5)外部専門家

当仮想パネルには癌専門医臨床医統計学者ガイドライン作成経験のある人システマ

ティックレビュー作成者(最低 2 人)費用効果分析者エンドユーザーである患者(あるいは

患者代表者)そして GRADE working group member がそろっていますすばらしいチ

ームです

=========

ガイドラインパネルは全員利益相反の公表が必要(GRADE 教科書 p152)

パネル全員はGRADE を使うということに同意する必要があります

これはとても重要なことでありある介入に関する推奨を決定する際の投票など

に参加すべきではないメンバーがでてくる可能性があります

例えばある薬剤の開発に関与した人はエビデンスの質評価には参加できても当該薬

剤の推奨決定には関与できないガイドラインに示す推奨決定結果によってメン

バー脱退ということは許されないという原則です当然ながらガイドライン作

成者リストに名前だけを乗せるだけの参加はよろしくないということです

参考

1ガイドラインパネル編成プロセス確立

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[1]

2利益相反の公表 GRADE 教科書 p152

これらは上記リンク「1」の下図に示す ref 3 (GRADE システムがはじめて公開された WHO 資料)を翻訳した

ものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

765

Item -1 患者臨床医の疑問(CQ)収集

Blog 20120702

GRADE ガイドラインの作成の流れを説明するために利用するシナリオは「GRADE システ

ムの使い方」 _20120426ppt にあるように( 2012622 に内容を改変した

how_to_use_grade_aihara_20120426lzh を web 上にアップしましたので古いデータ

利用の方は気をつけてください)

スライド17 にあるようなシナリオから1つの臨床疑問を作成して GRADE ガイドラインを作

成してみるという作業です

ldquo固形癌患者において非経口的抗凝固療法を実施すると癌患者の死亡率が低下できて生

存延長につながるのだろうかrdquoというldquo治療rdquoに関する疑問です

臨床研究には目的に応じて5つの分野(治療害鑑別診断診断予後)がありそれぞ

れに適した研究デザインがあるたとえば治療に関する研究にはランダム化比較試験(RCT)

やシステマティックレビュー害の研究にはRCTや観察研究診断研究には横断研究や

RCT などが適している(GRADE教科書 p29)

注 クリニカルクエスチョン(臨床上の疑問臨床疑問)という用語が EBMでは多用されますが

GRADE 論文においてはより広い意味のヘルスケアクエスチョンが記載されることもありますこ

れはldquo対象が必ずしも患者ではないことがあるldquoという理由です(GRADE 教科書 p28)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

865

Item -2 疑問の定式化 Blog 20120703

ほとんどの疑問は患者(P)介入(I)比較(C)アウトカム(O)に分けられる

患者の治療について決断をしなくてはならない臨床医が想起するヘルスケアクエスチョン(特に

前景疑問)は関連する患者集団治療方法や曝露および治療や曝露によって生じるldquo 患者

にとって重要なアウトカムrdquo を特定したものであり基本的にはPICOの4 要素から成っている

非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

(注)

通常はPICO 形式の中の特にPIO(Patient Intervention Outcomes)について明確にして検

索すると関連するエビデンスを見つけやすい

Patient 癌患者(肺癌大腸癌前立腺癌など)

Intervention parenteral anticoagulation (ヘパリン)

Comparison プラセボno heparin

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

965

Item -3 アウトカムの選択 Blog 20120705

アウトカムとは転帰や帰結のことで研究の目的測定項目を意味する特に臨床研究では評価項

目指標を意味するエンドポイントという用語を用いて主要(1次)エンドポイント副次(2次)エン

ドポイント複数の指標を組み合わせた複合エンドポイントなどの表現が使われるアウトカム変数

には2値(dichotomous)変数と連続(continuous)変数の2種類がある

患者にとって重要なアウトカムとは次のような質問に「はい」という答えが出るようなアウトカムと定

義される

「患者がこの治療によって変化する唯一のアウトカムがこのアウトカムであると知った場合それ

に副作用やコストを伴うのだとしても患者はその治療を受けることを考慮するだろうか」

スライド 20

患者にとって重要なアウトカムとは以下のカテゴリーのⅠⅡⅢでありⅣは患者にとって重要なも

のではない

本シナリオでは(システマティックレビューにおける 「重要」なアウトカム)

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

(注)

患者にとって重要なアウトカムに関する情報が入手できない状況では代替アウトカムを考慮すべ

きであるがヘルスケアクエスチョンのリストには代替アウトカムではなく本来の重要なアウトカムを

記載すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1065

Item -4 アウトカムの相対的な重要度の判定 Blog 20120705

GRADE ではアウトカムの重要度を9段階の点数で相対的に評価しそれらを3点きざみで3つ

に分類する意志決定にとって「重大7〜9点」「重要4〜6点」「重要ではない1〜3点」の分

類である

この3つの分類の中でシステマティックレビューに関係するアウトカムは「重大」なものと「重要」

なものであり両者をGRADEエビデンステーブルに含まなければならない

ガイドラインの推奨に影響するアウトカムは「重大」なアウトカムのみである

(注)

1通常どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に

着手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネル

は研究計画書の作成後または分析の実施後になってアウトカムの重要度を再評価すべきである

(GRADE 教科書 p32 参照)

2診療ガイドライン作成においては「重大」なアウトカムだけを検討するため小出血や QOL血

小板減少のアウトカムは考慮しない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1165

Item -5 疾患定義選択基準など Blog 20120706

疾患や介入の定義とともに採用するエビデンスの種類(研究デザイン)を決断する

異なるタイプの疑問に取り組むためはどんな種類のエビデンスが使われるべきかを明確にすること

が大切である

引用文献

Improving the use of research evidence in guideline development 7 Deciding what evidence to

include Oxman AD Schuumlnemann HJ and Fretheim A

httpwwwhealth-policy-systemscomcontentpdf1478-4505-4-19pdf

シナリオの場合以下のようになる

Types of studies Randomized controlled trials (RCTs)

Types of participants

Patients with cancer with no indication for prophylactic or therapeutic anticoagulation

Types of interventions

Experimental intervention parenteral anticoagulants such as UFH LMWH and fondaparinux

Comparator intervention placebo or no intervention

Outcomes

All-cause mortality Symptomatic venous thromboembolism Health-related quality of life

Major bleeding Minor bleeding Thrombocytopenia

bull The study designs to be included in a review should be dictated by the interventions and

outcomes being considered A decision about how broad a range of study designs to

consider should be made in relationship to the characteristics of the interventions being

considered what evidence is available and the time and resources available

bull Decisions about the range of study designs to include should be made explicitly

bull Great caution should be taken to avoid confusing a lack of evidence with evidence of no

effect and to acknowledge uncertainty

bull Expert opinion is not a type of study design and should not be used as evidence

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 5: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

565

[はじめに] -(2) なぜ GRADE が必要なのか ML 発言番号 00--- (627)

1EBMを指導する方の視点

2患者の視点

3臨床医の視点

4政策決定者の視点

[1] EBMを指導する方の視点では

医学文献からの論文を診療のガイドとして使用するための通常の3ステップアプローチ(結果

は妥当か結果は何か患者ケアに適用できるか)のほとんどをGRADE の枠組みで評価で

きるということが「エビデンスの質評価に GRADE を使う論拠」です (スライド 11)

しかも評価をひとつの表(エビデンスプロファイル EP)に提示すると長々とした文章を読ま

なくても一目瞭然で研究の数患者数イベント数そして効果の大きさやエビデンスの質

評価の理由を理解できるというわけです

EP の例 httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

効果推定値の確信の程度がldquoエビデンスの質rdquoです

[2] 患者の視点では

GRADE による推奨の強さはstrongか weak (conditional)の 2 種類のいずれかです

ldquo強い推奨rdquoならばほぼ全員が推奨される介入を希望するでしょうldquo弱い推奨rdquoならば大

多くの患者が提案される介入を希望するだろうし希望しない患者も多いということです

[3] 臨床医の視点では

ldquo強い推奨rdquoならばほぼ全ての患者が推奨される介入を受けるようにすべきでありガイドラ

インに準じた推奨を遵守しているかどうかは医療の質評価にも利用できます ldquo弱い推奨rdquoな

らば推奨される介入を提案し患者が意思決定できるように支援する必要があり価値観や

好みに基づいてエビデンスやエビデンスの要約を各自で吟味することになります

[4] 政策決定者の視点では

ldquo強い推奨rdquoならばほとんどの状況下で推奨事項をパフォーマンス指標として政策に採用

できますldquo弱い推奨rdquoならば政策決定のためには多数の利害関係者を含めてより実質的

な論議を重ねる必要があります

ちなみにGRADE を採用している ACCP はパフォーマンス指標はGRADE の 1A 1B と

評価された推奨事項を基準とすべきで1C 2A2B2C と評価された推奨事項はパフォー

マンス指標としては使用してはならないとしています()

参考

1 GRADE教科書 p98

2 ACCP ガイドラインのパフォーマンス指標と免責事項の記載 GRADE教科書 p127

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

665

Item -0 ガイドラインパネル編成プロセス確立 発言番号 00953

Blog 20120622

ガイドライン作成のためのグループ編成は(WHO に準じた)以下の仮想チームとしています

(GRADE 教科書の p148 参照)

(1)ガイドライン運営委員会

(2)専門ガイドライン作成グループ(パネル)

(3)特別作業班(タスクフォース)

(4)事務局

(5)外部専門家

当仮想パネルには癌専門医臨床医統計学者ガイドライン作成経験のある人システマ

ティックレビュー作成者(最低 2 人)費用効果分析者エンドユーザーである患者(あるいは

患者代表者)そして GRADE working group member がそろっていますすばらしいチ

ームです

=========

ガイドラインパネルは全員利益相反の公表が必要(GRADE 教科書 p152)

パネル全員はGRADE を使うということに同意する必要があります

これはとても重要なことでありある介入に関する推奨を決定する際の投票など

に参加すべきではないメンバーがでてくる可能性があります

例えばある薬剤の開発に関与した人はエビデンスの質評価には参加できても当該薬

剤の推奨決定には関与できないガイドラインに示す推奨決定結果によってメン

バー脱退ということは許されないという原則です当然ながらガイドライン作

成者リストに名前だけを乗せるだけの参加はよろしくないということです

参考

1ガイドラインパネル編成プロセス確立

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[1]

2利益相反の公表 GRADE 教科書 p152

これらは上記リンク「1」の下図に示す ref 3 (GRADE システムがはじめて公開された WHO 資料)を翻訳した

ものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

765

Item -1 患者臨床医の疑問(CQ)収集

Blog 20120702

GRADE ガイドラインの作成の流れを説明するために利用するシナリオは「GRADE システ

ムの使い方」 _20120426ppt にあるように( 2012622 に内容を改変した

how_to_use_grade_aihara_20120426lzh を web 上にアップしましたので古いデータ

利用の方は気をつけてください)

スライド17 にあるようなシナリオから1つの臨床疑問を作成して GRADE ガイドラインを作

成してみるという作業です

ldquo固形癌患者において非経口的抗凝固療法を実施すると癌患者の死亡率が低下できて生

存延長につながるのだろうかrdquoというldquo治療rdquoに関する疑問です

臨床研究には目的に応じて5つの分野(治療害鑑別診断診断予後)がありそれぞ

れに適した研究デザインがあるたとえば治療に関する研究にはランダム化比較試験(RCT)

やシステマティックレビュー害の研究にはRCTや観察研究診断研究には横断研究や

RCT などが適している(GRADE教科書 p29)

注 クリニカルクエスチョン(臨床上の疑問臨床疑問)という用語が EBMでは多用されますが

GRADE 論文においてはより広い意味のヘルスケアクエスチョンが記載されることもありますこ

れはldquo対象が必ずしも患者ではないことがあるldquoという理由です(GRADE 教科書 p28)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

865

Item -2 疑問の定式化 Blog 20120703

ほとんどの疑問は患者(P)介入(I)比較(C)アウトカム(O)に分けられる

患者の治療について決断をしなくてはならない臨床医が想起するヘルスケアクエスチョン(特に

前景疑問)は関連する患者集団治療方法や曝露および治療や曝露によって生じるldquo 患者

にとって重要なアウトカムrdquo を特定したものであり基本的にはPICOの4 要素から成っている

非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

(注)

通常はPICO 形式の中の特にPIO(Patient Intervention Outcomes)について明確にして検

索すると関連するエビデンスを見つけやすい

Patient 癌患者(肺癌大腸癌前立腺癌など)

Intervention parenteral anticoagulation (ヘパリン)

Comparison プラセボno heparin

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

965

Item -3 アウトカムの選択 Blog 20120705

アウトカムとは転帰や帰結のことで研究の目的測定項目を意味する特に臨床研究では評価項

目指標を意味するエンドポイントという用語を用いて主要(1次)エンドポイント副次(2次)エン

ドポイント複数の指標を組み合わせた複合エンドポイントなどの表現が使われるアウトカム変数

には2値(dichotomous)変数と連続(continuous)変数の2種類がある

患者にとって重要なアウトカムとは次のような質問に「はい」という答えが出るようなアウトカムと定

義される

「患者がこの治療によって変化する唯一のアウトカムがこのアウトカムであると知った場合それ

に副作用やコストを伴うのだとしても患者はその治療を受けることを考慮するだろうか」

スライド 20

患者にとって重要なアウトカムとは以下のカテゴリーのⅠⅡⅢでありⅣは患者にとって重要なも

のではない

本シナリオでは(システマティックレビューにおける 「重要」なアウトカム)

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

(注)

患者にとって重要なアウトカムに関する情報が入手できない状況では代替アウトカムを考慮すべ

きであるがヘルスケアクエスチョンのリストには代替アウトカムではなく本来の重要なアウトカムを

記載すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1065

Item -4 アウトカムの相対的な重要度の判定 Blog 20120705

GRADE ではアウトカムの重要度を9段階の点数で相対的に評価しそれらを3点きざみで3つ

に分類する意志決定にとって「重大7〜9点」「重要4〜6点」「重要ではない1〜3点」の分

類である

この3つの分類の中でシステマティックレビューに関係するアウトカムは「重大」なものと「重要」

なものであり両者をGRADEエビデンステーブルに含まなければならない

ガイドラインの推奨に影響するアウトカムは「重大」なアウトカムのみである

(注)

1通常どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に

着手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネル

は研究計画書の作成後または分析の実施後になってアウトカムの重要度を再評価すべきである

(GRADE 教科書 p32 参照)

2診療ガイドライン作成においては「重大」なアウトカムだけを検討するため小出血や QOL血

小板減少のアウトカムは考慮しない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1165

Item -5 疾患定義選択基準など Blog 20120706

疾患や介入の定義とともに採用するエビデンスの種類(研究デザイン)を決断する

異なるタイプの疑問に取り組むためはどんな種類のエビデンスが使われるべきかを明確にすること

が大切である

引用文献

Improving the use of research evidence in guideline development 7 Deciding what evidence to

include Oxman AD Schuumlnemann HJ and Fretheim A

httpwwwhealth-policy-systemscomcontentpdf1478-4505-4-19pdf

シナリオの場合以下のようになる

Types of studies Randomized controlled trials (RCTs)

Types of participants

Patients with cancer with no indication for prophylactic or therapeutic anticoagulation

Types of interventions

Experimental intervention parenteral anticoagulants such as UFH LMWH and fondaparinux

Comparator intervention placebo or no intervention

Outcomes

All-cause mortality Symptomatic venous thromboembolism Health-related quality of life

Major bleeding Minor bleeding Thrombocytopenia

bull The study designs to be included in a review should be dictated by the interventions and

outcomes being considered A decision about how broad a range of study designs to

consider should be made in relationship to the characteristics of the interventions being

considered what evidence is available and the time and resources available

bull Decisions about the range of study designs to include should be made explicitly

bull Great caution should be taken to avoid confusing a lack of evidence with evidence of no

effect and to acknowledge uncertainty

bull Expert opinion is not a type of study design and should not be used as evidence

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 6: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

665

Item -0 ガイドラインパネル編成プロセス確立 発言番号 00953

Blog 20120622

ガイドライン作成のためのグループ編成は(WHO に準じた)以下の仮想チームとしています

(GRADE 教科書の p148 参照)

(1)ガイドライン運営委員会

(2)専門ガイドライン作成グループ(パネル)

(3)特別作業班(タスクフォース)

(4)事務局

(5)外部専門家

当仮想パネルには癌専門医臨床医統計学者ガイドライン作成経験のある人システマ

ティックレビュー作成者(最低 2 人)費用効果分析者エンドユーザーである患者(あるいは

患者代表者)そして GRADE working group member がそろっていますすばらしいチ

ームです

=========

ガイドラインパネルは全員利益相反の公表が必要(GRADE 教科書 p152)

パネル全員はGRADE を使うということに同意する必要があります

これはとても重要なことでありある介入に関する推奨を決定する際の投票など

に参加すべきではないメンバーがでてくる可能性があります

例えばある薬剤の開発に関与した人はエビデンスの質評価には参加できても当該薬

剤の推奨決定には関与できないガイドラインに示す推奨決定結果によってメン

バー脱退ということは許されないという原則です当然ながらガイドライン作

成者リストに名前だけを乗せるだけの参加はよろしくないということです

参考

1ガイドラインパネル編成プロセス確立

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[1]

2利益相反の公表 GRADE 教科書 p152

これらは上記リンク「1」の下図に示す ref 3 (GRADE システムがはじめて公開された WHO 資料)を翻訳した

ものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

765

Item -1 患者臨床医の疑問(CQ)収集

Blog 20120702

GRADE ガイドラインの作成の流れを説明するために利用するシナリオは「GRADE システ

ムの使い方」 _20120426ppt にあるように( 2012622 に内容を改変した

how_to_use_grade_aihara_20120426lzh を web 上にアップしましたので古いデータ

利用の方は気をつけてください)

スライド17 にあるようなシナリオから1つの臨床疑問を作成して GRADE ガイドラインを作

成してみるという作業です

ldquo固形癌患者において非経口的抗凝固療法を実施すると癌患者の死亡率が低下できて生

存延長につながるのだろうかrdquoというldquo治療rdquoに関する疑問です

臨床研究には目的に応じて5つの分野(治療害鑑別診断診断予後)がありそれぞ

れに適した研究デザインがあるたとえば治療に関する研究にはランダム化比較試験(RCT)

やシステマティックレビュー害の研究にはRCTや観察研究診断研究には横断研究や

RCT などが適している(GRADE教科書 p29)

注 クリニカルクエスチョン(臨床上の疑問臨床疑問)という用語が EBMでは多用されますが

GRADE 論文においてはより広い意味のヘルスケアクエスチョンが記載されることもありますこ

れはldquo対象が必ずしも患者ではないことがあるldquoという理由です(GRADE 教科書 p28)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

865

Item -2 疑問の定式化 Blog 20120703

ほとんどの疑問は患者(P)介入(I)比較(C)アウトカム(O)に分けられる

患者の治療について決断をしなくてはならない臨床医が想起するヘルスケアクエスチョン(特に

前景疑問)は関連する患者集団治療方法や曝露および治療や曝露によって生じるldquo 患者

にとって重要なアウトカムrdquo を特定したものであり基本的にはPICOの4 要素から成っている

非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

(注)

通常はPICO 形式の中の特にPIO(Patient Intervention Outcomes)について明確にして検

索すると関連するエビデンスを見つけやすい

Patient 癌患者(肺癌大腸癌前立腺癌など)

Intervention parenteral anticoagulation (ヘパリン)

Comparison プラセボno heparin

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

965

Item -3 アウトカムの選択 Blog 20120705

アウトカムとは転帰や帰結のことで研究の目的測定項目を意味する特に臨床研究では評価項

目指標を意味するエンドポイントという用語を用いて主要(1次)エンドポイント副次(2次)エン

ドポイント複数の指標を組み合わせた複合エンドポイントなどの表現が使われるアウトカム変数

には2値(dichotomous)変数と連続(continuous)変数の2種類がある

患者にとって重要なアウトカムとは次のような質問に「はい」という答えが出るようなアウトカムと定

義される

「患者がこの治療によって変化する唯一のアウトカムがこのアウトカムであると知った場合それ

に副作用やコストを伴うのだとしても患者はその治療を受けることを考慮するだろうか」

スライド 20

患者にとって重要なアウトカムとは以下のカテゴリーのⅠⅡⅢでありⅣは患者にとって重要なも

のではない

本シナリオでは(システマティックレビューにおける 「重要」なアウトカム)

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

(注)

患者にとって重要なアウトカムに関する情報が入手できない状況では代替アウトカムを考慮すべ

きであるがヘルスケアクエスチョンのリストには代替アウトカムではなく本来の重要なアウトカムを

記載すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1065

Item -4 アウトカムの相対的な重要度の判定 Blog 20120705

GRADE ではアウトカムの重要度を9段階の点数で相対的に評価しそれらを3点きざみで3つ

に分類する意志決定にとって「重大7〜9点」「重要4〜6点」「重要ではない1〜3点」の分

類である

この3つの分類の中でシステマティックレビューに関係するアウトカムは「重大」なものと「重要」

なものであり両者をGRADEエビデンステーブルに含まなければならない

ガイドラインの推奨に影響するアウトカムは「重大」なアウトカムのみである

(注)

1通常どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に

着手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネル

は研究計画書の作成後または分析の実施後になってアウトカムの重要度を再評価すべきである

(GRADE 教科書 p32 参照)

2診療ガイドライン作成においては「重大」なアウトカムだけを検討するため小出血や QOL血

小板減少のアウトカムは考慮しない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1165

Item -5 疾患定義選択基準など Blog 20120706

疾患や介入の定義とともに採用するエビデンスの種類(研究デザイン)を決断する

異なるタイプの疑問に取り組むためはどんな種類のエビデンスが使われるべきかを明確にすること

が大切である

引用文献

Improving the use of research evidence in guideline development 7 Deciding what evidence to

include Oxman AD Schuumlnemann HJ and Fretheim A

httpwwwhealth-policy-systemscomcontentpdf1478-4505-4-19pdf

シナリオの場合以下のようになる

Types of studies Randomized controlled trials (RCTs)

Types of participants

Patients with cancer with no indication for prophylactic or therapeutic anticoagulation

Types of interventions

Experimental intervention parenteral anticoagulants such as UFH LMWH and fondaparinux

Comparator intervention placebo or no intervention

Outcomes

All-cause mortality Symptomatic venous thromboembolism Health-related quality of life

Major bleeding Minor bleeding Thrombocytopenia

bull The study designs to be included in a review should be dictated by the interventions and

outcomes being considered A decision about how broad a range of study designs to

consider should be made in relationship to the characteristics of the interventions being

considered what evidence is available and the time and resources available

bull Decisions about the range of study designs to include should be made explicitly

bull Great caution should be taken to avoid confusing a lack of evidence with evidence of no

effect and to acknowledge uncertainty

bull Expert opinion is not a type of study design and should not be used as evidence

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 7: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

765

Item -1 患者臨床医の疑問(CQ)収集

Blog 20120702

GRADE ガイドラインの作成の流れを説明するために利用するシナリオは「GRADE システ

ムの使い方」 _20120426ppt にあるように( 2012622 に内容を改変した

how_to_use_grade_aihara_20120426lzh を web 上にアップしましたので古いデータ

利用の方は気をつけてください)

スライド17 にあるようなシナリオから1つの臨床疑問を作成して GRADE ガイドラインを作

成してみるという作業です

ldquo固形癌患者において非経口的抗凝固療法を実施すると癌患者の死亡率が低下できて生

存延長につながるのだろうかrdquoというldquo治療rdquoに関する疑問です

臨床研究には目的に応じて5つの分野(治療害鑑別診断診断予後)がありそれぞ

れに適した研究デザインがあるたとえば治療に関する研究にはランダム化比較試験(RCT)

やシステマティックレビュー害の研究にはRCTや観察研究診断研究には横断研究や

RCT などが適している(GRADE教科書 p29)

注 クリニカルクエスチョン(臨床上の疑問臨床疑問)という用語が EBMでは多用されますが

GRADE 論文においてはより広い意味のヘルスケアクエスチョンが記載されることもありますこ

れはldquo対象が必ずしも患者ではないことがあるldquoという理由です(GRADE 教科書 p28)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

865

Item -2 疑問の定式化 Blog 20120703

ほとんどの疑問は患者(P)介入(I)比較(C)アウトカム(O)に分けられる

患者の治療について決断をしなくてはならない臨床医が想起するヘルスケアクエスチョン(特に

前景疑問)は関連する患者集団治療方法や曝露および治療や曝露によって生じるldquo 患者

にとって重要なアウトカムrdquo を特定したものであり基本的にはPICOの4 要素から成っている

非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

(注)

通常はPICO 形式の中の特にPIO(Patient Intervention Outcomes)について明確にして検

索すると関連するエビデンスを見つけやすい

Patient 癌患者(肺癌大腸癌前立腺癌など)

Intervention parenteral anticoagulation (ヘパリン)

Comparison プラセボno heparin

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

965

Item -3 アウトカムの選択 Blog 20120705

アウトカムとは転帰や帰結のことで研究の目的測定項目を意味する特に臨床研究では評価項

目指標を意味するエンドポイントという用語を用いて主要(1次)エンドポイント副次(2次)エン

ドポイント複数の指標を組み合わせた複合エンドポイントなどの表現が使われるアウトカム変数

には2値(dichotomous)変数と連続(continuous)変数の2種類がある

患者にとって重要なアウトカムとは次のような質問に「はい」という答えが出るようなアウトカムと定

義される

「患者がこの治療によって変化する唯一のアウトカムがこのアウトカムであると知った場合それ

に副作用やコストを伴うのだとしても患者はその治療を受けることを考慮するだろうか」

スライド 20

患者にとって重要なアウトカムとは以下のカテゴリーのⅠⅡⅢでありⅣは患者にとって重要なも

のではない

本シナリオでは(システマティックレビューにおける 「重要」なアウトカム)

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

(注)

患者にとって重要なアウトカムに関する情報が入手できない状況では代替アウトカムを考慮すべ

きであるがヘルスケアクエスチョンのリストには代替アウトカムではなく本来の重要なアウトカムを

記載すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1065

Item -4 アウトカムの相対的な重要度の判定 Blog 20120705

GRADE ではアウトカムの重要度を9段階の点数で相対的に評価しそれらを3点きざみで3つ

に分類する意志決定にとって「重大7〜9点」「重要4〜6点」「重要ではない1〜3点」の分

類である

この3つの分類の中でシステマティックレビューに関係するアウトカムは「重大」なものと「重要」

なものであり両者をGRADEエビデンステーブルに含まなければならない

ガイドラインの推奨に影響するアウトカムは「重大」なアウトカムのみである

(注)

1通常どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に

着手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネル

は研究計画書の作成後または分析の実施後になってアウトカムの重要度を再評価すべきである

(GRADE 教科書 p32 参照)

2診療ガイドライン作成においては「重大」なアウトカムだけを検討するため小出血や QOL血

小板減少のアウトカムは考慮しない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1165

Item -5 疾患定義選択基準など Blog 20120706

疾患や介入の定義とともに採用するエビデンスの種類(研究デザイン)を決断する

異なるタイプの疑問に取り組むためはどんな種類のエビデンスが使われるべきかを明確にすること

が大切である

引用文献

Improving the use of research evidence in guideline development 7 Deciding what evidence to

include Oxman AD Schuumlnemann HJ and Fretheim A

httpwwwhealth-policy-systemscomcontentpdf1478-4505-4-19pdf

シナリオの場合以下のようになる

Types of studies Randomized controlled trials (RCTs)

Types of participants

Patients with cancer with no indication for prophylactic or therapeutic anticoagulation

Types of interventions

Experimental intervention parenteral anticoagulants such as UFH LMWH and fondaparinux

Comparator intervention placebo or no intervention

Outcomes

All-cause mortality Symptomatic venous thromboembolism Health-related quality of life

Major bleeding Minor bleeding Thrombocytopenia

bull The study designs to be included in a review should be dictated by the interventions and

outcomes being considered A decision about how broad a range of study designs to

consider should be made in relationship to the characteristics of the interventions being

considered what evidence is available and the time and resources available

bull Decisions about the range of study designs to include should be made explicitly

bull Great caution should be taken to avoid confusing a lack of evidence with evidence of no

effect and to acknowledge uncertainty

bull Expert opinion is not a type of study design and should not be used as evidence

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 8: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

865

Item -2 疑問の定式化 Blog 20120703

ほとんどの疑問は患者(P)介入(I)比較(C)アウトカム(O)に分けられる

患者の治療について決断をしなくてはならない臨床医が想起するヘルスケアクエスチョン(特に

前景疑問)は関連する患者集団治療方法や曝露および治療や曝露によって生じるldquo 患者

にとって重要なアウトカムrdquo を特定したものであり基本的にはPICOの4 要素から成っている

非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

(注)

通常はPICO 形式の中の特にPIO(Patient Intervention Outcomes)について明確にして検

索すると関連するエビデンスを見つけやすい

Patient 癌患者(肺癌大腸癌前立腺癌など)

Intervention parenteral anticoagulation (ヘパリン)

Comparison プラセボno heparin

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

965

Item -3 アウトカムの選択 Blog 20120705

アウトカムとは転帰や帰結のことで研究の目的測定項目を意味する特に臨床研究では評価項

目指標を意味するエンドポイントという用語を用いて主要(1次)エンドポイント副次(2次)エン

ドポイント複数の指標を組み合わせた複合エンドポイントなどの表現が使われるアウトカム変数

には2値(dichotomous)変数と連続(continuous)変数の2種類がある

患者にとって重要なアウトカムとは次のような質問に「はい」という答えが出るようなアウトカムと定

義される

「患者がこの治療によって変化する唯一のアウトカムがこのアウトカムであると知った場合それ

に副作用やコストを伴うのだとしても患者はその治療を受けることを考慮するだろうか」

スライド 20

患者にとって重要なアウトカムとは以下のカテゴリーのⅠⅡⅢでありⅣは患者にとって重要なも

のではない

本シナリオでは(システマティックレビューにおける 「重要」なアウトカム)

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

(注)

患者にとって重要なアウトカムに関する情報が入手できない状況では代替アウトカムを考慮すべ

きであるがヘルスケアクエスチョンのリストには代替アウトカムではなく本来の重要なアウトカムを

記載すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1065

Item -4 アウトカムの相対的な重要度の判定 Blog 20120705

GRADE ではアウトカムの重要度を9段階の点数で相対的に評価しそれらを3点きざみで3つ

に分類する意志決定にとって「重大7〜9点」「重要4〜6点」「重要ではない1〜3点」の分

類である

この3つの分類の中でシステマティックレビューに関係するアウトカムは「重大」なものと「重要」

なものであり両者をGRADEエビデンステーブルに含まなければならない

ガイドラインの推奨に影響するアウトカムは「重大」なアウトカムのみである

(注)

1通常どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に

着手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネル

は研究計画書の作成後または分析の実施後になってアウトカムの重要度を再評価すべきである

(GRADE 教科書 p32 参照)

2診療ガイドライン作成においては「重大」なアウトカムだけを検討するため小出血や QOL血

小板減少のアウトカムは考慮しない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1165

Item -5 疾患定義選択基準など Blog 20120706

疾患や介入の定義とともに採用するエビデンスの種類(研究デザイン)を決断する

異なるタイプの疑問に取り組むためはどんな種類のエビデンスが使われるべきかを明確にすること

が大切である

引用文献

Improving the use of research evidence in guideline development 7 Deciding what evidence to

include Oxman AD Schuumlnemann HJ and Fretheim A

httpwwwhealth-policy-systemscomcontentpdf1478-4505-4-19pdf

シナリオの場合以下のようになる

Types of studies Randomized controlled trials (RCTs)

Types of participants

Patients with cancer with no indication for prophylactic or therapeutic anticoagulation

Types of interventions

Experimental intervention parenteral anticoagulants such as UFH LMWH and fondaparinux

Comparator intervention placebo or no intervention

Outcomes

All-cause mortality Symptomatic venous thromboembolism Health-related quality of life

Major bleeding Minor bleeding Thrombocytopenia

bull The study designs to be included in a review should be dictated by the interventions and

outcomes being considered A decision about how broad a range of study designs to

consider should be made in relationship to the characteristics of the interventions being

considered what evidence is available and the time and resources available

bull Decisions about the range of study designs to include should be made explicitly

bull Great caution should be taken to avoid confusing a lack of evidence with evidence of no

effect and to acknowledge uncertainty

bull Expert opinion is not a type of study design and should not be used as evidence

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 9: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

965

Item -3 アウトカムの選択 Blog 20120705

アウトカムとは転帰や帰結のことで研究の目的測定項目を意味する特に臨床研究では評価項

目指標を意味するエンドポイントという用語を用いて主要(1次)エンドポイント副次(2次)エン

ドポイント複数の指標を組み合わせた複合エンドポイントなどの表現が使われるアウトカム変数

には2値(dichotomous)変数と連続(continuous)変数の2種類がある

患者にとって重要なアウトカムとは次のような質問に「はい」という答えが出るようなアウトカムと定

義される

「患者がこの治療によって変化する唯一のアウトカムがこのアウトカムであると知った場合それ

に副作用やコストを伴うのだとしても患者はその治療を受けることを考慮するだろうか」

スライド 20

患者にとって重要なアウトカムとは以下のカテゴリーのⅠⅡⅢでありⅣは患者にとって重要なも

のではない

本シナリオでは(システマティックレビューにおける 「重要」なアウトカム)

Outcomes 全死亡率大出血小出血症候性 DVTQOL血小板減少

(注)

患者にとって重要なアウトカムに関する情報が入手できない状況では代替アウトカムを考慮すべ

きであるがヘルスケアクエスチョンのリストには代替アウトカムではなく本来の重要なアウトカムを

記載すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1065

Item -4 アウトカムの相対的な重要度の判定 Blog 20120705

GRADE ではアウトカムの重要度を9段階の点数で相対的に評価しそれらを3点きざみで3つ

に分類する意志決定にとって「重大7〜9点」「重要4〜6点」「重要ではない1〜3点」の分

類である

この3つの分類の中でシステマティックレビューに関係するアウトカムは「重大」なものと「重要」

なものであり両者をGRADEエビデンステーブルに含まなければならない

ガイドラインの推奨に影響するアウトカムは「重大」なアウトカムのみである

(注)

1通常どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に

着手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネル

は研究計画書の作成後または分析の実施後になってアウトカムの重要度を再評価すべきである

(GRADE 教科書 p32 参照)

2診療ガイドライン作成においては「重大」なアウトカムだけを検討するため小出血や QOL血

小板減少のアウトカムは考慮しない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1165

Item -5 疾患定義選択基準など Blog 20120706

疾患や介入の定義とともに採用するエビデンスの種類(研究デザイン)を決断する

異なるタイプの疑問に取り組むためはどんな種類のエビデンスが使われるべきかを明確にすること

が大切である

引用文献

Improving the use of research evidence in guideline development 7 Deciding what evidence to

include Oxman AD Schuumlnemann HJ and Fretheim A

httpwwwhealth-policy-systemscomcontentpdf1478-4505-4-19pdf

シナリオの場合以下のようになる

Types of studies Randomized controlled trials (RCTs)

Types of participants

Patients with cancer with no indication for prophylactic or therapeutic anticoagulation

Types of interventions

Experimental intervention parenteral anticoagulants such as UFH LMWH and fondaparinux

Comparator intervention placebo or no intervention

Outcomes

All-cause mortality Symptomatic venous thromboembolism Health-related quality of life

Major bleeding Minor bleeding Thrombocytopenia

bull The study designs to be included in a review should be dictated by the interventions and

outcomes being considered A decision about how broad a range of study designs to

consider should be made in relationship to the characteristics of the interventions being

considered what evidence is available and the time and resources available

bull Decisions about the range of study designs to include should be made explicitly

bull Great caution should be taken to avoid confusing a lack of evidence with evidence of no

effect and to acknowledge uncertainty

bull Expert opinion is not a type of study design and should not be used as evidence

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 10: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1065

Item -4 アウトカムの相対的な重要度の判定 Blog 20120705

GRADE ではアウトカムの重要度を9段階の点数で相対的に評価しそれらを3点きざみで3つ

に分類する意志決定にとって「重大7〜9点」「重要4〜6点」「重要ではない1〜3点」の分

類である

この3つの分類の中でシステマティックレビューに関係するアウトカムは「重大」なものと「重要」

なものであり両者をGRADEエビデンステーブルに含まなければならない

ガイドラインの推奨に影響するアウトカムは「重大」なアウトカムのみである

(注)

1通常どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に

着手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネル

は研究計画書の作成後または分析の実施後になってアウトカムの重要度を再評価すべきである

(GRADE 教科書 p32 参照)

2診療ガイドライン作成においては「重大」なアウトカムだけを検討するため小出血や QOL血

小板減少のアウトカムは考慮しない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1165

Item -5 疾患定義選択基準など Blog 20120706

疾患や介入の定義とともに採用するエビデンスの種類(研究デザイン)を決断する

異なるタイプの疑問に取り組むためはどんな種類のエビデンスが使われるべきかを明確にすること

が大切である

引用文献

Improving the use of research evidence in guideline development 7 Deciding what evidence to

include Oxman AD Schuumlnemann HJ and Fretheim A

httpwwwhealth-policy-systemscomcontentpdf1478-4505-4-19pdf

シナリオの場合以下のようになる

Types of studies Randomized controlled trials (RCTs)

Types of participants

Patients with cancer with no indication for prophylactic or therapeutic anticoagulation

Types of interventions

Experimental intervention parenteral anticoagulants such as UFH LMWH and fondaparinux

Comparator intervention placebo or no intervention

Outcomes

All-cause mortality Symptomatic venous thromboembolism Health-related quality of life

Major bleeding Minor bleeding Thrombocytopenia

bull The study designs to be included in a review should be dictated by the interventions and

outcomes being considered A decision about how broad a range of study designs to

consider should be made in relationship to the characteristics of the interventions being

considered what evidence is available and the time and resources available

bull Decisions about the range of study designs to include should be made explicitly

bull Great caution should be taken to avoid confusing a lack of evidence with evidence of no

effect and to acknowledge uncertainty

bull Expert opinion is not a type of study design and should not be used as evidence

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 11: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1165

Item -5 疾患定義選択基準など Blog 20120706

疾患や介入の定義とともに採用するエビデンスの種類(研究デザイン)を決断する

異なるタイプの疑問に取り組むためはどんな種類のエビデンスが使われるべきかを明確にすること

が大切である

引用文献

Improving the use of research evidence in guideline development 7 Deciding what evidence to

include Oxman AD Schuumlnemann HJ and Fretheim A

httpwwwhealth-policy-systemscomcontentpdf1478-4505-4-19pdf

シナリオの場合以下のようになる

Types of studies Randomized controlled trials (RCTs)

Types of participants

Patients with cancer with no indication for prophylactic or therapeutic anticoagulation

Types of interventions

Experimental intervention parenteral anticoagulants such as UFH LMWH and fondaparinux

Comparator intervention placebo or no intervention

Outcomes

All-cause mortality Symptomatic venous thromboembolism Health-related quality of life

Major bleeding Minor bleeding Thrombocytopenia

bull The study designs to be included in a review should be dictated by the interventions and

outcomes being considered A decision about how broad a range of study designs to

consider should be made in relationship to the characteristics of the interventions being

considered what evidence is available and the time and resources available

bull Decisions about the range of study designs to include should be made explicitly

bull Great caution should be taken to avoid confusing a lack of evidence with evidence of no

effect and to acknowledge uncertainty

bull Expert opinion is not a type of study design and should not be used as evidence

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 12: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1265

Item -6 SR網羅的に検索する Blog 20120710

システマティックレビューとは「明確に定式化された疑問について関連する研究の特定

選択批判的吟味および採用研究からのデータを集めて解析する系統的で明確な方法を

用いるレビュー」である

つまりシステマティックレビューという言葉はバイアスの可能性を減少するようにデ

ザインした方法を用いて臨床疑問特に前景疑問を扱う要約ということである非系統

的なアプローチでは誤り(ランダム誤差)だけではなくバイアス(系統誤差)も生じや

すく介入効果などが過小評価されたり過大評価されたりする

関連する研究の特定選択ではコクランライブラリのような既存のシステマティックレビュー

やPubMedOvid などの電子検索引用検索ハンドサーチなど徹底的な検索を行って

さらに必要に応じて専門家に連絡を取るなど文献入手のためにバイアスやエラーを少なく

する努力が必要であるまた少なくとも1つのデータベースの電子検索式について使用さ

れたあらゆるldquolimitsrdquoを含め再現できるくらいに詳細に示すことが大切である (PRISMA)

参考

1 エビデンスの検索とデータの抽出統合 GRADE教科書 p36

2 GRADE ガイドラインにおけるシステマティックレビュー

httpwwwgrade-jpncomgradeguidelinegrade-guideline_2008-novhtml[4]

シナリオにおける検索式 (スライド 25)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 13: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1365

Item -7 SR適格基準(選択基準と除外基準) Blog 20120710

適格基準はデータ抽出前に作成する適切な適格基準はバイアスを排除しメタアナリシス

の再現性を保障するものである適格基準の項目はメタアナリシスのテーマや目的によって

さまざまであるが基本的な項目は共通している

適格基準の項目 説明

1研究デザイン 基本的には同一の研究を統合するRCTと非ランダム化試験は

統合すべきでない

2出版研究の時期 選択した理由とともにその時期を明記する新しい情報をなるべく

含むようにする

3言語 実際は英語が対象になるケースが多くなる英語抄録のない他

言語の文献情報を得るためには論文を入手し翻訳する必要があ

り費用も時間もかかる()

4複数発表におけ

る選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあるこ

れらの論文データをメタ解析で統合するのは誤りである複数発表

の研究資料がある場合はその中からどれを選択するかの基準が

必要である

5サンプル数観察

期間

統合結果に大きな影響を及ぼす傾向がある方法(例general

variance-based method)を用いる場合はサンプル数の少ない研

究を除外する基準を作成するサンプル数観察期間について

は適格基準による不適格論文の除外を行わず統計処理ののち

に検討する感度分析を実施してもよい

6類似治療介入お

よび類似効果の許

容範囲

治療や介入およびその効果を統合する際にどの程度まで同じと

みなすのかは重要なポイントである条件を厳しくすると適格基準

を満たす論文が少なくなり「検出力」が低下する

7 1~6の基準を満

たした不完全な報

告の適格性

上記の適格基準を全て満たしているものの学会発表抄録やレタ

ーなど研究論文と比較して不完全な報告があるこれらは適格

基準を満たすかどうか判断できないこと査読が行われていない可

能性があることから不適格になりえるしかし公開バイアスを考

えると含めるほうが適切かもしれない感度分析を行うという方法も

ある

() 英語で記述された報告と英語以外の言語で報告されたものを比較すると言語制限のない

メタ解析のほうがより精確という報告や特定の国からの RCT 報告はほとんどが統計的に

有意な結果のものだけであると示唆するエビデンスがある

シナリオの場合

検索した 8187 件の論文から最終的に 9 件の RCT を選択した(PRISMAフローチャート)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 14: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1465

PRISMA フローチャート (スライド 26)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 15: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1565

Item -8 SRアウトカムごとにデータを収集する Blog 20120712

システマティックレビューにおけるデータの収集(参加者介入比較介入研究デザインな

ど)はアウトカムごとに実施する

個別の研究単位でエビデンスの質の評価を行うという誤解が国内にはあるがGRADEのエビ

デンス評価は原則として複数の研究からのシステマティックレビューをもとに実施するもので

あり個別の研究単位の評価は行わないPRISMA チェックリストにおいて「アウトカムレベ

ル」の評価という新たな概念が導入されている(GRADE 教科書 p176)

エビデンスプロファイルや SoFに含むべき意思決定に重要なアウトカムの個数は7個を上限と

する(コクランハンドブック)検索して論文がないアウトカムも重要重大ならばエビデンス

プロファイルに記載すべきである

シナリオの場合(スライド 27)

アウトカム-1(all-cause mortality)に関しては 9 件アウトカム-4(症候性 VTE)に関しては 7

件アウトカム-5(QOL)に関しては1件がレビューに組み込まれている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 16: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1665

スライド 28

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 17: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1765

Item -9 SRアウトカムごとに個々の研究および研究全般の risk of bias を評価する

Blog 20120713

バイアスとは結論や推論における系統誤差または真実からの逸脱であるバイアスには方

向性があり真の介入効果を過小評価させる方向に働くバイアスもあれば過大評価させる

方向に働くバイアスもある通常ある研究の結果がバイアスの影響を潜在的にどの程度受

けているのかを把握することは困難であるそのためバイアスのリスク(risk of bias)として検

討したことを適切に記載し考慮したことを明示することが大切である

コクランレビューの「risk of bias」はGRADEの「研究の限界」に相当するもので以下のような

基本的なドメインがある

割付の順序 (random sequence generation)

割付の隠蔽 (allocation concealment)

参加者と研究者の盲検化 (blinding of participants and personnel )

アウトカム評価者の盲検化 (blinding of data analyst)

不完全なアウトカム (incomplete outcome data)

選択的な報告 (selective reporting)

その他のバイアス(stopped early for benefit etc)

sequence generation allocation concealmentselective outcome reportingのドメインについて

はRevMan旧版では参加者研究者アウトカム評価者の盲検化に関わる複数のバイアス

を全て1つの領域で評価していた(ただし異なるアウトカムについてはアウトカム別にバイ

アスを評価していたかもしれない)改訂版ツール(RevMan 51)では参加者研究者アウト

カム評価者の盲検化にかかわるバイアスはアウトカム評価者の盲検化にかかわるバイアスと

は別に評価するようになっている(コクランハンドブック 851 overviewの訳文も参照のこと)

各研究のrisk of bias評価結果は「低 low」「不明 unclear」「高 high」の3つに分類される

risk of bias summaryやrisk of biasグラフではLow は緑でUnclear は黄色High は赤で表

示される

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 18: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1865

参考 コクランハンドブック 851 overview

「順番の生成」「割付けの隠蔽」「選択的アウトカム報告」のドメインについてはいずれもこ

のRoBツールでそれぞれの研究に 1つのエントリとして使用することにより対応すべきである

「参加者および研究者の盲検化」「アウトカム評価の盲検化」ならびに「不完全なアウトカム

データ」については異なるアウトカム (あるいは異なる時点における同一のアウトカム) は個

別の評価を必要とすることから複数のエントリを使用する場合があるレビュー著者はアウト

カムをグループ化することによりエントリ数を制限する努力をすべきであるたとえば「アウト

カム評価の盲検化」 を評価する場合は ldquo主観的rdquo または ldquo客観的rdquo アウトカムにグループ

化するあるいは 「不完全なアウトカムデータ」 の場合は ldquo6 ヶ月目の患者報告アウトカムrdquo

または ldquo12 ヶ月目の患者報告アウトカムrdquo にグループ化するこれと同じアウトカムのグルー

プ化をレビューに含まれる各研究に適用する最後のドメイン (「その他のバイアス」) につ

いては複数の研究全体に関する 1つのエントリとして評価するとよい (RevManの初期状態)

ただし特定の 「その他の risk of bias」 を評価する際にはあらかじめ指定されたエントリを使

用することが強く推奨されるこのような著者指定のエントリは研究全体に対するエントリの

場合または各研究内の個々の (またはグループ化された) アウトカムに対するエントリの場

合がある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 19: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

1965

Item -10 SRコクランの色テーブル(risk of bias summary)を作成する

Blog 20120717

Risk of Bias テーブルはレビュアによる内的妥当性の評価 (あるいは研究においてリサー

チクエスチョンに対する回答が適格にまたはバイアスなく提供されているかの評価) を支援

するためのものでツールを使って作成されるツールに入力される情報および Risk of

Bias テーブルに示される情報はSoF テーブルにおいて各アウトカムのエビデンスの質を検

討する際に重要となってくる GRADEpro において GRADE を使用してエビデンスの質を

評価する場合著者はエビデンスの質を左右する 5 つの要因について検討するそのうちの

1 つの要因としてあげられるのが「デザインの限界」である「デザインの限界」での妥当性へ

の脅威はRisk of Bias ツールで評価されるものと同様であるそのためレビュアは Risk of

Bias テーブルの作成時に下した判断に基づきGRADEpro における「デザインの限界」を理

由にある特定のアウトカムのエビデンスの質の評価を下げるべきかどうかについて判断す

る必要があるGRADEpro の FAQから

個々の研究の RoB評価を項目別に図示したものをRisk of bias summary と呼び縦横の表

示を変えてRoB 項目別に複数の研究の評価をで図示したものをRisk of bias graph と呼

RevManを使うことで各研究の RoB tableデータからアウトカム別の risk of bias summary と

risk of bias graph が作成できる(アウトカムごとに RoBの入力を再度行い作りなおす必要が

ある)

例 非経口的抗凝固療法は癌患者の生存延長のために使用すべきか

あるアウトカムについて個々の研究の Risk of bias を評価したテーブルから risk of bias summary や risk of

bias graph を表示する流れはエクセルをつかうと簡単に理解できる

(参照 risk_of_bias_excelxls)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 20: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2065

アウトカム-1(全死亡率) 9件の RCT アウトカム-5(QOL) 1件の RCT

(本解説においてはAkl EA 論文の RoB 評価項目を改変した)

参考

1研究全体でのコクラン risk of biasの考え方GRADE 教科書 p50

2スライド 39~45

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 21: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2165

Item -11 SR一つの研究の(within study)そのアウトカムに関する RoB の確認

Blog 20120718

主要基準の何がリスクが高いと判定されたらという画一的なものでない

ldquo論文そのものrdquoに対して「この論文はlow risk of bias」などという評価するの

でなくあくまでも「この論文はrdquoこのアウトカムについてrdquolow risk of bias 研

究といえる」と評価するだけである

例 単一研究の RoB summary(アウトカム死亡率)

risk_of_bias_excelxls を使用

(本解説においてはAkl EA 論文の評価項目を改変した)

目次へ

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 22: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2265

Item -12 SRコクランの色グラフ(横棒で記載の方 risk of bias graph)を作成する

そのアウトカムに関する研究全般の RoB

Blog 20120718

risk of bias graph は risk of bias summary 図の縦横の表示を変えただけである

すなわち評価項目別に全研究の RoBを集計したものがrisk of bias graph である

アウトカムごとに個別研究の RoBを評価しその後複数の研究にわたる RoB を判定する

この複数の研究にわたる RoBがGRADEのlimitations(あるいはrisk of bias)と同じもので

ありつまりグレードダウンの 5 要因の 1つである

Review Manager (RevMan) のソフトを利用する事が望まれるがエクセルを使っても解析可能

である(下図ではrisk_of_bias_excelxls使用)

シナリオ アウトカム(全死亡率)についての risk of bias graph

(本解説においてはAkl EA 論文の評価項目を改変したスライド 44 参照)

ldquo割付の隠蔽ldquoの評価は研究全体でみると89(89)が緑色の low risk of bias である

ldquoアウトカム評価者の盲検化ldquoは全ての研究で(99)赤色の high risk of biasである

全死亡の評価は生死という明確なアウトカム評価であることから評価者の盲検化はそれほど

重要なことではない(エビデンスの質を下げることはない)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 23: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2365

Item -13 SRアウトカムごとに9~12を繰り返し複数の研究全般にわたる RoB を評

価する

Blog 20120718

アウトカムごとに複数の研究にわたって(across studies)RoBを評価する

アウトカムによって各研究の RoB 評価が異なることがある

主要基準の何がリスクが高いと判定されたらという画一的なものでない

評価の重要ポイントは脚注に記載すること

GRADE 教科書 p51 にRCT における risk of bias の評価基準を記載してあるが

GRADE working groupは複数の研究にわたるRoB評価のために以下のような指針を発表し

ている(スライド 42)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 24: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2465

Item -14 メタ解析をする(メタ解析が不可能な場合もある) Blog 20120724

メタアナリシス(とは過去に行われた複数の研究結果を定量的に統合し分析する統計学的

な解析の方法の1つであるが複数の臨床試験データを単純に平均したものではなくデー

タのばらつきの度合いで重み付けしてから統合したものである統合の統計学的手法はデ

ータの種類(2 値連続)統合する統計値(オッズ比相対リスクリスク比相関係数加重

平均差など)統合する統計手法(固定効果モデルランダム効果モデル)などによって異な

1つの研究ではなく複数の研究を統合したものを総体エビデンス(body of evidence)と呼び

GRADE システムにおいては総体エビデンスの質を評価するのが基本であるしかし利用で

きる最良のエビデンスが単一研究の場合もありえる

コクラン共同計画では選択論文からのデータはRevManという統計解析ツールを用いてメ

タアナリシスを行っているRevManでは種々の異なった解析方法による結果の表示や出

版バイアスのチェックとしてのファンネルプロットも表示できるさらにRevManではGRADEpro

とのデータ交換も可能である

RevMan使用 アウトカム 全死亡率(12ヶ月)

参考

1 システマティックレビューとメタアナリシス GRADE教科書 p37~39

2 メタアナリシス httphomepage3niftycomaiharameta_analysis3html

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 25: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2565

附 メタアナリシスのためのソフトウエア

ソフトウエア URL 入手

Review Manager (RevMan) Cochrane Collaboration 無料

Stata STATA 有料

SAS SAS 有料

Comprehensive

Meta-analysis

Comprehensive Meta-analysis 有料

MetaWin MetaWin 有料

Meta-DiSc MetaDisc 無料

MetaAnalyst MetaAnalyst (β) 無料

DistilerSR DistilerSR 有料

EPPI-Reviewer EPPI centre 有料

JBI SUMARI Evidence-Based Practice Network 有料

MIX MIX 20 有料

WINBUGS BUGS project 有料

メタアナリシス計算表 Microsoft Excel(森實敏夫) 無料

R (S-PLUS) メタアナリシス入門(丹後敏郎) 有料

Meta-analysis Microsoft Excel (BMC Research Notes) 無料

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 26: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2665

Item -15 エビデンスの質研究デザイン Blog 20120725

GRADEにおいては研究ごとにエビデンスを評価するのではなく複数の研究のシステマテ

ィックレビューによりアウトカムを主体として横断的に収集した総体エビデンス(body of

evidence)の質をアウトカムごとに評価する

エビデンスの質とは

システマティックレビューにおけるエビデンスの質とは「ある効果推定値(estimate of effect)

が正しいという確信(confidence)がどの程度か」と定義されるシステマティックレビューでは

推奨を作成しないため各アウトカムについてエビデンスの質のグレーディングを行う

(GRADEシステムによるエビデンスの質評価と定義参照)

一方診療ガイドラインにおけるエビデンスの質は「その効果推定値に対する確信がある

特定の推奨を支持する上でどの程度十分か」を示すGRADE ではldquo 患者にとって重大な

各アウトカムrdquo に関するエビデンスの質を個別に評価しそれらを全体として見渡してアウト

カム全般に関する全体的なエビデンスの質(overall quality of evidence) を1つだけ決定する

エビデンスの質と研究デザイン

エビデンスの質の評価では最初に研究デザインの評価をするランダム化比較試験(RCT)

のエビデンスの質は「高」RCT以外の観察研究のエビデンスの質は「低」とする(表14‒1)

シナリオの場合コクランレビューに組み込まれた9件の試験の研究デザインは

ランダム化比較試験でありエビデンスの質は「高」である

(スライド 33)

注 (GRADE教科書 p42)

1観察研究の質を評価するとき前向き研究と後ろ向き研究の区別をすることはあまり意味がない

2専門家の意見はGRADEではエビデンスの分類には含まない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 27: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2765

附 GRADEシステムによるエビデンスの質評価と定義

5つのグレードダウン3つのグレードアップ要因があるが各評価を定量的に行ってはいけ

ない-1と-1が2つ存在したから必ず2段階下げるということでない

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 28: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2865

Item -16 エビデンスの質(グレードダウンの5要因) limitations(risk of bias)

Blog 20120726

総体エビデンス(body of evidence)についてグレードダウンの5要因の1つであるrisk of biasを

評価する際はrdquoコクランrisk of bias評価をGRADE の「研究の限界(limitations)」評価へ直接

的に反映させるrdquo

両者の対応は「low risk of bias」は「no limitations(限界なし)」「unclear risk of bias(不明)」

は「no serious(限界なし)」または「serious(深刻)な限界あり」「high risk of bias」は「serious

(深刻)な限界」または「very serious(非常に深刻)な限界」に相当する

GRADE 教科書 p51

注 個々の研究のコクラン risk of biasテーブルに基づき複数の研究にわたる全体的なエビデ

ンスの質(overall quality of evidence across studies) を評価するための指針 (GRADE working

group JCE) rarr スライド42

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious risk of bias (スライド 44)

大出血 no serious risk of bias

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 29: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

2965

Item -17 エビデンスの質(グレードダウンの 5 要因) inconsistency

Blog 20120727

非一貫性あるいは不一致性(inconsistency)とは研究によって治療効果の推定値が大きく

異なる(すなわち結果に異質性(heterogeneity)またはばらつきが存在する)ことを指し根

本的な治療効果に真の差異が存在することを意味する異質性があるにも関わらず研究者

が妥当な説明ができない場合その程度に応じてエビデンスの質を 1〜2段階下げる

(GRADE 教科書 p52)

効果の方向は非一貫性の基準ではない

GRADE handbook 「説明のつかない結果の異質性または非一貫性について」を参照

httphomepage3niftycomaiharaGRADEproHelpInconsistent20resultshtm

httpwwwgrade-jpncomgradeguidelineinconsistencyhtml

inconsistency と重要性とは別問題ということに注意すべきであるガイドラインパネルはinconsistency

が大きいとしてもそれを重要なものではないと判定する場合もある(参照ー下図2)

(本図はJCE 2012論文にて発表されているものと同じである)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 30: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3065

シナリオにおける2つのアウトカムに関する評価

全死亡率 serious inconsistency (-1) (スライド 49)

大出血 no serious inconsistency

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 31: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3165

Item -18 エビデンスの質(グレードダウンの 5 要因) indirectness

Blog 20120730

エビデンスの非直接性(indirectness)は従来の「外的妥当性」(external validity)(一般化可

能性generalizability と同義)と同様のものであるIndirectnessには2つのタイプがある

非直接性には2つのタイプがある

1 非直接的な比較() - 介入 A と B の比較ができないためにA を C と比較しB を C と比較したと

きがこれに当てはまるこのような研究ではA 対 B の効果の大きさを非直接的に比較できるしか

しこのようなエビデンスはA と B の直接的比較が提供する質よりも低いものである

2 非直接的な集団介入比較またはアウトカム - ガイドラインパネルまたはシステマティックレ

ビューの著者が取り組む疑問が集団介入比較またはアウトカムに関する入手可能なエビデン

スと違っている

() 非直接的な比較 indirect comparison

例 ネットワークメタアナリシス(NMA)

個々の試験に発表されている効果推定値とその信頼区間を利用して論文中で直接比較し

ていない治療群間の差を推定する方法(mixed treatment comparison multiple treatments

meta-analysisともいう)通常はNMAのエビデンスの質は indirectnessのために1~2段階

グレードダウンになる

注意

Surrogate outcomes の全てがエビデンスの質低下ではない2

Rarely surrogates are sufficiently well established that review authors or guideline panelists

should choose not to rate down quality of evidence for indirectness In our view this should be

restricted to situations in which within the same class of drug (eg beta-blockers calcium

antagonists diuretics bisphosphonates) changes in the surrogate have repeatedly proved

closely related to changes in the patient-important outcome in the context of RCTs

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious indirectness

大出血 no serious indirectness

2 GRADE guidelines 8 Rating the quality of evidencemdashindirectness Journal of Clinical Epidemiology Volume 64 Issue 12 Pages 1303-1310 December 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 32: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3265

附 indirect comparison

介入 A と介入 B の効果を比較したいがA と Bを直接比較した RCT がない場合A 対 C研

究と B 対 C 研究を比較解析するものがindirect comparison である

この場合A と Bを直接比較するのは(naive method)は統計的に問題がありadjusted

indirect comparison を使わないといけないadjusted indirect comparison の結果はhead to

head RCT とよく一致するという報告もあるadjusted indirect comparison はメタアナリシスの

サブグループ解析にも適用すべきである

Adjusted indirect method文献において使われる他の用語

bullCross-trial comparison

bullConnected comparative experiment

bullNetwork meta-analysis

bullMixed comparison

bullVirtual comparison

bullMultiple treatments meta-analysis

注意

bullWhen available results from direct and indirect comparisons usually agree but they may not

bullEssential to consider how similar (sets of ) trials are study and patient characteristics

bullIndirect and direct data should always be considered separately and not automatically pooled

bullInterpretation should always be cautions in view of the observational nature of the data

Altman DG The issue of indirect comparisons in meta-analysis 京都シンポジウム(2005)を改変

indirect comparison についての GRADEアプローチの基本は以下である

1直接エビデンスをグレードする

2各 loopの間接エビデンスをグレードする

3最も質の高いエビデンス(直接 andor 間接loop)を使って点推定値を計算する

4推定値をグレードする

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 33: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3365

Item -19 エビデンスの質(グレードダウンの 5 要因) imprecision

Blog 20120802

データの不精確さ(imprecision)とはデータのばらつきが大きい場合や対象患者数(サンプ

ルサイズ)やイベント数が少ない場合に信頼区間の幅が広いことを指す

GRADE ではシステマティックレビューのエビデンスの質の定義と診療ガイドラインのエビ

デンスの質の定義を区別しているため不精確さを理由にエビデンスの質評価のグレードを

下げる基準もシステマティックレビューと診療ガイドラインでは異なる

参考

1 データの不精確さ (imprecision) GRADE 教科書 p56-59

2 スライド 57 60

シナリオにおける2つのアウトカムに関する評価

全死亡率 no serious imprecision()

大出血 no serious imprecision

()実際のコクランレビューにおいてはInconsistency と imprecision の判定で(2 段階ではなく)1 段階のグレー

ドダウンとしている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 34: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3465

Item -20 エビデンスの質(グレードダウンの 5 要因) publication bias

Blog 20120803

出版バイアスは研究が選択により偏って出版されることが原因で本来のプラス効果またはマ

イナス効果が系統的に過小または過大に評価されることをいう

出版バイアスに対処するための一般的な4つの方法が報告されている

(医学文献ユーザーズガイド 根拠に基づく診療のマニュアル)

注厳密な意味ではldquo報告バイアス(reporting bias)rdquo特に選択的アウトカム報告バイアスはGRADE

の limitations(risk of bias)に含まれる

シナリオにおける2つのアウトカムに関する評価

全死亡率 undetected

大出血 undetected

(ファンネルプロットRevMan を使って作成相原)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 35: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3565

Item -21 エビデンスの質(グレードアップの 3 要因) 効果の程度が大きい

Blog 20120806

関連性(association)を示す効果の大きさの指標としてGRADEでは原則として相対リスク

(relative risk RR)を用いる

(GRADE 教科書 p63)

参考 大きい効果の程度について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpLarge20or20very20large20effect

htm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 大きな効果はない (RR 093)

大出血 大きな効果はない (RR 13)

1グレードアップ要因はグレードダウンの要因と切り離して評価するものではないすなわち

limitations(RoB)が深刻なものあるいは imprecisionが非常に深刻なものでエビデンスのレベル

が下がったものをrdquo効果の程度が大きいrdquoとしてグレードを上げるようなことはしない

2「関連性(association)がある」ことと「因果関係(causality または causation)がある」ことは異なる

ことに注意する必要がある

関連性の評価において従来利用されてきたBradford Hillrsquos criteriaはGRADEシステムによっ

て説明可能であると発表されている(スライド 67)

The GRADE approach and Bradford Hills criteria for causation

JECH 201165392-395 doi101136jech2010119933

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 36: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3665

Item -22 エビデンスの質(グレードアップ3要因) 交絡因子

Blog 20120807

なんらかの理由で評価を下げられていない観察研究において交絡因子(confounding factor

または confounder)があると考えられる場合に「真の効果はあるのにすべての交絡因子が

報告された効果を減少させる方向に働く」あるいは「真の効果はないのにすべての交絡因

子が効果を増大させる方向に働く」ことがある

真の効果が存在するのに考えられうるすべての交絡因子が同じ方向に働くことで見かけ上

の介入効果が真の効果よりも弱められていると考えられる場合エビデンスの質を上げる

たとえばもし対照群よりも治療群により重病の患者が多いにもかかわらず治療群でより死

亡率が減少したということであればそれは実際の新規治療の効果が得られた結果以上であ

ることを示唆しているこのため他に妥当性についての問題がない場合はエビデンスの質

を1段階上げる

参考 全てのありそうな交絡の影響について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpPlausible20biaseshtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 37: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3765

Item -23 エビデンスの質(グレードアップ3要因) 用量反応勾配

Blog 20120808

複数の観察研究から得られた結果において用量反応勾配(dose-response gradient)がある

場合はエビデンスの質を1段階上げるただし評価を上げることができるのは研究の妥当

性に問題がなく評価が下げられていない観察研究に限られる

たとえば1日の喫煙量の増加と肺癌による死亡リスクの増加という関連性は喫煙が肺癌を

引き起こすというエビデンスの質を上げる理由となる

またワルファリンによる抗凝固療法を受けている患者において抗凝固の程度の指標である

INR(国際標準比)の高値と出血リスク増加との間に用量反応勾配があるという観察は治療

域を超えた抗凝固レベルが出血リスクを増加させることの確信を高めるものである

参考 用量反応勾配について(GRADE ハンドブック)

httphomepage3niftycomaiharaGRADEproHelpDose-response20gradienthtm

評価例 シナリオにおける2つのアウトカムに関する評価

全死亡率 評価なし

大出血 評価なし

理論的にはランダム化比較試験の結果についてグレードアップすることは可能であ

るが説得力のある適切な報告例はなく通常はグレードアップの3要因は観察研究を

対象としたものである(JCE 9 Rating up the quality of evidence)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 38: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3865

Item -24 各アウトカムについて総体エビデンスの質(body of evidence)を判定する

Blog 20120809

GRADEにおいては個々の研究のエビデンスを評価するのではなく複数の研究のシステマ

ティックレビューを使うすなわちアウトカムを主体として研究横断的に収集した総体エビデ

ンス(body of evidence)の質をアウトカムごとに評価する

グレードダウン要因(例imprecision と risk of bias)について-1と-1が2つ存在したから

必ず2段階下げるということでなく検討の結果1段階のみ下げるとすることもある(GRADEpro

ではエビデンステーブルの作成があるのでより深刻な方のみを-1として調整する)

これらの判断のポイントを脚注()に記述することが重要である

() httpwwwgrade-jpncomanticoag_cancer-EPpdf

(本エビデンスプロファイルは2010 年3月に作成したものであるCQ は本シナリオのものと同

じであるが利用しているレビューは改訂前の 2008 年発表の CDSR であるその後の RCT 研究の追

加により改訂 CDSR においてはエビデンスの質が低下している)

シナリオにおける5つのアウトカムに関する QoE 評価

(スライド 78)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 39: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

3965

Item -25 エビデンスプロファイル作成SoF 表作成

Blog 20120810

GRADEエビデンステーブルにはエビデンスプロファイルSoF (Summary of findings)テーブ

ル レビュー概要テーブルがありそのうち前2者が代表的であるエビデンステーブルに

は最も質の高いエビデンスを提示すべきである

[1] GRADE エビデンスプロファイルは各アウトカムに関するエビデンスの質評価の詳細や

研究の結果要約とともにその判断理由などを脚注に記載した表である

シナリオのエビデンスプロファイル(スライド 71 参照)

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

[2] SoF テーブルは完全なエビデンスプロファイルと同じ情報からエビデンスの質評価の詳

細を省略しコメント欄を追加したものである標準的なSoFテーブルには7項目(アウトカム

対照群リスクあるいは想定リスク介入群リスクあるいは対応リスク効果の相対的な大きさ参

加者数と研究件数アウトカムごとの全体的なエビデンスの質コメント 列順は左から重要

度を反映し重要な列から表示)が含まれるよう推奨されているがエビデンスプロファイルと

同様に表示様式については画一的なものはない

(GRADE教科書 第2章 GRADEシステムのエビデンステーブルを参照)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 40: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4065

シナリオの SoFテーブル (スライド 74参照)

httphomepage3niftycomaiharasof_heparin_aihara_20120426html

エビデンスプロファイルや SoF テーブル内のデータ解釈についてはGRADE 教科書の第 2

章あるいは「GRADEシステムの使い方」(ppt)のスライド 76 77 などを参照のこと

SoFに関する FAQ

Q-1 SoF テーブル(SoF table)を理解する必要があるのは誰か

Q-2 レビューの SoF テーブルの作成責任は誰にあるのか

Q-3 SoF テーブルの作成後は誰にチェックをしてもらえるのか

Q-4 レビューの SoF テーブルの作成に向けた構想はどのタイミングで考え始めるのか

Q-5 SoF テーブルに 7 件以上のアウトカムを含めたい場合はどうしたらいいのか

Q-6 SoF テーブルはどのようにして作成するのか

Q-7 GRADEpro を使って SoF テーブルを作成する場合は何をしなければならないのか

Q-8 Risk of Bias テーブルと SoF テーブルとの間にはなんらかの関連性があるか

Q-9 エビデンスの評価システムが多数存在する中でなぜ GRADE を使用するべきなのか

Q-10 システマティックレビューにおいて GRADE アプローチを使ってエビデンスの質を評価する際に特

別なスキルが必要か

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 41: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4165

スライド 76

スライド 77

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 42: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4265

Item -26 医療資源に関する資料作成

Blog 20120816

GRADE ハンドブック(httphomepage3niftycomaiharaGRADEproHelphtml)を参照

資源の利用(コスト)を推奨に盛り込むときは特に次の点を検討する

コストと他のアウトカムの違いは何か

どの立場を取るのか

資源の影響としてどの影響を盛り込むのか

エビデンスの質をどう判断するのか

これらの影響をどのように提示するのか

形式的経済学モデルにはどのような潜在的有効性があるか

推奨を作成する上で資源の利用をどう検討するのか

ガイドラインパネルは資源の利用を検討する場合コストについて検討する前にまず他の

アウトカムに関するエビデンスの質を決定し利益と不利益のバランスを検討する必要がある

資源の利用の重要度に関する意思決定はこの最初のステップを基に行うものであるたとえ

ば健康への正味の利益[net health benefits]に関するエビデンスが欠如している状況では

資源の影響について検討しても意味がないまた介入の利益が不利益を大幅に上回る場

合は資源の利用を検討する意味は低くなる通常資源の利用が重要となるのは利益と

不利益が拮抗している場合である

() 資源利用(コスト)に関するエビデンスサマリー

バランスシート(エビデンスプロファイル)は正味の利益が増分コストに見合うかどうか(net benefits are

worth the incremental costs)の判断ができるものでなければならない

2012年8月JCEシリーズ Grade guidelines 10 Considering resource use and rating the quality

of economic evidence において資源利用に関する GRADE 評価の考え方やバランスシートの長所短

所資源利用のエビデンスプロファイル SoF などが発表された

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 43: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4365

GRADEを使って資源利用を検討する際のキーポイント

エビデンスプロファイル例

(JCE 論文 10 より)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 44: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4465

Item -27 アウトカムの相対的な重要度の再評価

Blog 20120817

どのアウトカムが重要なのかについてはシステマティックレビューやガイドライン作成に着

手する前の研究計画書作成の段階で決定する必要があるその一方でガイドラインパネ

ルは研究計画書の作成後または分析の実施後になってアウトカムの重要度(例深刻な

有害作用)が明らかになる可能性についても留意しこのようなアウトカムをエビデンステーブ

ルに含めるべく適切な措置を講じるべきである

GRADE JCE論文()においてアウトカムの相対的重要度を考慮するための3ステップが発

表されている論文中の表1の内容がGRADE教科書の表12-2(下記)である

()GRADE guidelines 2 Framing the question and deciding on important outcomes

Journal of Clinical Epidemiology Volume 64 Issue 4 Pages 395-400 April 2011

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 45: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4565

Item -28 その CQ の全体(overall)のエビデンスの質の判定

Blog 20120820

overall quality of evidence across outcomes

推奨度を評価する際は重大なアウトカム全般に関する全体的なエビデンスの質を判断する

必要があるGRADEでは全体的なエビデンスの質を「重大なアウトカムに関する複数のエ

ビデンスから最終的にldquo1つのエビデンスの質rdquo として判断したもの」と定義している

(GRADE教科書 p101)

アウトカム全般に関する全体的なエビデンスの質を判定する際の基準を表321‒1に示す実

際には複数の重大なアウトカムでエビデンスの質や効果の方向が異なる場合がありその

場合は特に慎重にエビデンスの質を判断する

このルールはGRADEの特徴のひとつでMinds基準とは正反対のものです

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 46: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4665

例 各アウトカムが異なる方向(スライド91)

例 全てのアウトカムが同じ方向(スライド93)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 47: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4765

Item -29 (推奨決定の4要因) 全体的なエビデンスの質

Blog 20120823

一般的に質の高いエビデンスは強い推奨につながる可能性が高いが推奨度はエビデン

スの質だけで決定するものではなく全体的なエビデンスの質利益不利益バランス価値

観や好みコスト医療資源利用の4要因を考慮して判定するGRADEの推奨度の分類は

「強い」「弱い」の2種類であるが推奨の方向として「実施する」「実施しない」の2種類が

あるため結果として推奨の表現は4通りとなる推奨度は実際には連続的性質を有する概念

であるがGRADEではあえて「強い」「弱い」の2値として表示する(図31)

利益と害のバランスをもとに治療を判断する際に害に関するエビデンスの質が低い場合もあ

る(例観察研究や症例集積研究においてサンプルサイズやイベント数が少ないとき)その

ような場合GRADEではある推奨の決定に不可欠なすべての重大なアウトカムのうちエビ

デンスの質が最も低いものをもって全体的なエビデンスの質と判定する

シナリオの場合3(スライド 95)

3 閾値の設定を含めて全て仮想の評価である

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 48: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4865

附) エビデンスがない場合に推奨は作成できないか

ガイドラインパネルの決定方針で異なるだろう

実際の報告例としては以下のようなGRADEガイドラインがある

(Canadian Task Force on Preventive Health Care2011)

httpcanadiantaskforcecarecommendations2011_01_enghtml

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 49: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

4965

Item -30 推奨決定(4要因) 望ましい効果と望ましくない効果のバランス

Blog 20120824

望ましい効果(利益)と望ましくない効果(害負担コストなど)のバランスで望ましい効果が

望ましくない効果を明らかに上回るまたは明らかに下回る場合には「強い推奨」と判定する

一方両者が拮抗している場合や得失(トレードオフ)の関係の場合やそれぞれの効果ある

いは両者のバランスのいずれかに不確実性がある場合は「弱い推奨」の評価となる

シナリオ スライド 100

NNTとNNHを計算してもバランスの評価は可能であるがGRADEproを使って絶対効果を表

示できるGRADEproによるエビデンスプロファイル例を参照のこと

httphomepage3niftycomaiharaEP_heparin_aihara_20120426html

httphomepage3niftycomaiharaEP_heparin_accp_aihara_20120426html

スライド 97

本例では弱い(条件付き)推奨と評価した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 50: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5065

Item -31 推奨決定(4要因) 価値観と好み

Blog 20120829

価値観や好みの不確実性または患者間におけるばらつきが存在する場合は推奨の強さ

が低くなる

どのような管理戦略にも必ず長所と短所があり患者は常にそれらの間の得失を評価しない

といけないそのためガイドラインパネルがある特定の利益リスク不便さに対してどのよう

な価値を置くのかによって推奨や推奨の強さが決まる

各アウトカムに対する価値観や好みの問題について調べた研究がごく限られているため価

値観や好みに関しては常に大きな不確実性があるとする意見もあるかもしれない一方価

値観や好みに関する系統的な研究もありガイドラインパネルメンバーも患者との関わりを通

して新たな知見を得てきた(GRADEハンドブック価値観や好みにおける確信について)

シナリオ スライド 106

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 51: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5165

Item -32 推奨決定(4要因) 資源の利用(コスト)

Blog 20120830

一般に医療に関するコストや資源の利用に関しては形式的経済学モデル(formal

economic model)を用いて1単位あたりの便益(利益)を得るために必要なコストとして表現する

(GRADEハンドブック 形式的な経済モデルの有用性について)

どのようなコスト算出にどのモデルを用いるかの例をあげるとたとえば脳梗塞を1件予防する

ためにかかるコストを算出するには費用効果分析(cost-effective analysis)を非金銭的価値と

しての質調整生存年(Quality-Adjusted Life Years QALY)あたりのコストを算出するためには

費用効用分析(cost-utility analysis)を金銭的価値で示される単位あたりの利益を得るため

に必要なコストを算出するためには費用便益分析(cost-benefit analysis)を用いる

このような経済モデルを用いた研究結果は意思決定の際の参考にはなるものの残念ながら

その多くが限界やバイアスを含む可能性がありモデルの前提とされた特定の状況に限定さ

れた結果であることが多いそのためGRADEでは通常のアウトカムについてのエビデンス

プロファイルには費用効果分析または費用効用分析を含めないことを推奨している4

(GRADE教科書 p107)

シナリオ スライド 108

4 経済評価(economic evaluation) には費用帰結研究(cost-consequences study)費用最小化研究

(cost-minimization study)費用効果分析(cost-effectiveness analysis)費用効用分析(cost-utility analysis)費

用便益分析(cost-benefit analysis) などがある

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 52: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5265

Item -33 推奨度評価の合意形成(必要なら GRADEgrid)

Blog 20120831

GRADEで採用するシステムはRAND法5に準じたもので重要重大なアウトカムの選出やエ

ビデンスの質評価にもこの統計手法の使用が可能である

参考 GRADE教科書 (p128-131)

付録41 「パネルがGRADEを適用する際のコツ」

付録42 「推奨度評価の合意形成(GRADE grid)」

シナリオ スライド 115(ここではRANDUCLA法を利用)

5 Murphy MK Black NA Lamping DL McKee CM Sanderson CFB Askham J Marteau T

Consensus development methods and their use in clinical guideline development Health Technol

Assess 1998 2 i-iv 1‒88 PMID 9561895

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 53: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5365

シナリオ スライド 113~ 117

GRADEproを使った推奨の決定と GRADEgridの仮想データ例

httpwwwgrade-jpncomgrade_grid_20120420html

メンバーの70(1420)がldquo介入の実施rdquoを支持し推奨の強さ weakが50(1020)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 54: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5465

Item -34 診療ガイドライン作成

Blog 20120904

ガイドラインパネルは推奨の草案がエビデンスプロファイルのデータに沿っていることを確認

し様式の統一性推奨表現の一貫性を確保する

例1 スライド 111

例2 httpwwwcadthcamediapdfcompus_IA_OT_rec_reportpdf

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 55: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5565

各推奨事項の一般形式として決まったものはないが参考としてACCPより発表されている様

式に関する記述を下表に示す

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

ACCPガイドライン 推奨事項の様式および形式

推奨の最初の部分には適切な患者集団を示す制約要因があればそれも記載する

推奨ではたとえばサービス検査治療または医療措置を提案する

推奨の文言に用いる表現としては事実について述べるような表現ではなくサージ巣に関する確定

的な提案を行うような表現を使うこと一覧表または表の形式は使用しないこと事実の供述および

その根拠については推奨の直前の本文に記載する利益が明らかにリスクおよび負担を上回る場

合は「推奨する (recommend)」などといった強い表現を使用する利益と害のバランスがそれほど

明確出ない場合は「提案する (suggest)」「考慮する (consider)」などといった表現を使用し適切

な状況および患者集団に関する適切な説明を添えること

推奨には引用を含めない引用は推奨の直前に記載される考察の適切な場所に含める

推奨のグレーディングは推奨の最後に提示される

グレーディングのためのシステムはACCPのHSP評価システム(GRADEシステム)に従う

推奨は太字で記載する

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 56: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5665

ガイドライン執筆パネルの最終会議

The Final EBG Writing Panel Conference

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の The Final EBG Writing

Panel Conference 項を翻訳したものである EBG evidence-based clinical practice guideline

---------------

エビデンステーブルが完成し執筆パネルによる章の初期ドラフトの執筆レビュー修正が

完了すると執筆パネルの最終対面会議が開催されパネルによる最終版の受理が確定さ

れるこの会議では未解決の重要な問題および紛争を明らかにしパネルメンバー全員で

これについて議論し必要であれば投票により問題の解決が図られる

議論および検討の対象となるのは推奨事項の文言リスクと利益のバランス(パネルが決

定していない場合は)エビデンスの質の解釈推奨の合意の程度(例執筆パネルの80以

上が合意した場合6その推奨は承認される)である

ただし議長の裁量により(1)圧倒的多数(supermajority gt80)の合意が得られるまで議論

を継続する場合(2)合意不十分を理由に推奨を削除する場合(3)推奨は削除されないが

推奨の直前の考察に少数意見を含める場合がある

---------------

6 各ガイドラインパネルによって判定基準は異なる

例敗血症救命キャンペーンガイドライン(GRADE 教科書 p131)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 57: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5765

Item -35 レビューと外部評価

EBG Review

Blog 20120905

ACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のEBG Review 項を参考にし

たものである EBG evidence-based clinical practice guideline

---------------

最終会議の議事録に基づいて修正が加えられたガイドライン原稿はレビューおよび改訂の

ためにガイドラインパネルの複数のグループに提出される担当グループはプロセス一貫

性推奨および評価が適切かどうかおよび内容についてレビューする執筆グループはレ

ビュアの批判を十分に吟味した上でガイドライン原稿を評議会に提出し承認を得る

評議会のメンバーは構造化されたレビューフォームをしようすることにより徹底的なレビュ

ーの実施を確実にしているこのレビューフォームの一部はAGREE (Appraisal of Guidelines

Research and Evaluation)ツール7をベースとする(ACCPレビューフォーム 次頁)

評議会の承認が得られると原稿は出版のための審査および独立した外部組織によるレビュ

ーが実施される

ACCPのエビデンスに基づく診療ガイドラインのレビュープロセスでは徹底性と迅速性の両

立が図られなおかつ最大限の質および透明性が確保されているこのプロセスの迅速性は

エビデンスのレビューの終了と同時に推奨の適時性が減じられていくとい観点から重視され

---------------

すなわちガイドラインの公開前にはエビデンスの検索と要約の方法推奨の作成方法など

の質をなんらかの方法で評価すべきであるガイドラインの質のチェックにはいくつかの手

法が開発報告されておりWHOのGWGチェックリスト(附録C「WHO 治療ガイドライン用チェ

ックリスト」154 頁)Appraisal of Guidelines for Research amp Evaluation (AGREE)Conference

on Guideline Standardization (COGS)などがある(GRADE教科書 p126)

7 現在はAGREE-II が利用されている

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 58: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5865

ACCP ガイドラインレビューフォーム

診療ガイドラインの概要 (Overall outline)

1診療ガイドラインにおいてガイドラインの目標および具体的な臨床課題が明確に述べられて

いる

2組み入れ除外基準について明確な説明がされている

3ガイドラインの対象ユーザーについて適切な説明がある

方法論 (Methodology)

4説明のされた方法論を使って診療ガイドラインが作成されている

5文献のシステマティックレビューが実施されている

6エビデンスの質は正式なシステムを用いて評価付けされている

7エビデンスおよび利益と害の評価に基づいた推奨である

推奨の提示 (Presentation)

8推奨内容が具体的でわかりやすい

9患者集団について具体的に説明されている

10診療ガイドラインの中で主要な推奨事項が明確にわかるようになっている

11推奨事項の要約(臨床アルゴリズムを含む場合あり)が提供されている

診療への適用可能性 (Applicability)

12診療ガイドラインにおいて推奨を実行するための戦略が示されているか

13診療の中でどのようにガイドラインを活用するのかについての具体的情報が提示されている

信頼性(Accountability)

14診療ガイドラインの中で資金提供者が開示されているか

15ガイドライン作成組織の全メンバーにより利害衝突の可能性が開示され明確な説明があっ

たか

関連性およびわかりやすさ(Relevance and readability)

16臨床的に関連性があるか

17わかりやすいか

18意味がわかるか

19その考察はエビデンスから(エビデンスが存在する場合)導き出されているか

20推奨はその考察から導き出されているか

レビューのステータス(Review status)

21この資料はACCPのガイドラインとして承認を得られるか

そのままの状態で承認

提案内容を検討中のため承認を保留(追加コメントが添付のグリッドにて提供される場合あり)

承認しない(グリッドに示されるコメントを参照)

(AGREEより改変) httpjournalpublicationschestnetorgarticleaspxarticleid=1085372

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 59: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

5965

Item -36 配布および普及

Dissemination and Marketing

Blog 20120906

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のDissemination and

Marketing 項を参考にしたものであるEBG evidence-based clinical practice guideline

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

ACCPのほとんどのEBGにて「臨床リソースツール」が作成されるこのツールは診療ガイド

ラインに基づく印刷およびCD-ROMの組み合わせによる実行ツールキットである

標準コンポーネントとしては以下が含まれる

臨床医のためのクイック参考ガイド(Quick Reference Guide for Clinicians)

患者教育資料

プレゼンテーション用スライド医療分野の専門家および非専門家を対象

(さらに医師用の指示書などの追加資料を追加することも可能である)

ldquo臨床医のためのクイック参考ガイドldquoにはプリント電子フォーマットまたは携帯情報端末

(PDAなど)にダウンロード可能な形式で全ての臨床アルゴリズムおよび評価付けされた主

な推奨事項が盛り込まれている

---------------

例 スマートガイドライン8

httpwwwskillupjapancojpnews20120709asp

8スキルアップジャパンと東京慈恵会医科大学は 2012 年 7 月 9 日パソコンやモバイル端末か

ら診療ガイドラインを検索できる Web サービス「スマートガイドライン」を共同開発しサ

ービスの提供を開始した

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 60: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6065

Item -37 ガイドラインの管理

Guideline Maintenance

Blog 20120907

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)のGuideline

Maintenance 項を翻訳したものである

EBG evidence-based clinical practice guideline

HSP Health and Science Policy Committee

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

エビデンスに基づく診療ガイドライン(EBG)はHSP (and by appropriate NetWorks and in

consultation with the original EBG Executive Committee)によって毎年レビューされ推奨事

項の内容が現状に沿っているかまたは中間研究によって改訂を許可するのに十分な情報

が提供されているかどうかの判断が行われる最初にガイドラインが出版されてから1年を起

点として各ガイドラインには年に一度次に示すステータスカテゴリの一つが付与される

1 ガイドラインの内容は現状に即しており年に一度レビューする

2 有用かもしれない新たなエビデンスが存在するただしこの新たなデータは推奨内容を

変更するのに十分ではないと判断されることから修正は認可されない

3 本ガイドラインの項章の修正が認可されるような新たなエビデンスが存在するACCPは

このEBGの修正を検討中である

4 新たなエビデンスが相当量存在し現行のガイドラインが現状に即さないため廃止す

---------------

NetWorks are the ACCP interdisciplinary expertise-focused interest groups that provide college members the

opportunity for personal and professional alliances with the ACCP

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 61: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6165

Item -38 質の改善および実行

Quality Improvement and Implementation

Blog 20120910

以下はACCP Evidence-Based Guideline Development (CHEST 2007 1321015ndash1024)の Quality

Improvement and Implementation 項を参考にしたものである

ACCP Evidence-Based Guideline Development A Successful and Transparent Approach Addressing Conflict of

Interest Funding and Patient-Centered Recommendations Michael H Baumann Sandra Zelman Lewis

David Gutterman CHEST 2007 1321015ndash1024

---------------

診療ガイドラインは質が確保されその改善や実施および責任の範囲と所在が明確に記

載されているべきであるたとえばACCP では診療ガイドラインの推奨内容の改善や実施

は適切なパフォーマンス指標()にしたがって実行可能性(feasibility)有用性(usability)

科学的重要度(scientific importance)実用性(practicality)適用性(applicability) を確保し

なければならないとしている(GRADE教科書 p127)

パフォーマンス評価指標はACCP メンバーおよびその患者にとって実用的かつ適切なもの

である必要がある患者のケアを改善するためのパフォーマンス評価指標のベースとなる推

奨事項とパフォーマンス評価指標のベースとすべきでない推奨事項(多くはエビデンスの質

が低い場合が多い)も特定するこれに加え介入の一部が実行不可能または利用不可能な

場合もあるパフォーマンス評価指標は現在米国の医療分野における各種セクターにより

企画されているペイフォーパフォーマンス指標(価値に基づくパフォーマンス (value-based

performance)戦略とも呼ばれる)の中に盛り込んでもよいペイフォーパフォーマンス戦略が成

功を収め患者および医療提供者の双方にとって公正なものとなるかどうかは実行されたパ

フォーマンス評価指標の質と密接に関係する

---------------

()パフォーマンス評価指標の基準National Quality Forum

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 62: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6265

最後に

Blog 20120912

GRADEを採用する場合の注意

GRADEを使ったシステマティックレビューや診療ガイドラインを作成する場合

次の3つの注意が必要である

1GRADE を改変しないぜひとも GRADE を使用したいという熱意からGRADE を変更して

しまう組織があるGRADE プロセスの変更はエビデンスやガイドライン利用者の混乱を招くか

もしれないまたこのような変更は臨床医政策決定者患者が使用できる単一のシステム

を提供するという目的に反する以上の理由からGRADE ワーキンググループはこのよう

な変更を行わない事を推奨する(GRADE 教科書 p190 脚注参照)

2GRADE のldquo長所rdquoとldquo限界rdquoを認識する

(GRADE 教科書 p8-9GRADE の使いかたスライド122~124 参照)

3GRADE ワーキンググループが作成した「GRADE システムを利用したと言えるための基準」

を参考にする(スライド 125)

GRADEシステムを利用したと言えるための基準9

1 「エビデンスの質 quality of evidence」 はGRADE Working Group が採用する 2 つの定義(ガイドライン

またはシステマティックレビューのいずれか)により一貫して定義すべきである

2 エビデンスの質を評価するための各 GRADE 基準 (risk of bias研究の限界直接性結果の一貫性

精確さ出版バイアス効果の大きさ用量反応勾配説明のつかない交絡やバイアス 「相反バイアス

(antagonistic bias)」 の影響) を用語の違いがあるにしても明確に記述すべきである

3 各重要なアウトカムの全体的なエビデンスの質(overall quality of evidence)を4 段階 (例 「高

high」「中 moderate」「低 low」「非常に低 very low」)あるいは正当性が認められるならば3 段階

(例 「高 high」「中 moderate」「低 low(「低」 および 「非常に低」 を含む)」)にてGRADE Working

Group が採用する定義に合致した各段階の定義に基づき評価ならびに等級付けすべきである

4 エビデンスの質ならびに推奨度はエビデンスの要約 (ナラティブまたは表形式) に基づき判断すべき

である理想的にはGRADE Working Group が提唱する完全版エビデンスプロファイルを使用すべきで

あるまたエビデンスプロファイルはシステマティックレビューをベースとすべきである少なくとも評

価されたエビデンスならびにそのエビデンスの同定や評価に使用した手法を明確に記述すべきであ

る特にグレードアップやグレードダウンの理由についてはわかりやすく説明すべきである

5 推奨の強さ(strength of a recommendation)を評価するための各 GRADE 基準について明確に考慮し

(望ましい帰結と望ましくない帰結のバランスエビデンスの質価値観と好み資源の利用状況)一般

的アプローチを報告すべきである (例 コストを考慮したかどうかやその方法ならびに誰の価値観と

好みを前提としたのかなど)

6 管理選択肢に対する肯定的または否定的な推奨の強さは2 段階 (「弱い weak条件付き

conditional」「強い strong」) で示すべきであるまた各段階の定義はGRADE Working Group が採用

9 今後出版予定の JCE 論文をもとに改訂が必要となる可能性があります

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 63: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6365

する定義に合致すべきである推奨度を示すのに 「弱い条件付き」「強い」 以外の用語を使用する

場合でもその解釈や内容はGRADE Working Group の定義に合致すべきである

7 理想的には推奨度の判断をわかりやすく報告すべきである

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 64: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6465

GRADE JCEシリーズとは

Blog 20120913

2008年の BMJ シリーズ 6篇の後システマティックレビューや医療技術を評価する著者ガ

イドラインパネリストやガイドラインパネルをサポートする方法論学者などに GRADE アウトプッ

ト(エビデンスプロファイルSoFテーブルグレード付けされた推奨など)を作成するための詳

細な指針を提供することを目的とした新シリーズとして2011 年より GRADE-JCE 論文が連載

発表されています(Box 110 2012 年 9 月現在第 12編まで発表)

GRADE guidelines-an introduction to the 10th-13th articles in the series

Guyatt GH Oxman AD Schuumlnemann HJ J Clin Epidemiol 2012 Sep 8

10 2012 年 9 月の JCE 論文(J Clin Epidemiol 2012 Sep 8)発表によりGH Guyatt et al Journal

of Clinical Epidemiology 64 (2011) 380-382 の table1 を Box1 の内容に変更した(20120919)

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ

Page 65: GRADE ガイドライン作成の流れの解説 · において適切な判断を行うため,臨床家と患者を支援する目的で,系統的に作成された文書」である。

GRADE ガイドライン作成の流れ解説_aihara (2012 年 6 月~9 月)

6565

GRADE JCEシリーズ紹介論文の序文の一部を翻訳紹介し本解説集(GRADEガイドラ

イン作成の流れ解説)の最後としたい

GRADE guidelines A new series of articles in the Journal of Clinical Epidemiology (Journal of Clinical

Epidemiology 64 (2011) 380-382)

Introduction

世界各国の医療専門家研究者ガイドライン作成者により結成されるGrades of Recommendation

Assessment Development and Evaluation (GRADE) Working Group は2000年エビデンスの質を評

価し診療ガイドラインにおける推奨の強さを判断するための最適なシステムの開発に向けて一丸と

なり取り組みを開始したGRADE Working Groupは現在200名を超えるメンバーを抱え10年間の取り

組みを経た現在もなおGRADEの方法を改善し拡大するために会合しているこれまでに開催された

25回に及ぶ1~2日間の会合と数え切れないほどのメールのやり取りは診療や医療判断のための

研究エビデンスを解釈する方法を開発改善しそのエビデンスを臨床医患者政策決定者に最適

な形で提示するためのラボのような存在となっている

~(略)~

今のところこのシリーズの最終編では観察研究にみられる特別な課題に関する論文を1つグルー

ププロセスGRADEのバリエーション今後のGRADEの展開予想についてのGRADE Working Group

の見解を示す論文を2つ紹介する予定である今後の展開に関してはこのシリーズに掲載される方

法論がGRADE適用に関する不変の決定的指針として存続するものと期待すべきではなくまたそう

なることはありえないこのシリーズは数多くの方法論的問題にアプローチするためのアドバイスを提

供する中でも革新的アプローチの一例としては代理エンドポイントへの対処方法不精確さに起

因する限界に関する判断基準サブグループ解析の信頼性評価基準診断検査に関するエビデンス

の質の判断連続変数の効果の大きさに関する要約があげられる

革新的アプローチには固有の不安定性がありすべてではないにしてもその一部のアプローチにつ

いては改善が必要不可欠であるまた将来的には革新的方法のみでなくすでに確立されている概

念についても方法論的進展や改善があるだろうわれわれはシステム適用のための一連の不変の

基準を提示することはできないがGRADE の利用者にはどうか落胆しないでいただきたいこのシリ

ーズで紹介する広範かつ包括的な基礎知識は現時点または今後システマティックレビューやガイド

ライン医療技術評価にGRADEを適用する際に多いに役立つものであることに違いはないからだ本

誌編集者らは本シリーズがゆくゆくは臨床疫学の発展の1つの節目として認められることになること

を自負している

目次へ