crospell engine, a natural language processing approach - documentation

119
In Supervision of Dr. Nada Ghneim Implemented and Designed By Mohammad Shaker Ola Al-Nameh Mohammad Hasan Serhan AI Department - 2012

Upload: mohammad-shaker

Post on 14-May-2015

284 views

Category:

Software


2 download

DESCRIPTION

An engine made with multiple approaches in NLP. It covers spell checking, words and topics prediction through CyperSpell algorithm, opinion mining and image processing in NLP.

TRANSCRIPT

Page 1: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

In Supervision of

Dr. Nada Ghneim

Implemented and Designed By

Mohammad Shaker

Ola Al-Nameh

Mohammad Hasan Serhan

AI Department - 2012

Page 2: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 1

انفهزص

; ....................................................................................................................................... جذسجعس جذف .1

35 ...................................................................................................................................... جشؾؼ١س جذسجعس .2

35 ........................................................................................................................................ جغ جطظك١ف .2.1

35 .................................................................................... جغ جطظك١ف ؼحؿس ػ كس .2.1.1

35 ......................................................................................................... جؼشذ١س جغس ف جغ جطظك١ف .2.1.2

37 .................................................... ذح٦ؿ١ض٠س جطؿثس ضظك١ف ؿحي ف جغ جطظك١ف أظس .2.1.3

37 ....................................................................................................... جظذس فطقس ج٤ظس .2.1.3.1

37 ................................................................................................................................. (GNU Aspell) ظح .1

38 ..................................................................................................................... (After the Deadline) ظح .2

ح، رو١س قي جلطشجـ جالالت١س ج٤خطحء ؼشفس جطر١ؼ١س جغحش ؼحؿس جظؼ جزوحء ٠غطخذ ذشحؽ

38 .......................... .ح لغ أج جالطشص أطظفف( OpenOffice) ػ ظص كشس جػحفط ضط أ ٠ى

39 ..................................................................................................................... (Online spell check) ظح .3

:3 ............................................................................................................................. (LanguageTool) ظح .4

;3 .......................................................................................................................... جظذس غمس .2.1.3.2

;3 ....................................................................................................................................... (LingPipe) ظح .1

;3 ............................................................................................................................ (Spellcheckplus) ظح .2

;3 ............................................................................................................................................ (Ginger) ظح .3

42_Toc344391544 ............................................................................................... (Reverso) ظح .4

43 ....................................................................................... ذحؼشذ١س جطؿثس ضظك١ف ؿحي ف ج٤ظس.2.1.4

43 .......................................................................................................................................... غطح ظح .1

43 .......................................................................................................................................................... آ٠غر .2

45 .................................................................. (Buckwalter Arabic Morphological Analyzer) ظح .3

45 .................................................................................................................................................. لطشخ .4

46 ............................................................................................................................ جظشف جخ١ ذشحؽ .5

46 .............................................................................................................................................. ضحشف١ ىطرس .6

47 .................................................................................................................................................. جشد٠ف .7

47 .................................................................................................................................................. غىن .8

48 .......................................................................................................................................................... شىحي .9

Page 3: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 2

49 .............................................................................................................................................. جؼح .10

;Language Identification ............................................................................. 4 جغس ػ جطؼشف أظس .2.2

;4 ...................................................................................................................................................... مذس .2.2.1

;4 ........................................................... جىطذس جظص غس ػ جطؼشف ذؿحي ج٤ظس ذؼغ .2.2.2

;TextCat ............................................................................................................................................. 4 ظح .1

;Xerox MLTT Language Identifier .......................................................................................... 4 ظح .2

;Rosette Language Identifier ...................................................................................................... 4 ظح .3

52 ............... ( Language Identification of Short Text Segments with N-gram Models) ظح .4

Techniques for Language Identification for Hybrid Arabic-English Document)ظح .5

Images) ...................................................................................................................................................... 52

Word prediction ............................................................................................................. 53 جىحش ضلغ .2.3

53 .................................................................................................................... مذس .2.3.1

53 ................................................................................... جىحش ضلغ ؿحي ف ج٤ظس ذؼغ .2.3.2

Aurora Suite 2005 ........................................................................................................................ 53 ظح .1

wordQ+speakQ)) .......................................................................................................................... 53 ظح .2

57 .................................................................................................................................................. جظح ذ١س .3

;5 .......................................................................................................................................... جؼ جطكم١ك .4

;ISRI ........................................................................................................................................ 5 خجسص١س .4.2

;5 ...................................................................................................................................................... مذس .4.2.1

;5 ............................................................................................................................................. جخجسص١س .4.2.2

Porter ...................................................................................................................................... 63 خجسص١س .4.3

63 ................................................ جؿذ٠ذز ضطر١محضح Minimum Edit Distance وط١ ضمحسخ خجسص١س .4.4

63 ...................................................................................................................................................... مذس .4.4.1

64 ............................................................................................................................................. جخجسص١س .4.4.2

65 ........................................... جفحض١ف قس ػ جطرحػذ ػ ذحالػطحد جطمحسخ قغحخ ضؿش٠ر١س .4.4.3

68 ................................................................................................. جطمحسخ مطس جإد جطش٠ك ؼشفس .4.4.4

69 ............................................................................................................................... جمحط ئشحء ػ١س .4.4.5

69 ............................................................................................................................جمحط ئشحء ػ١س .4.4.5.1

:6 ........................................................................................................................................ جمحط ذ١س .4.4.5.2

72 .......................................................................................................................... جمحط ػ جركع .4.4.5.3

Language Identification ......... 73 غحش أؿػس ح ذغس ىطذس ذظص جطر١ؼ١س جغس ػ جطؼشف .4.6

Page 4: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 3

73 ................................................................................................ جغحش ػ جطؼشف دسجعس جذف .4.6.1

73 ........................................................................................................................... جغأس ضط١ف .4.6.2

74 .............................................................................................................................. جؼ جطكم١ك .4.6.3

77 ............................................................................................................. جىحش ضلغ .4.7

77 ........................................................................................................................... جغأس ضط١ف .4.7.1

77 ....................................................................................................... جؼ جطكم١ك .4.7.2

79 ......................................................................................... جىطخ جض فىشز ضلغ .4.8

79 .................................................................................................... جغأس ضط١ف .4.8.1

79 .............................................................................................................................. جؼ جطكم١ك .4.8.2

:7 .......................................................................................................... جطشجدفحش جؼح لحط .4.9

:7 .................................................................................................... جغأس ضط١ف .4.9.1

:7 ....................................................................................................... جؼ جطكم١ك .4.9.2

;Minimum Edit Distance (MED) ............... 7 جظس٠س جغحش ؼحؿس ط١ ضمحسخ خجسص١س .4.10

;7 ...................................................................................................................................... طس٠س محسذس .4.10.1

Thresholding ...................................................................................................................... 82 جطؼط١د .4.10.2

83 ...................................................................................................................................... جمحسذس ضطر١ك .4.10.3

84 ................................................................................... جظس ضمحسخ ذسجعس جكغس جخجسص١حش .4.11

84 .................................................................................................................................................. مذس .4.11.1

85 ................................................................................................................................ جخجسص١س شىس .4.11.2

86 ............................................................................................................................... جخجسص١س ضكغ١ .4.11.3

88 .............................................................................................................. أخش شز جخجسص١س ضكغ١ .4.11.4

;8 .................................................................................................. جخجسص١حش ذ١ جطف١ز ص محسس .4.11.5

92 .............................................. جسجغ١س جش١فشجش ضطحذك – جؿضت١س جططحذمحش ئ٠ؿحد خجسص١حش .4.12

MEDNeedlemanWunschAlgo ................................................................................ 92 خجسص١س .4.12.1

SmithWaterman ........................................................................ 93 جك١س جؼظ جم١س خجسص١س .4.12.2

96 .................................................................................................. جخطالفح ضطحذمح جظسز أؾضجء وشف .4.13

97 .............................................................................................. جؿس ف جشحػش ػ جطؼشف .4.14

97 .................................................................................................................................................. ضؼش٠ف .4.14.1

97 .................................................................................................................................................... مذس .4.14.2

99 ...................................................................................................................................... ظش٠س ضؼحس٠ف .4.14.3

99 ................................................................................................................................. جغشع ضؼش٠ف .4.14.3.1

Page 5: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 4

99 ............................... (Opinion passage on a feature) ؼ١س ١ضز ذحغرس جشأ غحس ضؼش٠ف .4.14.3.2

99 ........................................................................................ (Opinion holder) جشأ قح ضؼش٠ف .4.14.3.3

:9 ....................................... (Semantic orientation of an opinion)شأ جذال جطؾ ضؼش٠ف .4.14.3.4

:ML ................................................................................................................................. 9 ج٢س ضؼ١ .4.14.3.5

:9 ..................................................................................................... ج١ضجش ػ جؼطذ ج٢سجء ضم١د .4.14.3.6

;9 .......................................................................................................................................... جشحو أ .4.14.4

;9 .................................................................................................................................... عرك ح خض .4.14.5

3: ................................................................................................................................... جكغ جطظ١ف .4.14.6

4: ................................................................................................................................................. جططر١ك .4.14.7

4: ........................................................................................................................................... جؿس ضم١١ .4.14.8

9: ........................................................................................................................................ جظح خططحش .5

CyperSpell ............................................................................................................... :9 ج٦الت جطظك١ف .5.6

2; .................................................................................................................................. جغحش ػ جطؼشف .5.7

3; .............................................................................................................................................. جىحش ضلغ .5.8

4; .................................................................................................................................... فمشز ػع ضلغ .5.9

5; ........................................................................................................................................ جطشؾس لحط .5.10

5; ............................................................................................... جؿس ف جشحػش ضؾ ػ جطؼشف .5.11

8; ............................................................................................................... جظفف خطؾ .6

8; ............................................................................................................................ جغطخذ جؾس ضطر١ك .8.8

9; ............................................................................................. جؼحؽ كشن ضطر١ك: ج٤عحع جططر١ك .8.9

:; ........................................................................................ جؼحؽ كشن ج٦ظحس ضطر١ك: ج٤عحع جططر١ك .:.8

;; .................................................................................................................... ضؼذ٠الضح MED خجسص١حش .;.8

325 ............................................................................................................ ج٦ظحس جؾحش .9

325 .................................................................................................................................... (ISRI) خجسص١س .7.6

326 ............................................................................................................................... (Porter) خجسص١س .7.7

327 ....................................................................................... وط١ ذ١ جغحفس قغحخ خجسص١س .7.8

328 ....................................................................................... جؿضت١س جططحذمحش وشف خجسص١حش .7.9

;32 ....................................................................................... جؿس ف جشحػش ضؾحش ػ جطؼشف .9.32

332 ............................................................................................................................. ج٤لشخ جىحش ئ٠ؿحد .9.33

332 .................................................................................................. جظس ضمحسخ محسس خسجسص١حش .9.34

334 ............................................... أجكزفس ح ظسز جطحذمس جظسز جمطغ ػ جطؼشف .9.35

Page 6: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 5

339 .................................................................................................................................................... جشجؾغ .:

Page 7: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 6

Page 8: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 7

انفظم األول

انهذف ين انذراطخ

Page 9: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 8

Page 10: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 9

انهذف ين انذراطخ .1

ضظك١ف ج٤خطحء ج٦الت١س ذأ ٠أخز وذخ جض جشجد ئ ذحء ظح طؼذد جح، ٠ذف جششع

عغ ف١ح ذؼذ ١ش جؼذ٠ذ ججػ١غ ١طضظك١ك ٠م ذحطؼشف ػ ج٤خطحء ج٦الت١س ٠ظككح

ئى١ض جطؼشف ػ ضؾ جشحػش -وحطؼشف ػ جغحش ج٦وحي جطمحت ئشحء لحط ػشذ

حس ؼحؿس جغحش جطر١ؼ١س ف ؿحالش أخش وذسجعس ضمحسخ جظس ػ ؾس ح وزه ضطر١ك أفى

أدسجعس ضمحسخ جش١فشجش جسجغ١س. ٠ذخ جظح جطرك محسذس ف ؼشفس ضطحذك جظس ره ذحعطخذج

ذح٦ػحفس ئ Minimum Edit Distanceضش١ض حعد ػ ؽش٠ك خجسص١س جطمحسخ ج٤طغش

حعرس ف ضكغ١ جطظك١ف ج٦الت. Heuristicsجعطخذج ضؿش٠ر١حش

Page 11: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 10

Page 12: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 11

انثبنانفظم

انذراطخ انزجؼخ

Page 13: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 12

Page 14: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 13

انذراطخ انزجؼخ .2

ر١ ف جفمشجش جطح١س جذسجعس جشؾؼ١س ى فىشز ج٤فىحس جكممس ف جظح.

انتظحح انهغى .2.1

يؼبنجخ انتظحح انهغىنحخ ػن .2.1.1

اف ججلغ ف، أعحع١س جحسجش جط ال٠ى ؿ١غ ضؼح ضمحت١ح جطؿثس حسز غس حس

جؼذ٠ذ ج٤شخحص ج٤رو١حء ٠جؾ طؼذحش ف جؿحء، زج فح ػ١س ضظك١ف جطؿثس جطمحت١س

ذغحػذز جكجع١د ض إالء ج٤شخحص.

ش جغطؼس ف جشش جىطحذس ج٦ىطش١س، ئ ػ١س جطظك١ف ج٦الت )ضظك١ف جؿحء( أ ج٤دج

ضغطؼ ف جركع جالعطؼالحش، وح ٠ؼذ أ ج٤دجش جشجفمس رشجؽ جىطر١س، ف ذؼغ

جكحالش كطحؼ ح ٠غ ذحطظك١ف جطمحت ىحش، جلطشجـ ضظك١ف ٤خطحء شحتؼس ف جىطحذس، ػ

ؼشذ١س ذؼغ ج٤خطحء ػ ػذ جطفش٠ك ذ١ ضز جط ضز جمطغ، لد قشف١ ضش١غ ف جىطحذس ذح

جخؾ ذ١ جؼحد جظحء.

ؼ١س ضظك١ف جؿحء ضحس٠خ ؽ٠ ق١ع لذ ض وطحذس ذشجؽ ىشف ضظك١ف ج٤خطحء ٤وػش غالغ١ ئ

ػحح عف غطؼشع ذؼغ جشحس٠غ جط ض جؿحصح ف زج جؿحي.

ف انهغخ انؼزثخانتظحح انهغى .2.1.2

ح ال شه ف١ أ كحس ئخؼحع جغس )أ غس( طك١ ذعحؽس جكحعخ ال ذذ أ ٠ؼطشػح جؼذ٠ذ

ضك١ جغس جؼشذ١س ذعحؽس ح ئرج خظظح ضطر١مح ذؼحؿس جغس جؼشذ١س فاغ١ش أ ،ج٦شىح١حش جؼمرحش

ؾخ قظش ج٤صج ضى ف ؼظ ز جشحو خشجكحعخ ٠ىطف ػمرحش وػ١ش أوػش أ غس أ

جؼشذ١س قظشج دل١مح ضك١ح فك ظح ضظ١ف ؼ١، ح ع١ى ػغ سص س٠حػ١س ح ف

جكحعخ. ٠ؿد أ ٠ى زج جطظ١ف جش١س ذك١ع ٠غطػد جفشق ذ١ جىحش جحضؿس ػ

ضط٠ش ذشجؽ آ١س ٠ىح جعط١ؼحخ جمجػذ جك٠س جؼشذ١س، ذك١ع ٠طى جخطالف جطشى١. غ ٠ط ذؼذ ره

جكحعخ ضظ٠د جؿ جخحؽثس ػذ لشجءضح، جؿحد جظش، فا ضط٠ش ػ ز جرشجؽ

.١ظ غطك١ال

Page 15: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 14

ظطكحش مذ ظشش كحالش وػ١شز ػغ ذشجؽ آ١س طك١ جغس جؼشذ١س ذك١ع ٠ىح جطؼح غ ج

.فك خض ور١ش جغس، ف١ح ٠أض عغطؼشع غط٠حش ضك١ جغحش جطر١ؼ١س ذعحؽس جكحعخ

انتحهم انظزف .1

٠م ذطك١ جىس ؼشفس ؾزسح صح جظشف ح ؽشأ ػ١ح ص٠حدز أمظح أئػالي أئذذجي

عجذك ع ضه جغجذك، ح كمح ػحتش أئدغح ألد، ذح٦ػحفس ئ ؼشفس ح جضظ ذح

، ئ غ١ش ره أقشفح أفؼال أجقك ىحش ضه جؼحتش ججقك، ؼشفس ع جىس فغح؛ جعح

. جطط١فحش جظشف١س جط ضخض و لغ ألغح جى جؼشذ

:وس: لحي. ح ػذز طس طشف١س ػذ جطك١، ػ جكجطح

.لحي: " لحي " فؼ حع، جؿزس: ق ي .1

لحي: " لحي " جع فحػ جفؼ جػالغ: ل، جؿزس: ق ي ي .2

انتحهم اننحى .2

جؿضء جز ٠ط ذؼاللس جىحش ذؼؼح غ ذؼغ، ١ى١س جؿس، غ١شح جؼحش جك٠س،

جمجػذ جك٠س جظك١كس أق١حح ف ضكذ٠ذ أ لذ ضغحػذ ؼشفس .٠ؼطذ ػ جشقس جظشف١س

جطفحع١ش جظك١ف.

انتحهم انذالن .3

جؿضء جز ٠ط ذف جمظد جؿس ػ ؽش٠ك جشذؾ جطم ذ١ ػع جكذ٠ع ف جؿس

.ؼحش جؼح ججلؼ. ضؼطذ ز جشقس ػ و جشقس جظشف١س جك٠س

ػ١: ضؼ ػ١ ج٦غح، ػ١ جحء، ؾحعط،.. ػحي:

Page 16: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 15

ف يجبل تظحح انتهجئخ ثبإلنجهشخانتظحح انهغى أنظخ .2.1.3

٠ؾذ جىػ١ش ج٤ظس ذحغس جؿ١ض٠س جط ضظكف ج٤خطحء جالالت١س جك٠س ٠ى لغح ج

لغ١ فطقس جظذس غمس.

األنظخ يفتىحخ انظذر .2.1.3.1

زوش ح ج٤ظس ؼشع ف١ح ٠ ذؼغ ج٤ظس جفطقس جظذس ف جغس جؼشذ١س

جطح١س:

(GNU Aspell) نظبو .1

ضم١س ؿح١س فطقس جظذس ٠ى جعطخذجح وىطرس أوططر١ك غطم ضط١ض

ذمذسضح ػ جلطشجـ قي ىحش جخحؽثس ذشى أفؼ أ ضطر١ك آخش ف١ح ٠

:(1) غ ضط١محش أخش Aspellػشع طحتؽ ضم١س

Page 17: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 16

(After the Deadlineنظبو ) .2

ذشحؽ ٠غطخذ جزوحء جظؼ ؼحؿس جغحش جطر١ؼ١س ؼشفس ج٤خطحء جالالت١س جلطشجـ

( أطظفف OpenOfficeقي رو١س ح، ٠ى أ ضط جػحفط كشس ظص ػ )

جالطشص أج لغ ح.

: ح ٠٠م زج جظح ذ

جطذل١ك جالالت ظص. -1

.(2)جطكمك ج٤خطحء جمجػذ٠س -2

:(3) ف١ح ٠ ػشع طحتؽ محسس زج جططر١ك غ ضطر١محش ؼشفس أخش

(.OpenOfficeجططر١ك غ كشس جظص )جطح شى ٠ػف ج

Page 18: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 17

(Online spell checkنظبو ) .3

الت١س ػ ض خطحء ج٦ج٤خطحء ػ جالطشص ٠م ذطك١ ج٠ؿحد ج٤ظح طظك١ف

ػحفس ج جلطشجـ قي ز ( ذحreal time٦ذخ لر جغطخذ ف فظ جكظس )

ج٤خطحء ذؼشش٠ غس خطفس ٠ى جخط١حس جغس جذخ ذح جض ذ١ جغحش خطفس

س جظذس.( جفطق٠Aspellؼطذ ػ ضم١س )

٠ذف زج جظح ئ غحػذز ذسجء جشحس٠غ ذطظك١ف ج٤خطحء جالالت١س شحس٠غ جطشؾس

.(4) ذغغ جظش ػ جغس جغطخذس

Page 19: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 18

(LanguageToolنظبو ) .4

لغات اإلنكلزة والبولندة والفرنسة بالذشحؽ فطـ جظذس طك١ جظص

٠ى .( وبعشرن لغة أخرى(English, Polish, French, Romanian والرومانة

.(5) (٠there, theirى غ١ش وشفح ػ جخؾ ذ١ ) وشف أخطحء لجػذ٠س ال

Page 20: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 19

يغهمخ انظذر .2.1.3.2

زوش ح ج٤ظس جطح١س:

(LingPipe) نظبو .1

:ح ٠ أدجز ؼحؿس جظص ذحعطخذج ؼحؿس جغحش جطر١ؼ١س ق١ع ضم ذ

عحء ج٤شخحص، جظحش، ججلغ( أعحء )جركع ػ ج٤ -1

.(6) جلطشجـ جطؿثس جظك١كس ىحش -2

(Spellcheckplusنظبو ) .2

.(7) الت١س جمجػذ٠س ىحش ذحغس جالؿ١ض٠سج٦ظح ػ جالطشص ٠ظكف ج٤خطحء

(Gingerنظبو ) .3

.(9) الت١س جمجػذ٠س ىحش ذحغس جالؿ١ض٠سظح ػ جالطشص ٠ظكف ج٤خطحء ج٦

Page 21: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 20

(Reversoنظبو ) .4

جالالت١س جمجػذ٠س ىحش ذحغس جالؿ١ض٠س ٠مذ ظح ػ جالطشص ٠ظكف ج٤خطحء

.(8) خذحش ضىح ف جطظك١كحش جطرمس ػ جض جذخ

Page 22: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 21

األنظخ ف يجبل تظحح انتهجئخ ثبنؼزثخ .2.1.4

طشص ح١ه ػ لس جشحس٠غ جط ضط ؼح لس جكط جؼشذ ػ ج٦ جالقع أح

زوش ح ٠. ٠ؾذ جم١ ج٤ظس ذحغس جؼشذ١س ز ج٤ظسا، زج فجؼشذ١سذغطح

غهطبونظبو .1

طظك١ف جطمحت الخطحء جالالت١س جشحتؼس ف جغس غطح ششع فطـ جظذس

لحتس ىحش جخحؽثس جشحتؼس ضظك١كح جطمحت، جؼشذ١س ٠ذف زج جششع ئ ػغ

.وزج ػغ جطؼر١شجش جطظس جط ضؼرش ػ ذؼغ جكحالش

ضطر١محش جرشحؽ:

لحتس جطظك١ف جطمحت ف جرشجؽ جىطرس. OpenOffice/LibreOffice

ضذل١ك ج٤خطحء جشحتؼس ف ججلغ رجش جكط جؼخ، ػ ٠ى١ر١ذ٠ح.

غحػذز جىحضد ف ذشجؽ جشجعالش، جطشؾس، غ١شح.

حش جغ٠س . (corpus) ضذل١ك جذ

ضظك١ف جعطؼالحش جركع.

(10) .ضظك١ف جىطحذس ف ج٤ؾضز جكس وحجضف جزو١س

آظجم .2

ذف ششع آ٠غر ئشحء لج١ظ ف جغس جؼشذ١س ططر١محش جىطر١س جكشز ػ

، Firefox ،Thunderbird ،Abiwor ،Gedit، طظفف OpenOffice.org ؿػس

جخ ...

Page 23: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 22

:فش ششع آ٠غر ػذز لج١ظ

جذلك حغر، جز ٠ؼ ػ ذشحؽ طذل١ك ج٦التجمحط جؼشذ

.أذ أف١ظج٦الت جشضرؾ ذششع

جمحط جؼشذ طشجدفحش، جشضرؾ ذرشحؽ جطشجدف جؼؿ ١ص MyThe

.ششع أذ أف١ظ

جمحط جؼشذ فشدجش جظفس غ٠ح جخحص ذحطذل١ك جك.

ظس جكسجمحط جؼشذ جخف١ف طذل١ك ج٦الت ٥ Embedded

systems وحجضف جكس أؾضز PDA.

قظ زج جششع ػ جؿجتض جطح١س:

جؿحتضز جخحطس خالي جطم ج٦فش٠م جػحع رشجؽ جكشز.

(11) ششع جغس قغد جؿؼ١س جغشذ١س ط١س ج٦ػال١حش جكشز.

Page 24: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 23

(Buckwalter Arabic Morphological Analyzerنظبو ) .3

( ٠م ذطك١ جىحش جؼشذ١س ئ ىحضح Perlظح قحعذ فطـ جظذس ذغس )

. ج٤عحع١س وحؿزس جغحق جغجذك ججقك

( جؿزس، 38،600( ججقك، )618، ) جرحدتحش (299)٠ك زج جك ػ

ضد ذػالظ ؾذجي ضغطخذ طشو١د جرحدتحش غ جؿزس ججقك

.( ذخ طشو١د جرحدتحش غ جؿزس1،648جؿذي ج٤ي ) .1

( ذخ طشو١د جؿزس غ ججقك.1،285جؿذي جػح ) .2

.(12) ( ذخ طشو١د جرحدتحش غ ججقك598جؿذي جػحع ) .3

لطزة .4

٠م جرشحؽ ذطظش٠ف ج٤فؼحي جذخس غ ذؼغ جؼحش جؼشس٠س ط١ذ ؾ١غ

صس جخطفس.٤أشىحي جطظش٠ف ف ج

زج جرشحؽ ؾضء ششع جذلك ج٦الت جؼشذ ٠ذف ئ دسجعس عن ج٤فؼحي

جطظشفس جىشف ػ أطح، غػشذ١س أؾ ضف١ش ١ضز جطؼشف ػ ج٤فؼحي

. ضذل١مح ئالت١ح، أجركع ػح

.(13) ض ذشؿس جططر١ك ذغس ذح٠ػ

Page 25: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 24

ثزنبيج انخهم انظزف .5

ظح قحعذ فطـ جظذس ٠م ذطك١ جىحش جؼشذ١س ئ ىحضح ج٤عحع١س

.ججقكوحؿزس جغحق جغجذك

٠ؼذ زج جظح ج٤ي ػ ق١ع و فطـ جظذس ذؼذ جظح جش١ش

"Buckwalter" ججعغ جالعطخذج ف جشجوض جركػ١س ى فطـ جظذس ئال أ جظح

جكح ٠ض٠ذ ػ١ ف و لحدس ػ ئػحفس غط أػك جطك١ ره ذحعطخشجؼ جؿزس

.(14) عحق جىسجص

يكتجخ تبشفن .6

:ىطرس ضحشف١ طؿز٠غ جخف١ف ىطذس ذغس ذح٠ػ جرشؿ١س، ضم ذحطح

.جذع الكلمة العربةت - .الجذراستخراج -

الحاالت الممكنة.تقطع الكلمة إلى جمع -

تنمط الكلمة. - .قائمة مسبقة للزوائد وحروف الزادة - .(14) إمكانة تعدل قوائم الزوائد -

Page 26: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 25

انزدف .7

جشد٠ف ٠ف١ذ جغطخذ ف جركع ػ وحش شجدفس أأػذجد أؾغ وس ؼ١س، لذ ٠ف١ذ ف

.(15) ؼ١سجركع ػ جىحش جط ضط ذمحف١س

يظكىن .8

جطالصحش جفظ١س ششع ٠ذف ج ج٠ؿحد جطالصحش جفظ١س ذأجػح ف جغس

أجغىوحش أجطجسدجش جىحش جط ضطجسد ؼح ف جػغ ػذ٠ذز، ػ طالز

٠غطفحد ح ف جطشؾس جطك١ جك .جؿؼس، ٠ جػالغحء، ذحخ جضي، جؽ جؼشذ١س

.(16) جعطخشجؼ جظطكحش، ف ؿحالش أخش ؼحؿس جغس

Page 27: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 26

يشكبل .9

٠ؼ زج جططر١ك ذطشى١ جظص جؼشذ١س جط ضؼذ أ غحت ؼحؿس جغس جؼشذ١س

:جرشحؽ ذغح ٠مطؼ ضؿحص ػمرحش ػذ٠ذز ضج٠ح

ضشى١ آ ظص جؼشذ١س.

ئىح١س ضظك١ف جغطخذ طشى١ جمطشـ.

جعطؼحي جرشحؽ غحػذج طشى١.

٠ى غطخذ أ ٠ظكف جطشى١، أ ١ضز شىحي أ ٠مطشـ ضشى١ال آ١ح ض، غ

ئرج ؾذ ذ خطأ

:جرشحؽ شفك ذأدجش أخش

،جظص جؼشذ١سك طشف ىحش.

قزف جكشوحش.

ضك٠ جض ئ لحتس وحش.

ض١ذ خطف أشىحي جالع ذاػحفس جضجتذ وكشف جؼطف جطؼش٠ف جؼحتش

.جطظس

ضق١ذ أشىحي جضجش ج٤فحش جطحء جشذؽس.

ضظ١ف جىحش ئ أعحء أفؼحي.

ضكذ٠ذ جؿ جؼشذ١س ف جض.

ػذجد ئ وحشضك٠ ج٤.

جمحف١س ضشض١د جىحش قغد آخش قشفح(.)

ضغ١ك جشؼش جؼشذ جؼد ئ ػد٠.

(17) لد جض جكشف العطخذج ف جرشجؽ جط ال ضذػ جؼشذ١س.

Page 28: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 27

انؼبن .11

ػشذ ػشذ لحط ؼؿ جؼح طؼذد جغحش جؿحالش، ٠ك لحط ػشذ

.جى١ض غحت ػشذ فشغ غحت ػشذ جعرح غحت ػشذ ذشضغح غحت

لحط شح ق١ع ٠ك ػ ؼح جىحش جؼشذ١س ؼح جؿ جؼشذ١س ظطكحش

جؾطحػ١س ظطكحش جدجس٠س ظطكحش جعال١س ظطكحش جػال١س ظطكحش

طكحش جال جطكذز ظطكحش جطغ٠ك جلطظحد٠س ظطكحش جالدجسز ظ

ظطكحش جطؼ١ ظطكحش جكحعخ ظطكحش جطمظ ظطكحش جم

ظطكحش جذعس جذ١س ظطكحش ضؿحس٠س ظطكحش ضم١س ظطكحش س٠حػ١س

ظطكحش صسجػ١س ظطكحش ع١حع١س ظطكحش طحػ١س ظطكحش ؽر١س

ش ػغىش٠س ظطكحش لح١س ظطكحش ح١س ظطكحش ػحس ظطكح

.ظطكحش فغ١س ذحالػحفس ج جطؼحذ١ش جطشجو١د جشحتؼس ؼح١ح جشحتؼس

جمحط جؼشذ جؼشذ ٠ك لج١ظ شسز ػ ؼؿ ج٤ػشحخ جؼؿ جع١ؾ

حء ؼؿ ػشذ ػح وحش جمشج خطحس جظكحـ ظطكحش فم١س ؼح جالع

٠ذف لحط جؼح . جىحش جؼشذ١س ؼؿ جالطجش ؼؿ جؼح جؼشذ ؼح

.(18) سخذس جرحقع، جطشؾ، جطحد كظي ػ جؼس ذغشػس دل

Page 29: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 28

Page 30: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 29

Language Identificationأنظخ انتؼزف ػه انهغخ .2.2

يمذيخ .2.2.1

جفمشز ذششـ ذؼغ ج٤ظس ف جطؼشف ػ جغحش جىطذس غس ػشذ١س أ م ف ز

فحسع١س أ ئى١ض٠س.. ئخ. ضم أظس جطؼشف ػ جغحش جىطذس ذؼذز جعطشجض١ؿ١حش عػكح ف و

ظح.

ثؼغ األنظخ ثجبل انتؼزف ػه نغخ اننظىص انكتىثخ .2.2.2

جغحش جؾدز قح١ح ذأقشف الض١١سعزوش ف١ح ٠ ذؼغ أظس جطؼشف ػ

TextCatنظبو .1

-٠N-Gramظف جغطذجش ذحالػطحد ػ خجسص١س ؿح فطـ جظذس ظح

Based Text Categorization (19)غس ٠69م زج جظح ذطك١ فحش ىطذس خ.

Xerox MLTT Language Identifierنظبو .2

ظح ضؿحس ٠م ذطك١ جظص جىطذس ؼشف جغس جط ضط ح، ٠غطط١غ زج

غس ػح جؼشذ١س، ٠ى جعطخذج رحششز ػ لغ 69جظح جطؼشف ػ

.(42)جططر١ك

Rosette Language Identifierنظبو .3

ظح ضؿحس ٠ك جظص جفحش ؼشفس جغس جىطذس ذح ٠ط١ض ذغشػس ػح١س

ف ضك١ جفحش، ذمذسض ػ ؼشفس غحش جظص جىطذس ذأوػش غس، ٠ى

. (43)غس خطفس 52جطؼشف ػ

Page 31: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 30

Language Identification of Short Text Segments)نظبو .4

with N-gram Models )

ظح ٠م ذحطؼشف ػ غس جظص جمظ١شز ؾذج جىطذس ٠طشجـ ػذد جكحسف

( كشف زج ٠ػ ضكذ٠ح ور١شج ق١ع أ ؼظ ج٤ظس ضطؼشف ػ غس 43-7ف١ح حذ١ )

.(44) جظص جط٠س

Techniques for Language Identification for Hybrid)نظبو .5

Arabic-English Document Images)

ظح ٠م ذحطؼشف ػ غس جظص جىطذس ذحغس جؼشذ١س أخش ذح٦ؿ١ض٠س

.(45)ظص خططس جغط١

Page 32: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 31

Word predictionتىلغ انكهبد .2.3

يمذيخ .2.3.1

جشت١غ ضلغ جىحش غحػذز ج٤شخحص ر جالػحلحش جؿغذ٠س ض٠حدز جذف

غحػذز ج٤شخحص جز٠ ٠ىطر جىػ١ش عشػس وطحذط ػ جكحعخ ف١ذ أ٠ؼح

ال ضطلف فحتذز ػ ز جخحط١س ػذ زج جكذ ف ضف١ذ .ػال طر١سجظؼرس وح جظطكحش

حذس أ ف غحػذز جشخض ػ ضزوش جىحش أ جخط١حس شجدفحش ؾذج ف جخطضجي ص جىط

ؾذ٠ذز ف أغحء وطحذط.

ثؼغ األنظخ ف يجبل تىلغ انكهبد .2.3.2

ف ؿحي ضلغ جىحش: عزوش ف١ح ٠ ذؼغ أظس

Aurora Suite 2005نظبو .1

ظح ؿح غك جظذس ذف

غحػذز ج٤شخحص جز٠ ٠ؼح

( مشجءز Dyslexiaذحمشجءز )طؼذحش

جىطحذس ذشى أفؼ ذحػطحء ظحتف رحء

ؾ طك١كس جغحػذز ذحخط١حس جىحش

.(24) جظك١كس

((wordQ+speakQنظبو .2

ظح غ١ش ؿح غك جظذس ٠غطخذ غحػذز جؼح١ ف جىحضد ػ ص٠حدز

.(25) لشجتطعشػس وطحذط

Page 33: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 32

Page 34: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 33

انثبنثانفظم

ثنخ اننظبو

Page 35: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 34

Page 36: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 35

ثنخ اننظبو .3

ج٤لغح جطح١س ضمغ ئ عػف ف١ح ٠ ج٤لغح جط لح ذطف١زح ضكم١مح ػ جظح ػ شجق

جط ع١ط ششـ و ح ف جفمشجش جطح١س. قغد ججػ١غ

خطحء جالالت١س٤جضظك١ف -1

قط طى ج٠ؿحد ج٤خطحء جالالت١س ض جذخ الذذ ؾد خض ور١ش وحش

٠ط محسس جىس جذخس غ ؿػس جىحش جظك١كس جشحذس ح فشص ز جىحش . جغس

غ جعطخذج ضؿش٠ر١حش Levenshtein Distanceقغد دسؾس لشذح ح ػ ؽش٠ك خجسص١س

طؼذدز ٠ى جطؼذ٠ ػ١ح ف لص جطشغ١ )وطمحسخ جفحض١ف ػ قس جفحض١ف أج٤خز ذؼ١

جالػطرحس ح فؼ جغطخذ ف شجش عحذمس.. ئخ(.

Language Identificationجطؼشف ػ جغحش -2

فحسع١س، أسد، ئى١ض( ػ ؽش٠ك م ف ز جفمشز ذحطؼشف ػ جغحش جىطذس )ػشذ١س،

خجسص١حش ع١ط ششقح القمح

Word Predictionضلغ جىحش -3

ذحػطحد ػذز جعطشجض١ؿ١حش Language Modelم ح ف ضلغ جىحش ذحػطحد رؼ غس

Uni-gram, Bi-gram.

Topic Predictionضلغ ػع جفمشجش -4

Languageف ز جذسجعس م ذذسجعس جض ضلغ جػع جز ٠طكذظ ػ ذحػطحد

Model.

ئى١ض-لحط ػشذ -5

خحسؾ١س ٤خز APIئى١ض طشؾس ذ١ جىحش ذحػطحد -لح ذطؿشذس ئشحء لحط ػشذ

جىحش جمحسذس ىس ح.

Page 37: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 36

جسجغ١س()جش١فشجش جطؼشف ػ محؽ ضمحسخ جؿ١حش -6

NeedlemanWunschلح ف ز جفمشز ذططر١ك خجسص١ط١ ش١شض١ ح

SmithWaterman جخحطط١ ذطكذ٠ذ أؽجي كذدز )أأػظ١س( ٤ورش أؾضجء وط١ ضطحذمح

.( )Oذض

ضطر١ك فىشز ضمحسخ جىحش ػ جظس ػ ؽش٠ك جغحش جظس٠س -7

ق١ع طرك فىشز ضطر١ك جغحش ف طحلحش أعغ ق١ع عم ذططر١ك فظ فىشز ضمحسخ جىحش

ػ ؿحي أعغ محسس ضمحسخ ػال طسض١ ح أف طش ؼشفس دسؾس ضمحسخ و ح

عػف ف١ح ره ػ ؽش٠ك ئ٠ؿحد ضش١ض حعد ؼط١حش ٠ى ضطر١ك جخجسص١س ػ١.

مظذ ذػحي ػ ضمحسخ جظس لذ لح ذططر١م فؼال ضكغ١ ص ضف١ز ذخجسص١حش ذؼذ حرج

ضكغ١ ذشى ور١ش ؾذج خالي ػذز خجسص١حش ضكغ١.

ضطر١ك فىشز ضمحسخ جؿ١حش ف ضكذ٠ذ محؽ جططحذك جالخطالف ذ١ طسض١ ح -8

طمحسخ جؿ١حش ف جظس ق١ع ٠ط لح ف زج جمغ ذططر١ك فىشز ئ٠ؿحد أوػش جطمحسذحش ؽال

ضكذ٠ذ أورش محؽغ جظسز ضطحذمح ذحغرس ظسز أخش أمحؽغ جالخطالف أجكزف.

Sentiment Analysisجطؼشف ػ ضؾ جشحػش ف جؿس -9

Positive orم ح ذحطؼشف ػ ضؾ جشحػش ف ؾس ح، ؾرس أ عحرس

Negative ؼرش ػح ضؿح ػع أو طؽ ؼ١. ذسجعس جشحػش ج

Page 38: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 37

انزاثغانفظم

وانطزق انتجؼخ انتحمك انؼه

Page 39: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 38

Page 40: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 39

انتحمك انؼه .4

ف جششع.ضكم١مح عششـ ف١ح ٠ و١ف١س جطكم١ك جؼ ى فىشز ج٤فىحس جط ض

ISRIخىارسيخ .4.2

يمذيخ .4.2.1

ISRI ـجخطظحس (The Information Science Research Institute ) خجسص١س

ى ضط١ض ػح ٠khojaؿحد جؿزس ىحش جذخس ضشر خجسص١س ؼحؿس ظص ػشذ١س ٦

ض ضكم١مح ف جرذج٠س وؿضء طكم١ك جطظك١ف جغ ف ذؼذ قحؾطح محط ؿزس جىحش.

جغس جؼشذ١س ى ض جعطرؼحدح ف١ح ذؼذ ذؼذ جضرحع جخجسص١س جغشػس جؼحس )٤ غس( ف

جطظك١ف جغ.

انخىارسيخ .4.2.2

(.Dجصجس جط٠ جكشوحش آخش جىس )جؿػس -1

ط ال ضظش٠ف ح)*(.فكض ح ئرج وح جؿزع جىحش ج -2

(. P3, P2جصجس جغجذك جط ح قشف١ أأوػش )جؿػس -3

(. S3, S2جصجس ججقك جط ح قشف١ أأوػش )جؿػس -4

جصجس قشف )( ئرج وحص جىس ضك ف أح قشف )(. -5

جعطرذجي جضجش ) أ آ ئ ( ذكشف ) ج ()**(. -6

ؼ١ذ وح . 3 =<ئرج وح ػذد قشف جؿزع -7

.PR4ركع ػ ص جىس ف جؿػس 4ئرج وح ػذد قشف جؿزع = -8

a. جؿػس( كحي جصجس القمس قشف جقذS1.)

b. = كحي جصجس عحذمس قشف جقذ 4ئرج وح ح٠ضجي ػذد قشف جؿزع

(.P1)جؿػس

.PR53ركع ػ ص جىس ف جؿػس 5ئرج وح ػذد قشف جؿزع = -9

a. .كحي جصجس القمس قشف جقذ

b. = كحي جصجس عحذمس قشف جقذ. 5ئرج وح ح٠ضجي ػذد قشف جؿزع

c. = ؼ١ذ وح . 3ئرج وح ػذد قشف جؿزع

d. = 8ؼد خطز 4ئرج وح ح٠ضجي ػذد قشف جؿزع.

Page 41: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 40

e. = ركع ػ ص جىس ف جؿػس 5ئرج وح ح٠ضجي ػذد قشف جؿزعPR54.

)***(.PR63ركع ػ ص جىس ف جؿػس 6ئرج وح ػذد قشف جؿزع = -10

a. .كحي جصجس القمس قشف جقذ

b. = كحي جصجس عحذمس قشف جقذ. 6ئرج وح ح٠ضجي ػذد قشف جؿزع

c. = ؼ١ذ وح . 3ئرج وح ػذد قشف جؿزع

d. = 9ؼد خطز 5ئرج وح ح٠ضجي ػذد قشف جؿزع.

e. = ركع ػ ص جىس ف جؿػس 6ئرج وح ح٠ضجي ػذد قشف جؿزعPR64.

كحي جصجس القمس قشف جقذ. 7ئرج وح ػذد قشف جؿزع = -11

كحي جصجس عحذمس قشف جقذ. 7ئرج وح ح٠ضجي ػذد قشف جؿزع = -12

.10ؼد خطز 6ئرج وح ػذد قشف جؿزع = -13

يالحظخ

وس ال ٠ى ضظش٠فح ح. 49)*( ض جػحفس

)**( ٠ جصجس جضجش )ؤ, ب, ء( طم١ غع جىس ػال : وس "ذ١ثس" ػ

ص "فؼس" فؿزسح "ذ١ة" أح جرج ض جصجس جضز)ب( عف ضظرف "ذ١حز" ػ ص

"فؼحي" ؾزسح "ذ١س".

)***( ض جػحفس جص ضفحػ١.

Page 42: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 41

Porterخىارسيخ .4.3

خجسص١س ذغ١طس ضؼطذ ػ ئ٠ؿحد ؾزع جىس ذحغس ج٦ى١ض٠س. ضؼطذ ػ ؼحؿس كحسف جىس ػ

شجق. ضط١ض ذغشػطح جىر١شز ف ػرحسز ػ فكض ػذد جششؽ طي ئ جؿزع جحت.

أف ظ غ ضظش جؿزع Excelضم جخجسص١س ذأخز وس وس وذخ ض أ ف

ح طح. ٠ى جؼدز ال دجع زوش و١ف١س ئ٠ؿحد جؿزع .7قط 1جشجفك ذؼذ جشس ذحشجق

ض جرشؿ ؼشفطح ذغس.

ض ضكم١مح ف جرذج٠س وؿضء طكم١ك جطظك١ف جغ ف جغس جؼشذ١س ى ض جعطرؼحدح ف١ح ذؼذ ذؼذ

جخجسص١س جغشػس جؼحس )٤ غس( ف جطظك١ف جغ. جضرحع

وتطجمبتهب انجذذح Minimum Edit Distanceخىارسيخ تمبرة كهتن .4.4

يمذيخ .4.4.1

ضؼطذ ز جخجسص١س ػ ئ٠ؿحد جطمحسخ ذ١ وط١ ػ ؽش٠ك ؾذي ضػ جخحس ج٤لظ ف١ )جؼ٠س

غد جؿذي( ح ٠غ ل١س جطمحسخ. ضػ ز جم١س ذ ضمحسخ ج١١س أج١غحس٠س ذك –أجغف١س

جىط١ ذؼؼح ق١ع ضضدجد وح جخطفص جىط١ ذحػطرحس ذحل جطغ١شجش غحذطس. ضؼرش جطغ١شجش ف

ز جخجسص١س ػ ػ١حش جطرذ٠ أئػحفس أقزف جكشف١ جز ٠ؿش محسطح طال ك

جحت.

ضم ز جخجسص١س وذف أعحع ح ذذسجعس ضمحسخ وط١ ػ ؽش٠ك جرشؿس جذ٠ح١ى١س. ق١ع

ضم جرشؿس جذ٠ح١ى١س ػ ق جغحت جظغ١شز جرغ١طس غ ج٦وحي طؼدج طي ك

جط م ذح ػ ج٤خ١ش جحت. ٠كذد ؼ ضمحسخ وط١ ذؼذد ػ١حش ج٦ػحفس أجكزف أجطؼذ٠

جىس جكح١س طي ئ جىس جذف.

Page 43: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 42

ضغطخذ ز جخجسص١س ف أغشجع ػذ٠ذز غ١ش ضه ف دسجعس ضمحسخ وط١ وح ف دسجعس ضمحسخ

زج ح لح ذاؾشجت أ٠ؼح . DNAعالع جـ

انخىارسيخ .4.4.2

ذح جطش١ض جحعد، ؼؼح ػ و قذ ٠ؿد ضكذ٠ذ ضمحسذح ذح أح أؾ ذأخز و١طضم جخجسص١س

قذد جظففس وحشى:

: غ ضم جخجسص١س ذذسجعس ضمحسذح ػ ؽش٠ك جؼحدس جطح١س

m[i,j] = min(m[i-1,j-1]

+ if s1[i]=s2[j] then 0 else 1 fi,

m[i-1, j] + 1,

m[i, j-1] + 1 ), i=1..|s1|, j=1..|s2|

ق١ع ضذسط ضمحسخ و قشف ػ جكشف ج٢خش طي ئ جطمحسخ جحت ػ ؽش٠ك جرشؿس

جذ٠ح١ى١س ذذسجعس ضمحسخ ج٤قشف ذكذ رجضح غ ئػحفس أؾضجء جىس ش١ثح فش١ثح قغحخ جطمحسخ

ؾذ٠ذ.

Page 44: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 43

١ش جز ش٠ذ جطػ ف جضج٠س ج١غش جؼ١ح ػ جظففس ل١س جطمحسخ ٠ػ جك ج٤خ

:جحت١س

نىحخ انفبتح انتجبػذ ػن انتمبرة ثبالػتبد ػهحظبة تجزجخ .4.4.3

ض جعطخذج ضؿش٠ر١س ضػغ ج٤قشف ػ قس جفح٠طف ئدخحح ف ػ١س ضكذ٠ذ ل١س ضرحػذ أضطحذك

ق١ع ٠ى ضؼذ٠ ئ XMLقس جفحض١ف ػ ف Mapض أدخحي خش٠طس جغحعس.قشف١ ػ

أ غس أخش.

.٠XMLظش جشى جطح ؾضء ف جـ

Page 45: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 44

ط ؼحؿس ضمحسخ أضرحػذ كشف١ ح ذحالػطحد ػ ضػغ و ح أال ، ح قشف١ أقشف ض

ق١ع ضض٠ذ و قحس (Shift, Without Shit pressedغ١ش قشف غح١ح ح ذفظ جػؼ١س )

جكحالش جغحذمس ص جطرحػذ. أ أ جؼاللس ١غص خط١س.

٠W, Nر١ جشى جطح قس جفحض١ف، ش٠ذ ؼشفس جرؼذ ذ١ جكشف١

وحشى ظففس غحت١س غ١ش طغح٠س أذؼحد ج٤ػذز JaggedArrayم ذطخض٠ قس جفحض١ف ػ

جطح:

<?xml version="1.0" encoding="utf-8"?> <KeyboardMap> <KeyboardRow RowNum="0"> <KeyboardRowKeys Layer="0" ShiftEnabled="false"> <![CDATA[` 1 2 3 4 5 6 7 8 9 0 - =]]> </KeyboardRowKeys> <KeyboardRowKeys Layer="1" ShiftEnabled="true"> <![CDATA[~ ! @ # $ % ^ & * ( ) _ +]]> </KeyboardRowKeys> </KeyboardRow> <KeyboardRow RowNum="1"> <KeyboardRowKeys Layer="0" ShiftEnabled="false"> <![CDATA[q w e r t y u i o p [ ]]]> </KeyboardRowKeys> <KeyboardRowKeys Layer="1" ShiftEnabled="true"> <![CDATA[Q W E R T Y U I O P { }]]> </KeyboardRowKeys> </KeyboardRow>

..

</KeyboardMap>

Page 46: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 45

. ٠ؾذ غ م ذكغحخ ذؼذ ج٤ػذز ج٤عطش وػال رؼذ ذ١ جكشف١ ى ق ذغ١ؾ ذذجت ؾذج

أ ال طىر١ش جىحش ف جىس Shiftضغ١١شجش س ف قس جفحض١ف ق١ع ؾد ػؼؾ ػ ص

ج٦ى١ض٠س. أ ف دسجعس جرؼذ جف١ض٠حت ج٤ قحش جفحض١ف جطػ ف ئصجقس و عطش ػ عحذمس

وح ٠ػف جشى جطح:

ق١ع ٠ؿد أخذ زج جالكشجف ذشى رذت.

ؿد أ٠ؼح أ ال ٠ط ؼحس ؾ١غ ج٤ذؼحد ذشى طشحذ ق١ع ٠ؿد أ ٠ضدجد جرؼذ وح جذطؼذح ػ جكشف ٠

جظك١ف ذشى غ١ش خط )ذشى ضحذغ غص( وح ٠ر١ جشى جطح

Page 47: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 46

يؼزفخ انطزك انؤد ننمطخ انتمبرة .4.4.4

م١س جطمحسخ جحت١س جػ.٠ر١ جشى جطح جغحس جز لذ شش ذ جخجسص١س قط جطي

ضم فىشز ئ٠ؿحد جغحس ذحطي أال م١س جحت١س غ جؼدز خفح طمف أغش جغحس جز ض عو

Back trace ٠ط ضف١ز ز جؼ١س ذأح لح ذكفع إششجش ػذ و خحس ف ؽش٠مح ذف ٤ح ال .

ذؼذ جطي ذف ؼد مطس ذف ئ جرذج٠س ػ ؽش٠ك ظففس ؼشف جغحس ذحطكذ٠ذ ذؼذ.

جإششجش جط لح ذكفظح ضؼرثطح.

ؼشفس جإششجش ؼشفس جؼ١س UnitIntention, BackTracePointerض جالعطؼحس ذحظف١

ججفمس جط ضص طي ئ جم١س جذ١ح.

Page 48: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 47

ػهخ إنشبء انمبيىص .4.4.5

خ إنشبء انمبيىصػه .4.4.5.1

ضطى ػ١س ئشحء جمحط ئدخحي ق١ع ٠ر١ جشى جطح خطؾ ئشحء جمحط ذشى ست١غ رغؾ

( غ ض١ذ وحفس ضرذ٠الش جخطأ جىس ح Corpusجىس ذكذ رجضح ػ جمحط )ى وس ف جـ

وفحض١ف ضشذؾ غ جىحش جظك١كس )أ ؿػس ( غ ئدخحح أ٠ؼح محط Edits خالي )

وحش طك١كس( كطس ػذ سد وس رجش خطأ ئالت.

Page 49: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 48

ثنخ انمبيىص .4.4.5.2

ق١ع ٠ػ جفطحـ ح جىس جذخس محط جم١س ٠Key-Valueطأف جمحط غحت١س

.DictionaryItemجشجفمس فطحـ ؾ

ػ جىحش جمش٠رس جىس جكح١س جط ٠ى دسجعطح فسج ف قحي ٠DictionaryItemك

.EditItemؾد وس لش٠رس ح خالي

Page 50: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 49

وىس دخ. ٠ط ئدخحح وكحس ؾذ٠ذز ػ ٠Theر١ جشى جطح قحي جمحط ذؼذ ئدخحي وس

Edit Distanceخطأ ذح غ ئ٠ؿحد ذؼذ جغحفس جمحط ئػحفس ضك٠الضح جىس جط ٠ى أ ٠ط ج

ىس ػ جىس ججفمس ح طغش٠غ جؼ١س ف أغحء جركع ذشى ور١ش ؾذج ئ وح حق١س قغحخ

جغحفحش غرمح غ جخط١حس جغحفحش ج٤لظش فسج أغحء ػ١س جركع.

ع١ك ػ Editsوحش ق١ع أ ضرحد٠ جىحش ٠ر١ جشى جطح قحي جمحط ذؼذ ئدخحي ػذز

أوػش وس محذس غ ذؼذ و ح ػ جىس جفطحـ.

Page 51: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 50

انجحث ػن انمبيىص .4.4.5.3

ذحطفظ١ ػ فظ خططحش ع١ط ششق ، ٠ر١ جشى جطح جخطؾ جؼح ركع ػ جمحط

جظح.

جخحؽثس ئالت١ح : ٠tideر١ جشى جطح و١ف١س ػ١س جركع ف جمحط ىس

Page 52: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 51

Languageانتؼزف ػه انهغخ انطجؼخ ثنظىص يكتىثخ ثهغخ يب أويجىػخ نغبد .4.6

Identification

إلى جانب فكرة التصحح اللغوي، سنقوم هنا بشرح فكرة التعرف على لغة مكتوبة ما.

نتؼزف ػه انهغبدانهذف ين دراطخ ا .4.6.1

ذغرد جالطشحس جىر١ش فحش جىطذس ذغحش خطفس ػ جالطشص أطرف الذذ ضظ١فح

قغد جغس جىطذس العطخذجح ذشى فؼحي لر ج٤شخحص جإعغحش، أ ذحطي ج

ؿ١ض٠س.ض١١ض غس جظص جىطذس ذكشف ػشذ١س ػ ػ١الضح ػ ظص ىطذس ذحال

جغحش جطح١س ضىطد ذأقشف ػشذ١س:

1. Arabic

2. Persian )اللغة الفارسة(

3. Urdu ))... ،اللغة المستخدمة ببعض المناطق بجنوب آسا )الهند، باكستان(

4. Pashto)اللغة األفغانة(

ولغات أخرى غر مشهورة. .5

تىطف انظأنخ .4.6.2

وح قؿ ح ضؼذدش جغحش جذف ز جغأس جطؼشف ػ غس جض ح

جغطخذس ف١ .

وح ج جخط١حس جطم١س جط ضكمك ؼ١حس جغشػس ػح١س قط ٠ط جطؼشف ػ جغس

(real time.)

ض جخط١حس خجسص١س ػح١س الضطؼك ذخظحتض جغس قط ٠ى ضطر١مح ػ ؾ١غ جغحش

جغس. Corpusذؿشد جدخحي

طسز ػ Watan-2004 corpusضغ Arabic Corpusض جعطخذج -

(Khaleej-2004 ضك )جػ١غ خطفس. 6غطذ ظف١ قغد 20291

Bijankhan ضغ Persian Corpusض جعطخذج -

Page 53: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 52

Urdu Corpusض جعطخذج -

انتحمك انؼه .4.6.3

ض جعطخذج ؽش٠مط١ طكم١ك ز جغأس :

ModelGram -Uniذحعطخذج .1

٠ط جعطخشجؼUni-Grams جي corpus جغحذك روشح قغحخ ػذد ضىشجس و

وس ذى جغطذجش.

.فشص جىحش ج٤وػش ضىشجسج ػؼح ف جرذج٠س

.ؼشفس غس جىس

القع ػذ ضؼشف جظح ػ وس )وطد( ذأح وس ػشذ١س ره ذغرد ؾدح ف جغس

جفحسع١س أ٠ؼح.

Page 54: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 53

القع ضؼشف جظح ػ جغس ج٤عحع١س ذأح جؼشذ١س أ ٠ؾذ غس أخش جالؿ١ض٠س.

Gram Model-Biباستخدام .2

ض جعطخشجؼBi-Grams جي corpus جغحذك روشح قغحخ ػذد ضىشجس و

وط١ ذى جغطذجش.

.فشص جىحش ج٤وػش ضىشجسج ػؼح ف جرذج٠س

جىس.ؼشفس غس

Page 55: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 54

القع أ جظح ٠طؼشف ػ وس وطد ذؼىظ جكحس جغحذمس ره ٤ جرؼ جغطخذ

Bi-gram .ق١ع ٠كطحؼ وط١ ػ ج٤ل ١طى ضكذ٠ذ جغس

Page 56: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 55

تىلغ انكهبد .4.7

تىطف انظأنخ .4.7.1

جطرحػس.جذف جغأس جوحي وطحذس جىحش جؿ غطخذ طغ١ ػ١س

realوح ج جخط١حس جطم١س جط ضكمك ؼ١حس جغشػس ػح١س قط ٠ط جوحي جىطحذس )

time.)

ض جخط١حس خجسص١س ػح١س الضطؼك ذخظحتض جغس قط ٠ى ضطر١مح ػ ؾ١غ جغحش

جغس. Corpusذؿشد جدخحي

انتحمك انؼه .4.7.2

س :ض جعطخذج ؽش٠مط١ طكم١ك ز جغأ

Gram Model-Biباستخدام .1

ض جعطخشجؼBi-Grams جي corpus جغحذك روشح قغحخ ػذد ضىشجس و

وط١ ذى جغطذجش.

.فشص جىحش ج٤وػش ضىشجسج ػؼح ف جرذج٠س

.جوحي جىحش

Page 57: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 56

Gram Model-Triباستخدام .2

ض جعطخشجؼTri-Grams جي corpus جغحذك روشح قغحخ ػذد ضىشجس و

غالظ وحش ذى جغطذجش.

.فشص جىحش ج٤وػش ضىشجسج ػؼح ف جرذج٠س

.جوحي جىحش

Page 58: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 57

تىلغ فكزح اننض انكتىة .4.8

تىطف انظأنخ .4.8.1

ض جخط١حس خجسص١س جذف جغأس ضلغ جػع جؼح جز ٠ذس ق جض جذخ .

Corpusس الضطؼك ذخظحتض جغس قط ٠ى ضطر١مح ػ ؾ١غ جغحش ذؿشد جدخحي ػح

.غسج

انتحمك انؼه .4.8.2

Uni-Grams( جغطخذس ض جعطخشجؼ Corpusذحعطخذج جغطذجش جظفس غرمح ف جي )

و غطذجش ػع ؼ١ غ ٠ط محسطح غ وحش جض ؼشفس جػع جؼح.

ػمحفس ػحس زج طك١ف. القع ئػطحء جظح جالقطح١س ج٤ػ

Page 59: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 58

لبيىص انؼبن وانتزادفبد .4.9

تىطف انظأنخ .4.9.1

أػذجد جذف جغأس ضشؾس جىس جؼشذ١س ئ جالؿ١ض٠س ؼشفس طشجدفحش

حىس جالؿ١ض٠س.جىحش جطؼمس ذ

انتحمك انؼه .4.9.2

.جؿ١ض ؼشفس ضشؾس جىس –محط وحش ػشذ ( Corpusض جعطخذج ) -

( ضطر١ك ػ جالطشص ٠ؼط طشجدفحش Big Huge Thesaurusض جعطخذج ضطر١ك ) -

جىحش جالؿ١ض٠س.أػذجد

Page 60: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 59

Minimum Editخىارسيخ تمبرة نطن ين يؼبنجخ انهغبد انظىرخ .4.11

Distance (MED)

يمبرثخ طىرخ .4.11.1

فشع طرغ١ؾ ذأ جظس جط ٠ش٠ذ ف دسجعس ضمحسخ طسض١ MEDى غطف١ذ خجسص١س

أذ١غ أعد فاح غطط١غ ذطؼذ٠ ضػ١ جظسز ػ أح إف غالظ جغطخذ محسطح

ضذسؾحش شورحش ذأ أخز شورس جقذز فمؾ طى ػال شورس ج ج٤قش ؼد ذحظسز ئ

سحد.

ػال ى لذ قظح ػ ظففس شذؼس و خحس ف١ح ػرحسز ػ ق١ذ ضذسؼ ج ج٤قش

)القع أ ذاػحدز ز جؼ١س ػ جشورحش جػالظ غطط١غ أ ذسط ضمحسخ ػ جظسز ج٤ط١س.

طمحسخ(جظسض١ ػ جشورحش جػالظ غ ؼشفس جط١ؿس جحت١س

ضؾذ أ٠ؼح ؽش٠مس أخش ذأ ؼرش ػ مطس ح )أ ج وحال أ ج ذشورحض جػالظ( ذم١س

غ ذسط جطمحسخ. ضط١ض ز جطش٠مس ذؼؼفح أح جطش٠مس جط جلطشقحح عحذمح ١uniqueضز

ز ذم١س ١ضز ٠ى أ ٠طحذك ذذسجعس جطمحسخ ػ جشورحش جػالظ ٤ ال ٠ؾذ ف جظس

أخش طسز أخش ذحم١س ج١ضز فغح ذ١ح ذطؿضتس ج ئ شورحض جػالظ دسجعس ضمحسذ القع

أح دسعح ذذلس أورش ضمحسخ ١ ح.

Page 61: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 60

Thresholdingانتؼتت .4.11.2

ذأ م ذؼضي ج٤ج ضذسؾح ذحضؿح غحقس كذدز ػ جظسز وشف جكجف جطؼط١دفىشز ضأض

طغ١ جمحسس ذ١ طسض١ ذؼذ ره وح ٠ر١ جشى ذ١ جظسز ج٤ط١س جظسز جؼطرس:

ؼ١ م ذفشص ج ػ أعحع Thresholdػ ئلحس قذ Thresholdingضم ػ١س جطؼط١د

قغد جؼحدس جرغ١طس جطح١س:

غ محسس جظس ذؼذ ئؾشجء ضكذ٠ذ جكجف جطؼط١د ػ١ح.

0,1رحسز ػ ػ Binaryىشف جطر١ح ذشى جػف ف١ح ذأ شؾؼح ظسز غح٠س م ذطؼط١د جظسز

فمؾ. 0,1ذحطح ى قظح ج٢ ػ ظففس شذؼس رجش ل١ غحت١س

ز جؼ١س ؾ١ذز أق١حح ع١ثس أق١حح أخش، ٤ ػذ جطؼط١د فاح ض٠ ؼحش ؾدز جظسز

لحط ى ذحطح جقطحي ػ١حع ؼحش س ذسجعس جطمحسخ ف جطمس جط ض ضؼط١رح ذشى

طؼط١د ١ضجش أخش ذأ ٠غف ح ذحطشو١ض فمؾ ػ ج٤حو جس ذسجعس جطمحسخ ذذ أ ذسط

if (colorComponent > threshold)

return 1;

else

return 0;

Page 62: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 61

أحو ل١س ج١٤س وححؽك جمش٠رس جكجف ٤ح ػشػس طغ١ش ذشى ور١ش ذ١ طسز أخش

ؿحذ!ذحطح فاح عطإغش ذشى عر ػ ػ١س جمحسس ١ظ ذشى ئ٠

تطجك انمبرثخ .4.11.3

ذؼذ جكظي ػ جظسز جػحت١س فاح م ج٢ ذشدح ئ عغس كحسف رجش ذؼذ جقذ )ظففس

ذطح ئ زج جكذ . كحسف( ذحطح ى لذ ؾؼح جظسز ذكذ رجضح وأح ػرحسز ػ وس!

وط١ شضض١ ذطػ١ غحت!غطط١غ ج٢ ضطر١ك جخجسص١س ذ١ طسض١ ذحػطرحسح

م ج٢ ذأخز جظس ج٤ط١س جكفظس ػ جرشحؽ غرمح محسح جقذز ضج٤خش غ جظسز

ج٤خش أخز دجتح جظسز رجش جرؼذ ج٤لشخ جط ضطشقح جؼرشز ػ وس جغش ججقذز ض

سخ ذ١ جىط١ )أ جظسض١(.جخجسص١س وخشؼ ػرحسز ػ ػذد ٠ػ ل١س جطمح

Page 63: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 62

نذراطخ تمبرة انظىر انخىارسيبد انحظنخ .4.11

يمذيخ .4.11.1

. وحص جظسز جشجد ؼشفس 24*24طسز ذأذؼحد 240ض جخطرحس جخسجص١س ػ ؿػس

محسذحضح جطح١س:

طسز جط ع١ؿش جخطرحسح 240طسز أط ٠49ر١ جشى جطح طسز ٤ي

القع أ ذؼؼح ىشس ز مظد ؼشف ذ لذسز جخجسص١س ػ ضشض١د جظس جطمحسذس

ذؼؼح جرؼغ ذؼؼح جرؼغ!.

لشخ غ ضؿ١غ جظس وح جخشؼ وح طلغ ذأ جخجسص١س لحص ذطشض١د جظس ج٤لشخ فح٤

جطمحسذس ذؼؼح جرؼغ ذؿحد ذؼؼح جرؼغ.

Page 64: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 63

غح١س. 18.60 وح جلص جغطغشق

يشكهخ انخىارسيخ .4.11.2

عطشـ ف١ح ٠ ذؼغ شحو ز جخجسص١س:

ضؼطذ ز جخجسص١س ذأح ضأخز جظسز ضكح غغس جرطحش ذطش١ض غحت ذحطح فاح ال .1

أذذج ذؼ١ جالػطرحس أ ضغ ئ جػطرحس طشجذؾ ج٤ج أجمحؽ Spatial Spaceخز جفشجؽ جىح ضأ

غ ذؼؼح.

ضظغ١ش ظسز ف وح ضىح عحذمح /ضفش ز جخجسص١س ذشى ور١ش ػذ ؾد ضذ٠ش أضىر١ش .2

ضأخز فمؾ محؽ جظس ذذ أ ضشجذؾ ذ١ح.

غحقس ور١شز ؾذج ف جظس جىر١شز ذحطح ٠ؾد محسس أؾضجء جظس ز جخجسص١س ضأخز .3

طظغ١ش جكؿ جكؿص ف جزجوشز و ػ قذج ذحطح ص٠حدز ضؼم١ذ جخجسص١س.

ف أغحء لص ضشغ١ جرشحؽ ػذ ئؾشجء جخجسص١س غالظ شجش ٠RAMر١ جشى جطح جزجوشز

ػ طسز ١غص ور١شز!

Page 65: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 64

تحظن انخىارسيخ .4.11.3

ئرج أؼح جظش ف جشى جطح جز ٠ر١ طسز ؿضء ظففس جرؼذ ذؼذ ضظغ١ش ج٤ػذجد ظسز

ذؼ١ذز ؾذج ػ جظسز ج٤ط١س ذحمحسس غ جظسز جط ض١ح رحششز جط ضظش طسز ؿضء

ج٤ط١س.ظففس جرؼذ أ٠ؼح ى ظسز لش٠رس ؾذج جظسز

– القع أ ج٤ػذجد ػ ػ قذد ظف جظففس )ئ ػذح فا جم١ ضظ (

طغ١شز ف قحس جظسز جمش٠رس ضطرحػذ ذؼذ قذ ؼ١ ف جظسز جرؼ١ذز.

طظف القع أ ز جفىشز ١غص ػشذح خحؽثح ف جطفى١ش ق١ع أ جطش٠ك ج٤ػ ال ٠رطؼذ ػ ج

وح ٠ر١ جشى جطح:

Page 66: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 65

ذأخز ز جفىشز ػ جكغرح غطط١غ ضط٠ش خجسص١طح طمف فس جطي ئ أػذجد أورش قذ

ؼ١ ػ طظف جظففس ذحطح فش لطح ور١شج ؾذج . حق١س أخش فا ز جؼ١س عطؼح

١س ذشى ؾ١ذ. ره ٤ح أخز ل١س جرؼذ جم١س جط ضشض١د جظس غ١ش جمش٠رس جظس ج٤ط

ضلفص جخجسص١س ػذح. ذحطؿش٠د أػطص ز جخجسص١س طحتؽ ؾ١ذز ضؿ١غ ظس جطمحسذس أ٠ؼح

أ جط ضشجلد لع خطأ MEDStalkerذشى ؾ١ذ ى ١ظ ذشى أػ. أع١ح ز جخجسص١س

.early outور١ش طخشؼ رىشج

٠ر١ جشى جطح جض جرشؿ غ ضر١ح جششؽ ق١ع ركع ػ جخ فمؾ ف طظف جظففس.

غح١س ره ذأخز طعؾ أصس ؼحؿس ػ ػذد 13.6غح١س ئ 18.6ض ضكغ١ لص جؼحؿس

.%26جشجش أ ذغرس

for (int i = 1; i < _nS + 1; i++) { for (int j = 1; j < _mT + 1; j++) { int cost = GetElementCost(_tWord[i - 1], _sWord[j - 1]); int min = GetMinAndUpdateBT(j, i, _d[j, i - 1] + 1, _d[j - 1, i] + 1, _d[j - 1, i - 1] + cost); _d[j, i] = min; if (Math.Abs(i - j) < AreawidthOfConversion) { if (min > currentMinimumDistance + MarginOfError) { minOfThisBM = min; goto final; } } } } return _d[_mT, _nS]; final: return minOfThisBM;

Page 67: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 66

القع ف جظسز جطح١س أ جخجسص١س لذ لحص ذا٠ؿحد ألشخ جظس ضشض١رح ضؿ١ؼح ذشى طك١ف

ف ذذج٠س جطشض١د.

جؿضء ج٤خ١ش جخشؼ. القع أ جخجسص١س ضؼذ ضشضد ىح القع ف١ح ٠ ؾضء جخشؼ

أضؿغ جظس جطمحسذس غ ذؼؼح جرؼغ ذشى طك١ف زج ح ضكذغح ػ عحذمح

تحظن انخىارسيخ يزح أخزي .4.11.4

ذأخز جفىشز جغحذمس ى ذأ كغد فمؾ جم١ جط ضمغ ػ طظف جظففس ١ظ ػ وح

ش حرج ع١كذظ!.جظفس

.شى ظففس جرؼذ ذكغحخ ل١ جطظف فمؾ ٠ر١ جشى جطح جمظد ذحىال جغحذك

Page 68: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 67

م ح ذفظ جؼ١س جغحذمس ذأ القع أ ؾ١غ جم١ غ١ش جطظف أطفحس ؼذ قغحذح أطال .

خشؼ جكغحخ ذؼذ ؾد ػذد ؾذ٠ذ أورش قذ ؼ١.

٠ر١ جض جرشؿ جطح جخجسص١س جؿذ٠ذز:

ح لح ذطم١ ػذد جؼ١حش جكغذس ذشى ور١ش ؾذج ؾذج ، ى جخجسص١س فؼحس؟!

for (int i = 1; i < _nS + 1; i++) { for (int j = 1; j < _mT + 1; j++) { if (Math.Abs(i - j) > AreawidthOfConversion) { continue; } int cost = GetElementCost(_tWord[i - 1], _sWord[j - 1]); int min = GetMinAndUpdateBT(j, i, _d[j, i - 1] + 1, _d[j - 1, i] + 1, _d[j - 1, i - 1] + cost); _d[j, i] = min; if (Math.Abs(i - j) < AreawidthOfConversion) { if (min > currentMinimumDistance + MarginOfError) { minOfThisBM = min; goto final; } } } } return _d[_mT, _nS]; final: return minOfThisBM;

Page 69: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 68

ش ف١ح ٠ جخشؼ ججفك.

وح لحص ذحطشض١د ذشى ؾ١ذ ؾذج القع أ جخجسص١س لذ لحص ذا٠ؿحد جططحذك جظك١ف ذشى طك١ف!

ى ١ظ ذؿدز جخجسص١س جكغس جغحذمس قطح ١ظ ذؿدز خجسص١س جكغحخ جىح ج٤.

٠ر١ جشى جطح جؿضء ج٤خ١ش جخشؼ القع أ جخجسص١س ضؼذ لحدسز ػ ضظ١ف ضؿ١غ

طي م١س غ١ش ؾ١ذز ١ظ ػذ جطي م١س جظس جطشحذس غ ذؼؼح ٤ح خشؾح فس ج

جظك١كس رؼذ.

Page 70: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 69

يمبرنخ سين انتنفذ ثن انخىارسيبد .4.11.5

غح١س 5.9 حق١س جىغد ججلغ ف لص جطف١ز فور١ش ؾذج . القع أ جخجسص١س ضكطحؼ فمؾ ـ

غح١س ره ذأخز طعؾ أصس ؼحؿس 5.9غح١س ئ 13.6طظ١ف. أ ض ضكغ١ لص جؼحؿس

.%68.2. أح ػ جخجسص١س ج٤ط١س ف أفؼ ذغرس %56.6ػ ػذد جشجش أ ذغرس

.MEDStalkerEnhancedأع١ح ز جخجسص١س

٠ظش جخطؾ جغحذك جخطؾ جحت الخطرحس جغحذك ػ جخجسص١حش جخطفس. وحص جطحتؽ

عحع١س جظك١كس )أ ؼشفس ألشخ طسز ذشى خحص( ى ػذ ضشض١د جظس جطرم١س فا جطحتؽ ج٤

ضخطف خجسص١س ٤خش ره ٤ ٠ؾذ ذؼغ ح ٠ط فمؾ ذا٠ؿحد جظسز ج٤لشخ فمؾ ذذ

جالطح ذا٠ؿحد ضشض١د جظس ذحغرس ظسز ج٤ط١س.

47226x26

MEDRegular 18.6010639

MEDStalkerWithBT 21.4202252

MEDStalkerWithoutBT 13.602778

MEDStalkerWithBTEnhanced 6.1583523

MEDStalkerWithoutBTEnhanced 5.9

0

5

10

15

20

25

Processing Time

Page 71: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 70

تطبثك انشفزاد انىراثخ –خىارسيبد إجبد انتطبثمبد انجشئخ .4.12

DNA جؿحالش جف١ذز ف ضكذ٠ذ ل١س ضمحسخ وط١ وح روشح ف ضكذ٠ذ ذ ضمحسخ عغط

ف١ح ئرج وحطح ضط١١ فظ جغالعس. DNAذؼؼح ذسجعطح أف ؼشفس عغط١

خجسص١س MEDNeedlemanWunschAlgo جخجسص١حش جش١شز ف زج جؿحي خجسص١س

MEDSmithWatermanAlgo.

MEDNeedlemanWunschAlgoخىارسيخ .4.12.1

غ ض١ثس جؼد minػػح ػ جم١س جذ١ح maxضؼطذ ز جخجسص١س ػ ئ٠ؿحد جم١س جؼظ

ج٤ي جغطش ج٤ي ظفش ٦صجس أ ق )ذؼذ ئػحف( ػ عغس ضرذأ طظف جىس )ذزج

ج٤ػظ ف أ ىح ػ جىط١ ذغغ جظش ػ جططحذك جىح ذ١ح.( غف ذا٠ؿحد جططحذك

public int GetMED() { // Scan over for (int i = 1; i < this._nS + 1; i++) { for (int j = 1; j < this._mT + 1; j++) { int cost = GetElementCost(_tWord[i - 1], _sWord[j - 1]); int max = GetMaxAndUpdateBT(j, i, _d[j, i - 1] - _dW, _d[j - 1, i] - _dW, _d[j - 1, i - 1] + cost); _d[j, i] = max; } } return _d[_mT, _nS]; }

Page 72: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 71

أ وشف جطذجخ ذ١ جىحش

ف جضج٠س ضم ز جخجسص١س ذحشؾع أورش ل١س ػ جغطش جؼد ج٤خ١ش٠ ١ظ جم١س

قظشج . ٠ر١ جشى جطح جىال جغحذك:

٠ط ئ٠ؿحد جم١س جؼظ جؼدز خف.

SmithWatermanخىارسيخ انمخ انؼظ انحهخ .4.12.2

ع١ثحش جخجسص١س جغحذمس أح ضطك فمؾ ل١س ػظ ؾدز ػذ جكحفس. ذطؼ١ جفىشز أوػش

جؼظ ف أ ىح ػ جظففس. ٠ػف جشى جطح جىال جغحذك:ذأ ؾذ جم١

Page 73: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 72

ضغطط١غ ػذتز جخجسص١س ذحشؾع جكجف خفح ئ جطي ىشف جططحذك.

ػذ خ١س ح. Maxم ح ذاػحفس جظفش ػ جم١ جط ٠ى أ ٠أخزح جـ

وح جظففس: غ م ذؼذ ره ذكغحخ جم١س جؼظ ػ

أػذ عمف كذد جشؾع خفح زج ح لح ذاضحقط غطخذ

٠ر١ جشى جطح ظففس جغحفحش وشف جططحذك جؿضت ذ١ جىط١:

X = ATCAT, Y = ATTATC

Page 74: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 73

ق١ع ٠ى وشف أي ضطحذك:

وشف غح ضطحذك:

Page 75: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 74

كشف أجشاء انظىرح تطبثمب واختالفب .4.13

غطط١غ ؼشفس ضطحذك فاح ذفظ جطش٠مس جط ضؼحح ؼح ف ئ٠ؿحد ضطحذك أ جخطالف أؾضجء جظسز

جخطالف أؾضجء جظس ذح٦وحي فظ جرؼ جز قظح ػ١ ف دسجعس ضمحسخ جظس ػ

.MEDؽش٠ك خجسص١س جغحفس

جمحسس ؼح محؽ جالخطالف.٠ر١ جشى جطح جظسز جشت١غس جظسز جشجد

وح ٠ر١ جشى جطح جمطس جطحغس ىال جظسض١.

ف ئ٠ؿحد جطمحسذحش NeedlemanWunsch SmithWatermanطرك ح أ٠ؼح خجسص١ط

ش١فشجش جسجغ١س. ٠ى جالخطالف ح ذأح محس طسض١ ػط١ ػ ؽش٠ك عغط كحسف شورس

جقذز ج غ محسس ضمحسخ جشورحش ؾ١ؼح.

Page 76: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 75

انتؼزف ػه انشبػز ف انجهخ .4.14

تؼزف .4.14.1

ذكحؾس ئ ضم١١. ضك ز جغطذجش ػ آسجء )أقحع١ظ( ذفشع ذ٠ح ؿػس جغطذجش

قي غشع ؼ١، ٠ذف ضم١د ج٢سجء ئ جعطخشجؼ خجص شورحش جغشع جط ض جطؼ١ك ػ١ح ف

Liu ،Short opinion)ضكذ٠ذ ف١ح ئرج وحص جطؼ١محش ئ٠ؿحذ١س أ عر١س ٠ط ئ و غطذ

mining Encyclopedia ،.422:).

يمذيخ .4.14.2

٠ى ضمغ١ جؼحش جظ١س ذشى ػح ئ لغ١ أعحع١١ ح جكمحتك ج٢سجء. جكمحتك ؾ

غشػ١س قي و١ححش أقذجظ ف جؼح، ذ١ح ج٢سجء ؾ رجض١س )شخظ١س( ضؼىظ أقحع١ظ جحط

قي و١ححش أ أقذجظ. ذكحظ جؾدز جط ضركع ف ؼحؿس جؼحش جظ١س وحص ؼظ ج٤ئ

Information( ػ جعطؼحدز جؼحش )Factualشوضز ػ جعطؼحدز ؼحش قمحتم١س )

Retrieval وحص قي ؼحؿس ج٢سجء، ػح -قط لص لش٠د-( جركع ف جخ. فمؾ ذؼؼس أػحي

ذح ٠ؼطش ئ أخز لشجس ٠كطحؼ ئ عحع آسجء ج٢خش٠ زج أ ج٢سجء س ؾذج ق١ع أ جشخض ػ

.، Liu ،Short opinion mining Encyclopedia)٠طرك أ٠ؼح ػ جششوحش جظحش

422:).

جقذز ج٤عرحخ جشت١غ١س ؼذ ؾد دسجعس ػ آسجء أ وح حن ل١ال جظص رجش

ج٢سجء لر جشرىس جؼىرض١س. لر ج٠د، ػذح ٠كطحؼ جفشد ئ جضخحر لشجس، ٠ؿأ ػحدز ئ جغإجي ػ

آسجء ج٤طذلحء جؼحتس. ػذح ضكطحؼ ظس ؼػس ػ آسجء جؼحس قي طؿحضح، فاح ضؿش

( ؿػس جحط.Surveysغقحش )

ذطؽ ؼ١ أ أ شء ف طذ٠حش ج٦طشص جذحش ج٢ ٠ى شخض أ ٠ىطد ؾس ظش

ذ لر جغطخذ. أطرف جشخض جز ٠ش٠ذ ششجء غ١شح ... ز جظمحش ضذػ جكط ج

طؽ غ١ش ؼطش ئ عإجي ج٤طذلحء جؼحتس ق١ع أطرف حن ضم١١حش ػذ٠ذز طؽ ػ ج٦طش١ص.

ح ذحغرس ششوحش ) طحقرس جمشجسجش ج٤ غر١ح ( ضظرف جششوس غ١ش ؼطشز أ ضؿش غقحش أ

طؼشف آسجء جضذحت قي طؽ ح أ ششوس حفغس ح.

Page 77: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 76

ئ٠ؿحد ظحدس ٣سجء ػ ج٦طشص شجلرطح ػ أ قحي ٠ى أ ٠ى ػال ؿذج ؾذج )ف قحي ض

ػس جؾدز ػ ج٠د. ف ػذز قحالش ضى ج٢سجء خطرثس ٠ذ٠ح ( ذغرد جؼذد جحت ظحدس جط

ف محي ؽ٠ ٠ى جظؼد ػ جمحسب أ ٠ؿذ ح ٠ش٠ذ ٠غطخض ح جؼحش ٠خظح

٠ؼؼح ف شى لحذ العطؼحي، زج فك ذكحؾس ئ ظح ضم١د آسجء ضخ١ض أضحض١ى.

ضكذ٠ذ جىحش جفطحق١س جؼرشز ػ ج٢سجء. جؼذ٠ذ جرحقػ١ ػج ذذأ جركع ف ضم١د ج٢سجء ف

ػ جطم١د ػ ز جىحش ضكذ٠ذ ؾطح جذال١س، ئ٠ؿحذ١س وحص أ عر١س. ف

(Hatzivassiloglou ،3;;9) ش جؼرشز ػ ض ضكذ٠ذ ػذز لجػذ غ٠س ٠ى جعطخذجح طكذ٠ذ جىح

( ز جطش٠مس ض جعطخذجح ضع١ؼح ف Corpusج٢سجء ضؾحش ز جىحش ذحش ور١شز )

( ضغطخذ ؿػس طغ١شز Bootstrappingجؼذ٠ذ جمحالش، ق١ع ض جلطشجـ محسذس جىفحت١س )

جىحش جفطحق١س ٣سجء طؿذ طشجدفحضح ؼحوغحضح.

جطح ضظ١ف ج٦قغحط قي طؽ ػ غط جغطذ ذأو، جذف ضظ١ف و جطط٠ش

غطذ وغطذ ٠ؼرش ػ ؾس ظش ئ٠ؿحذ١س أ عر١س قي غشع ؼ١ )ئ وح طؿح أ ششوس ذكذ

جؼذ٠ذ جرحقػ١ أ٠ؼح دسعج ضظ١ف جشحػش ػ غط جؿس، أ ضظ١ف و ؾس . رجضح(

Liu ،Hu ،Cheng ،Opinion) (Hu ،4226)ضؼرش ػ سأ عر أ ئ٠ؿحذ. ف وؿس

Observer: Analyzing and Comparing Opinions on the Web ،.4227) ض جلطشجـ

(، زج جرؼ أوػش ضؼر١شج ػ Aspects or Featuresرؼ ضم١د ج٢سجء جؼطذ ػ ج١ضجش )

شىس ضم١د ج٢سجء.

ذشى ػح ٠ى جطؼر١ش ػ ج٢سجء ف أ ػع وح... ٠غطخذ ػحدز ظطف "غشع" طؼر١ش

ػ و١ح ض جطؼ١ك ػ١، ى غشع ؿػس جشورحش جخجص و شورس ضك ػ

شورحش ؾضت١س خجص خحطس ف١ح ىزج.... جخ. زج فا جغشع ٠ى أ ٠ط ضك١ ػحدز ذشى

.part-of ذحالػطحد ػ ػاللس ش

Page 78: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 77

تؼبرف نظزخ .4.14.3

تؼزف انغزع .4.14.3.1

ػرحسز ػ و١ح ٠ى أ ٠ؼرش ػ طؽ أ ػع أ شخض أ قذظ أ ظس. ز جغشع

ػرحسز ػ ش١س جشورحش جشورحش جؿضت١س جط ق١ع شضرؾ ذحضؼ

شورس ضك ػرحسز ػ ؿػس جخجص جطؼمس ذحغشع . ؾضء . القع أ و

Liu ،Short opinion mining)ػ ؿػطح جخحطس جشورحش جؿضت١س جخجص

Encyclopedia ،.422:).

جؿزس ػرحسز ػ شورس أ ف ز جش١س أ جشؿشز، جؿزس جغشع فغ و ػمذز غ١ش

شورس ؾضت١س، ذ١ح ٠ى جطؼر١ش ػ جشأ ػ أ٠س ػمذز أ قط أ٠س خحطس ف جؼمذز.

ذحغرس غطخذ جؼحد فا جطػ١ جش ٠ى أ ٠ى ؼمذ، طرغ١ؾ ج٤ش فا جشؿشز ٠ط جالطمحي

س". ظطف "١ضجش" ٠غطخذ طؼر١ش ػ و ذح جطػ١ جش ئ ضػ١الش جخش "غطك

١ضجش غشع ؼ١ وس غطخذس ف جحسعس ػال . ٠ى جػطرحس جشورحش جخجص. ق١ع أ

جغشع فغ ١ضز ) ؾزس جشؿشز(.

Opinion passage onتؼزف يظبر انزأ ثبننظجخ نشح يؼنخ ) .4.14.3.2

a feature)

ز ػرحسز ػ ؿػس ٠ط ضم١١ ف غطذ غشع ز ؼ١س غحس جشأ ذحغرس ١ض

. زج ٠ؼ أ جى أ كظ ضؼحلد ضؼرش ػ سأ ئ٠ؿحذ أ عر ػ ضؼحلد ؾ ف

ؾ أ قط ؾس ػ ج٤ل ػ ضؼرش ػ سأ ؼ١ ػ غشع أ ١ضز ، أ٠ؼح جى أ

Liu ،Short opinion mining)ضؼرش ػ آسجء ػ أوػش ١ضز جقذز ؿس جقذز أ

Encyclopedia ،.422:).

(Opinion holderتؼزف حبيم انزأ ) .4.14.3.3

قح سأ ؼ١ شخض أ ظس ػرشش ػ زج جشأ. فف قحس ضم١١ جطؿحش جذحش

Liu ،Short opinion mining)جطذ٠حش ػال فا قح جشأ ػحدز ز إف جمحي

Encyclopedia ،.422:).

Page 79: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 78

Semantic orientation of anتؼزف انتىجه انذالن نزأ) .4.14.3.4

opinion)

Liu ،Short)٠كذد ف١ح ئرج وح جشأ ئ٠ؿحذ أ عر أ ق١حد جطؾ جذال شأ ػ ١ضز

opinion mining Encyclopedia ،.422:).

غشع، ذحالػطحد ػ ح عرك، ٠ى ضؼش٠ف رؼ غشع ؿػس ج٢سجء ػ ١ضجش زج ج

٠ذػ زج جرؼ ذـ"رؼ ضم١د ج٢سجء جؼطذ ػ ج١ضجش".

MLتؼهى انخ .4.14.3.5

,Data Miningضغطخذ ػ طحق جعغ ضم١حش ضؼ١ ج٢س ف زج جؿحي جؿحالش جشحذس )

IR أ ز جطم١حش جغطخذس ،)Supervised Learning جط ضم ذطمغ١ جؼرحسجش ذ١ ؾ١ذ

أ عء غ ئػطحء غرس جط١م جط١ؿس )جقطحالش(، لذ جسضرطص ضم١حش ضؼ١ ج٢س ذشى ػح غ زج

.Naïve Bayesian Classifier (Wiebe, et al., 1999)جع جشحس٠غ وػحي ػ١ح:

انؼتذ ػه انشادتنمت اراء .4.14.3.6

)جط ػ ؽش٠ك ؿػس ط١س ج١ضجش ٠ط جطؼر١ش ػ جغشع

٠ى جطؼر١ش ػح ذؿػس ط١س جىحش ضط ئ ضك جغشع فغ(. و ١ضز

ػحش جطشجدفحش شضرطس ذح١ضجش جط ػرحسز ػ طشجدفحش، ذحطح ٠ؾذ ؿػس ؿ

٠ؼك ػ . زج فا قح جشأ ٠م١ جغشع . ف غطذ ضم١

، ٠خطحس قح جشأ ضط ئ . أؾ و ١ضز كطجز ف ؿػس ؾضت١س ج١ضجش

. ١ظف ج١ضز غ ٠ؼرش ػ سأ ئ٠ؿحذ أ عر أ كح٠ذ ػ وس

س ضم١د جؼط١حش جوطشحف و أؾضجء جؼحش جؾدز ف غطذ ضم١١ . ذحح٠س فا

، ػرحسز ػ سذحػ١س حضؽ ضم١د جؼط١حش ػ غطذ ضم١١ خشؼ جطم١د:

جطؾ جذال ػرحسز ػ ١ضز جغشع، جغشع، رش ػ قح جشأ، ضؼ ق١ع

:(Liu B ،.4234)ذشى ػح ح ػذز قحالش SO. ف ؾس شأ جؼرش ػ ج١ضز

إجاب أو سلب -

Page 80: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 79

محاد -

Liu ،Short)تجب اإلشارة إلى أن اآلراء المحادة ف الخرج تم تجاهلها حث أنها غر مفدة

opinion mining Encyclopedia ،.2002).

لذ ضؼ١ف ذؼغ جذسجعحش ئ٠ؿحذ ذشذز عر ذشذز.

أهى انشبكم .4.14.4

ضك ػ آسجء ػ غشع ؼ١، فا أ جشىالش ذفشع ذ٠ح ؿػس جغطذجش جطم١١١س

جط ضجؾ ػ١س ضم١د جؼط١حش :

نتم إلى استخراج مزات الغرض الت تم التعلق علها ف كل مستند .

.تحدد إذا كانت اآلراء حول مزة معنة إجابة أم سلبة أم محادة

الرأي المختلفن أن ستخدموا كلمات وعبارات تجمع مترادفات المزات حث مكن لحامل

مختلفة للتعبر عن نفس المزة.

يهخض نب طجك .4.14.5

حن ػذز ؽشق العطخذج طحتؽ جطم١د، ئقذ جطشق جرغ١طس ئطحؼ خض ؼطذ ػ جطحتؽ

.(Hu ،4226)أؾ جغشع وح ف

. ض ئحي قح جشأ. ف digital_camera_1ػ و١شج سل١س ؼ١س ٠خض ج٢سجء 3جشى.

محس ػرشش ػ 347ضؼرش ػ جى١شج فغح )جؼمذز جؿزس ف ش١س جغشع(. "CAMERA"جشى

"picture quality"محالش ػرشش ػ آسجء عر١س ػ جى١شج. ؾدز جظسز 9آسجء ئ٠ؿحذ١س

8محس ػرشش ػ سأ ئ٠ؿحذ ػ ؾدز جظسز فمؾ 345ح ١ضض١ طؽ. "size"جكؿ

تشر إلى الجمل المحددة <individual review sentences>ػرشج ػ سأ عر. جؼرحسز

والمقاالت الت تعط الرأي اإلجاب أو السلب. بهذه الطرقة للتلخص ستطع المستخدم بسهولة أن

شعر مستخدمون موجودون حول الكمرا الرقمة.عرف كف

Page 81: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 80

، Liu ،Hu))آ( ٠ر١ ره 4ضظ٠ش٠س ذغس. جشى. ٠3ى ؾؼ جطحتؽ جؾدز ف جشى.

Cheng ،Opinion Observer: Analyzing and Comparing Opinions on the Web ،.

٠ؼط ػذد ج٢سجء ج٠٦ؿحذ١س ػ ١ضز ح جؼد جؾد x، ق١ع أ و ػد فق جكس (4227

٠ؼط ػذد ج٢سجء جغر١س ػ ج١ضز فغح. محسس خظحش ج٢سجء ؼذز طؿحش xضكص جكس

س ذ١ آسجء غطخذ١ ػ١ طحفغ١ )خ( ٠ر١ محس4طحفغس ٠ى أ ٠ى غحػذج، جشى.

جى١شجش جشل١س

. ػحي ػ خض ؼطذ ػ ج١ضجش ٣سجء3شى.

آ. خض ؼطذ ػ ج١ضجش ٣سجء ػ و١شج سل١س

Page 82: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 81

انتظنف انحظ .4.14.6

٠ط دسجعس جطظ١ف جكغ ذشى جعغ ف ؿحي ؼحؿس جغحش جطر١ؼ١س، ٠ط ضؼش٠ف جطظ١ف جكغ

وح ٠:

٠ط ئ ، جطظ١ف جكغ ٠كذد ئرج وح و غطذ ذفشع ذ٠ح ؿػس جغطذجش جطم١١١س

٠ؼرش ػ سأ ئ٠ؿحذ أ عر غشع ؼ١.

جغأس ػرحسز ػ غأس ضؼ ضظ١ف، شحذس ى خطفس ػ غأس جطظ١ف جؼطذز ػ

ظص ف طفف ؿحالش ؼشفس غرمح )ػ، س٠حػس، ف( ف جؿحي ظص جط ضظف ج

جطظ١ف جؼطذ ػ جؿحي، جىحش جطؼمس ذحؿحي س، ى ف جطظ١ف جكغ جىحش

جطؼمس ذحؿحي غ١ش س. جىحش جؼرشز ػ ج٢سجء جط ضؼرش ػ سأ عر أ ئ٠ؿحذ جس.

.(Pang ،4224)طم١حش جؾدز ؼظح ضطرك ضم١حش جطؼ جطمحت طظ١ف حن جؼذ٠ذ ج

٠ط جطظ١ف ػ غط جغطذ ػذح ٠ط ؼحس و غطذ ػ أح قذز جؼحش ج٤عحع١س.

٠ك ػ آسجء ٠شوض ػ غشع جقذ جطظ١ف جكغ ٠فطشع ح ٠: و غطذ ضم١١

كح سأ جقذ.

جرحقػ١ أ٠ؼح دسعج جطظ١ف ػ غط جؿس، ق١ع ٠ط ضظ١ف و ؾس ػ أح رجض١س أ

.(Wilson ،4226) (Wiebe ،4227) (Kim ،4226)غشػ١س، ضؼرش ػ آسجء عر١س أ ئ٠ؿحذ١س:

خ. محسس آسجء ػ و١شض١ سل١ط١

Page 83: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 82

انتطجك .4.14.7

جملة باللغة االنكلزة :الدخل

مقدار إجابة أو سلبة الجملة :الخرج

جكغحخ ٠ط ذحالػطحد ػ مذجس ئ٠ؿحذ١س و وس جض ذغغ جظش ػ دالس جىس ف جؿس، ض

ق١ع ضك ػ ذ١ححش ػ شى وحش مذجس ج٠٦ؿحذ١س Micro-WNOp corpusجعطخذج ذ١ححش

( طم١١ ز جىحش Evaluatorجغر١س جطؼمس ذز جىحش ق١ع ض جعطخذج خظ )

تمى انجهخ .4.14.8

ض جالػطحد ػ جر١ححش جغحذمس طم١ ئ٠ؿحذ١س ؾس ذشى رذت، ق١ع وحص جخجسص١س وحطح

ف النصمن أجل كل كلمة

إذا كانت الكلمة موجودة ف البانات تم إضافة إجابتها وسلبتها إلجابة وسلبة الجملة ككل

بعد ضربها بوزن معن

إذا لم تكن الكلمة موجودة ف البانات تم إسناد اإلجابة والسلبة صفر للكلمة وال تتأثر الجملة

بها

ة أو معتدلة، حث ال تظهر فها مشاعر معنةمن الممكن أن تكون الجملة إجابة أو سلب

".It's a bad thing"ػال ؾس

Page 84: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 83

ف البداة"It's" لها وزن صفر كونها غر موجودة ف البانات

ثم تحقق من وجود"a" ف البانات وال جدها فتأخذ الوزن صفر وال تؤثر على الجملة

كلمة"bad" فه تؤثر على سلبة 0.75صفر وسلبتها موجودة ف البانات وقمة إجابتها

الجملة

كلمة"thing" 0.375موجودة ف البانات وقمة إجابتها مساوة لسلبتها وه

0.1875 =0.5*0.375+0+0+0إجابة الجملة

وبالتال الجملة بشكل عام سلبة 0.5625=0.5*0.375+0.5*0.75+0+0سلبة الجملة

Page 85: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 84

Page 86: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 85

انخبيضانفظم

يخططبد اننظبو

Page 87: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 86

Page 88: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 87

يخططبد اننظبو .5

.عػف ف١ح ٠ و خطؾ خططحش ػ١حش جظح ؼ١حش جشت١غ١س

CyperSpell انتظحح اإليالئ .5.6

( Corpusجىس جؿذ٠ذز ) جـ

ؼذال ذؼذ ئدخحي جىس ضؼذ٠الضح جىسجمحط

ض١ذ وحفس (Corpusئشحء جمحط ذأدخحي وس ؾذ٠ذز ) جـ جخطؾ٠ر١

جالقطحالش جىس خطأ ف١ح ئدخحح محط وفحض١ف ضشذؾ غ جىس جظك١كس )أ

ؿػس جىحش جظك١كس ججفمس(.

Page 89: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 88

3

وس دخ )ى أ ضى طك١كس أ خحؽثس ئالت١ح (

جىس فغح ف قحي طكطح أ جىس ظككس ئالت١ح ف قحي ؾد خطأ ئالت ف١ح.

٠ر جشى جطح جشقس ج٤ طظك١ف وس ح. ٠ط أدخحي جىس غ جركع ف

طك١كس أ خحؽثس ئالت١ح . جمحط ؼشفس

4

وس دخ )خحؽثس ئالت١ح (

جىس ظككس ئالت١ح ف قحي ؾد خطأ ئالت ف١ح.

محط ؼشفس ألشخ ىس جذخ جخحؽثس غ ضش٠شح ض١ذ وحفس جطرذ٠الش جىس

جىحش ح

Page 90: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 89

5

وس دخ )خحؽثس ئالت١ح (

جىس ظككس ئالت١ح ف قحي ؾد خطأ ئالت ف١ح.

لح جغطخذ ئسؾحع جىحش ج٤لشخ ىس جخحؽثس ئالت١ح شضرس قغد جخ١حس جز

ذحخط١حس.

Page 91: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 90

انتؼزف ػه انهغبد .5.7

Corpusجفحش جؼخس ضؼشف جغحشرؼ

٠ط أدخحي فحش جغس غ ض١ذ رؼ حعد ى غس طؼشف ػ١ح )ششـ ف

غطف١غ(جفمشز جخظظس ذشى

ذخ ض

غس جض جز لذ وطد ذح

٠ط ئدخحي جض )أ جؿضء جمظ١ش جض( رؼ ى ٠ط جطؼشف ػ جغس.

Page 92: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 91

تىلغ انكهبد .5.8

Corpusجفحش جؼخس رؼ ضلغ جىحش

٠Bi-Gramط أدخحي فحش جغس غ ض١ذ رؼ جطلغ غس جذخس ػ ؽش٠ك

..ئخ. Tri-Gramأ

وس جض( nجىس جذخس )آخش جالقمس )عغس جىحش جطلؼس(ضلغ جىحش

٠ط ئػطحء عغس جىحش جطلؼس جػطحدج ػ جىس جذخس ذكغد جرؼ جز لذ

ض ذحؤ.

Page 93: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 92

تىلغ يىػىع فمزح .5.9

فحش جغس جؼخس جػ١غ ػذز ضلغ ػع فمشز حرؼ

٠ط ذحء جرؼ ػ ؽش٠ك فحش جغس جظفس ذكغد ججػ١غ

فمشز ذخس ػع جفمشز

٠ط ضلغ جفمشز ذحالػطحد ػ جرؼ جز لذ ض ذحؤ ذكغد ججػ١غ ضىشجس

ذحجػ١غ جكطس Listجىحش ف و ػع ض١ذ التكس

Page 94: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 93

لبيىص انتزجخ .5.11

انتؼزف ػه تىجه انشبػز ف انجهخ .5.11

شجد ضشؾطح وس أػذجدحجىس جطشؾس غ جىحش جمش٠رس ح

٠ط ضلغ جفمشز ذحالػطحد ػ جرؼ جز لذ ض ذحؤ ذكغد ججػ١غ ضىشجس

ذحجػ١غ جكطس Listجىحش ف و ػع ض١ذ التكس

جشجد ؼشفس ضؾ جشحػش ػحجؿس شحػش جؿس جذخس ذحقطحي

ئدخحي جؿس غ ضمغ١ح ىحش ضص٠ و وس ػ جؿس ذصح جخحص ٠ط

غ ؼشفس ص جؿس وحال .

Page 95: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 94

Page 96: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 95

انظبدصانفظم

يخطط انظفىف

Page 97: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 96

يخطط انظفىف .6

واجهخ انظتخذو تطجك .6.6

٠ظش جشى جطح جخطؾ ج٤عحع ظفف ضطر١ك ج٦ظحس جؾس جغطخذ:

٠ك و طف ػ جطجذغ ج٦ؾشجت١حش جخحطس ذحطؼح غ جغطخذ أضش٠ش جطكالش جؾس

ج٦دخحي ئ جخجسص١حش ججفمس غ سد جطحتؽ ذحضؿح شحشس ج٦ظحس.

Page 98: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 97

نتطجك األطبط: تطجك يحزن انؼبنجا .6.6

MEDذذ جططر١ك جغإي ػ ج٦ظحس ذذ خجسص١حش ٠ى جشى جؼح ظفف وحطح

جخحطس ذحظص جظس.

Page 99: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 98

انتطجك األطبط: تطجك اإلظهبر يحزن انؼبنج .6.6

Page 100: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 99

وتؼذالتهب MEDخىارسيبد .6.6

ؾ١غ جطؼذ٠الش ػ١ح. ٠طأف قم١مس ش١ط١ ٠ى ٠MEDظش جخطؾ جطح ؾ١غ خجسص١حش

سدح ئ ش١س جقذ ى ػ قغحخ ضؼم١ذ ور١ش ف جض جرشؿ ١ظ جؼىظ!

جطرمس ػ جظس MEDجشت١غس خجسص١حش MEDضظش جش١س ػ ج١غحس خجسص١حش

جكح MEDBaseح ضشظ جظف ج٤خ جكغس جط ٠ى غطخذ أ ٠خطحس أ ح. ؾ١ؼ

ػ ج١ى جؼح ى١ف١س ئؾشجء جخجسص١س جطكالش جشت١غ١س.

٠ظش جخطؾ ػ ج١١ خجسص١حش ئ٠ؿحد جططحذك جؿضت أجى ذ١ جىحش أأؾضجء جظس.

٠ى ؽرؼح جخط١حس أ ح غ طكالش جذخ جحعرس.

Page 101: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 100

Page 102: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 101

انظبثغانفظم

واجهبد األظهبر

Page 103: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 102

Page 104: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 103

واجهبد اإلظهبر .6

٠مغ جرشحؽ ج لغ١ جمغ ج٤ي جطؼك ذؼحؿس جض جمغ جػح طؼك ذؼحؿس جظسز.

قغد حض ششق عحذمح ػ جخجسص١حش جغطخذس ف ؼحؿس جظص ض ئظحس و ح ف جؾس

رحسح. ججؾحش جطح١س الخط

( ISRIخىارسيخ ) .6.6

جفحضف. ج٤صسقالقع أ جكشف جط ض جعطرذجح ذحىس ال٠ؿحد ؾزسح لذ ض ض٠ح ذح

Page 105: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 104

(Porterخىارسيخ ) .6.6

( text( فحش )٠Excelى جدخحي جىحش ػ ؽش٠ك فحش )

جفحضف. ج٤صسقالقع أ جكشف جط ض جعطرذجح ذحىس ال٠ؿحد ؾزػح لذ ض ض٠ح ذح

Page 106: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 105

خىارسيخ حظبة انظبفخ ثن كهتن .6.6

٠ر١ جشى جشجفك جؾس قغحخ غحفس ذ١ وط١.

ضط١ف ججؾس ح ٠:

ضغ١١ش طكالش دخ جخجسص١س

ئىح١س طحذمس أ وط١

طحذمس وس غ ؿػس جىحش ذخس وف ظ أئىح١سExcel

ضشض١د جىحش قغد ذؼذح ػ وس ح ئخشجؾح ئ فExcel

ئظحس جططحذك جالخطالف ذ١ أ وط١

سع ؾذي جغحفس

ذف ٠ظش جشى جطح حؽك جالخطالف ذ١ جىط١ ؾذي جغحفحش غ ذ١ح جطش٠ك ججط

ػ جطش٠ك. ف قحي ئدخحي أوػش وس عطظش شضرس Cellضر١ح جطش٠ك ذحطفظ١ ػذ و خحس

ػ ١٠ جشحشس ذكغد ذؼذح ػ جىس جذف

Page 107: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 106

خىارسيبد كشف انتطبثمبد انجشئخ .6.6

وط١.٠ر١ جشى جطح جؾس خجسص١حش ىشف ضطحذك جش١فشجش جسجغ١س طكذ٠ذ جطمحسخ ذ١

Page 108: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 107

٠ى جدخحي القع ؾد ػذز خجسص١حش ىشف ضطحذك جش١فشجش جسجغ١س ٠ى جالخط١حس ح

ػذز ذحسجطشجش طؼمس ذى خجسص١س.

1- Regular, Backtrack

القع جفشلحش ذ١ جىط١ ضظش ذح ج٤طفش وزه ٠ظش جفشق ذ١ جكشف ج٢خش

ططحذك.ذشى غطم ضكص غحقس ج

2- Needleman Wunsch, Mod+ Back track

Page 109: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 108

القع جالخطالف ذ١ جخجسص١ط١ ف جعططحؼ جفشق ذ١ جكشف ج٢خش ف ذؼغ جىحش ضطحذمح ف

ج٤خش. ى ج٤صج ظففس جغحفحش قطح عطخطف.

3- SmithWaterman, Back track

Page 110: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 109

انتؼزف ػه تىجهبد انشبػز ف انجهخ .7..6

ق١ع ؼغ أ ؾس ٠م ؼحؽ جشحػش ذط ػ١س ضك١ جؿس ؼشفس ضؾحش جشحػش ف١ح

وحػحي جطح ؿس:

This is a ridiculous thing!

0.68ذغرس Negativeق١ع ٠ظش أح ؾس عر١س

Page 111: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 110

إجبد انكهبد األلزة ....6

س ٥خطحء ج٦الت١س ف١ح قغد خجسص١س ئ٠ؿحد ضط١ف ز ججؾس ئػحفس أ غس غ جطظك١ف جف

ئضحقس ضشض١رح قغد CyberSpellجطظك١ف جششقس عحذمح جر١س ػ لحط ر ذخجسص١س

أقغد جطرحػذ قغد قس جفحض١ف أقغد ضفؼ١الش جغطخذ أقغد Corpusسدح ف جـ

ضؿش٠ر١س غ ئػطحء ص جىس جحت.جطؿش٠ر١حش جغحذمس ؾ١ؼح ذكغحخ أصج ى

أجضرحع ٠CyberSpellى أ٠ؼح جالخط١حس ذ١ ئ٠ؿحد جىحش جفؼ ذألظ عشػس ذحضرحع خ١حس

.Normal Speedجغشػس جؼحد٠س خجسص١س ذحضرحع خ١حس

خىرارسيبد يمبرنخ تمبرة انظىر .7..6

ذأشىحح ج٤سذؼس جخظظس ظس : (١MEDس )جمغ جطؼك ذؼحؿس جظسض جعطخذج خجسص

MEDRegular,

MEDStalkerWithBT,

MEDStalkerWithoutBT,

MEDStalkerWithBTEnhanced,

MEDStalkerWithoutBTEnhanced

Datasetجظس ؿػس ضم ز جخجسص١حش وح ضكذغح ذا٠ؿحد ألشخ جظس ظسز ح

Page 112: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 111

خطحس جظسز جط ش٠ذ محسذطح -

خطحس ؿػس جظس -

(…,Red, Blue, RedAndBlueخطحس غط جمحسذس ج ػذز غط٠حش ١س ػ ) -

( جط ض ششقح عحذمح MEDخطحس جقذز خجسص١حش جي ) -

كذد جؼحالش جطذس ى خجسص١س. -

ذى طسز ػ قذج.جز ٠ظش ؾذي ج٤ج جخحص (Show Color Table)القع خ١حس

ػرحسز ػ جؿحي جطشدد ق١ع ٠ظش ؾ١غ ؾذي ج٤ج جخحص ذحظسز جط ش٠ذ محسذطح ػال

أج جظسز ػذد شجش ضىشجس و ح.

Page 113: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 112

أوانحذوفخانتؼزف ػه انمطغ ين انظىرح انطبثمخ نظىرح يب .7..6

٠خطحس أ طسز )أؿػس جظس( جط Referenceق١ع ٠خطحس جغطخذ أ طسز ست١غ١س

٠ش٠ذ أ ٠محسح غ جظسز جشت١غس

فشع أ جغطخذ لذ جخطحس جظسض١ جطح١ط١

٠ى حضؽ "ح جمطغ جخطفس"

Page 114: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 113

٠ى حضؽ "ح جمطغ جطحغس"

جؾحش ج٦ظحس لذ ض ششقح غ فمشجش جطكم١ك جؼ غس جف ال دجع ٦ػحدز ششـ جطؼح ذم١س

ؼح ح شز أخش.

Page 115: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 114

Page 116: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 115

انثبينانفظم

انزاجغ

Page 117: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 116

Page 118: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 117

انزاجغ .6

(1) http://aspell.net/

(2) http://afterthedeadline.com/

(3) The Design of a Proofreading Software Service, Raphael Mudge,

Washington, DC 2003.

(4) http://labs.translated.net/spell-checker/

(5) http://www.languagetool.org/

(6) http://alias-i.com/lingpipe/index.html

(7) http://spellcheckplus.com/

(8) http://www.reverso.net/spell-checker/english-spelling-grammar/

(9) http://www.gingersoftware.com/

(10) http://ghalatawi.sourceforge.net/

(11) http://ayaspell.sourceforge.net/

(12) http://www.qamus.org/

(13) http://qutrub.arabeyes.org/

(14) http://itwadi.com/node/2204

(15) http://radif.sourceforge.net/

(16) http://maskouk.sourceforge.net/index.php

(17) http://tahadz.com/mishkal/

(18) http://www.almaany.com/

(19) http://www.textcat.net/

(20) open.xerox.com/Services/LanguageIdentifier

(21) http://www.basistech.com/language-identifier/

(22) Language Identification of Short Text Segments with N-gram Models

Tommi Vatanen, Jaakko J. V¨ayrynen, Sami Virpioja

Aalto University School of Science and Technology,

Department of Information and Computer Science

Aalto, Finland, 2001.

Page 119: CROSPELL ENGINE, A Natural Language Processing Approach - Documentation

CROSPELL ENGINE

Mohammad Shaker, Ola Al-Nameh & Mohammad Hasan Serhan Page 118

(23) Techniques for Language Identification for Hybrid Arabic English

Document Images. Ahmed M. Elgammal, Mohamed A. Ismail -

Department of Computer Science, University of Maryland, College

Park, USA

(24) http://www.aurora-systems.com/pages/learning.html

(25) http://www.goqsoftware.com/