indonesia onesearch (ios) – versi 2
TRANSCRIPT
Indonesia OneSearch(IOS) – versi 2Ismail Fahmi, PhD.InisiatorIndonesia OneSearch (IOS)[email protected]
Lokakarya Perpustakaan Nasional31 Agustus 2016
2
1992 – 2007 S1, Teknik Elektro, ITB2003 – 2004 S2, Computational Linguistics, Universitas Groningen, Belanda2004 – 2009 S3, Computational Linguistics, Universitas Groningen, Belanda
2000 – 2003 Inisiator IndonesiaDLN (Digital Library Network pertama di Indonesia)Mengembangkan Ganesha Digital Library (GDL)Mendirikan Knowledge Management Research Group (KMRG) ITBMembangun Digital Library ITB
2009 – Sekarang Engineer di Weborama, Perusahaan berbasis big data (Paris/Amsterdam)2012 – Sekarang Co-Founder Awesometrics, Media Monitoring & Analytics Company2014 – Sekarang Founder PT. Media Kernels Indonesia, a Natural Language Processing Company2015 – Sekarang Konsultan Perpustakaan Nasional, Inisiator Indonesia OneSearch
Ismail Fahmi, [email protected]
3
Jack Andraka15 tahun, USA
4
Open Access Around The World
5
Goal
6
“To have a robust national open access repository
discovery system”
INDONESIADiscovery System
OAI Discovery System
7
Merupakan sebuah
Discovery System di Indonesia
8
Katalog Buku E-Journal Digital Repository Museum
Discontinued
Perpustakaan di Indonesia
9
Total:66.000+
* Sumber: Perpusnas 2016
Road Map IOS
10
Tahap 1 (2015): OneSearch Portal
OneSearch Portal (Bibliografi)
• Software Indonesia OneSearch
• Harvesting data bibliografi• Protokol standard OAI-PMH• Repository: Katalog buku,
Jurnal Online, Repositoridigital
Tahap 2 (2016-2017): Text Analysis
Text Analysis (Full Teks)
• Crawling fullteks (PDF) TA, tesis, disertasi, laporan penelitin, danartikel jurnal dari Intitusi di Indonesia.
• Text analysis menggunakanteknologi NLP (Natural Language Processing)
• Information Extraction & Knowledge Mapping berbasisNLP
• Research Mapping antar Institusi
Tahap 3 (2018-2020): Layanan Anti PlagiarismNo Plagiarism (Services)
• Sistem dan LayananNoPlagiarism untuk karyaberbahasa Indonesia.
• Sumber: Wikipedia (Bahasa Indonesia), Online News, TA, Tesis, Disertasi, artikel jurnal, laporan penelitian (open access)
• Layanan online plagiarism checking untuk mahasiswa danpeneliti di Indonesia
IOS Versi 1.0
11
Format Tidak Standard
12
Duplicate Records
13
Hanya Khusus untuk Perpustakaan
14
IOS Versi 2.0
15
Untuk Semua Jenis Repositori
16
Banyak Fitur Baru
17
Fitur-fitur IOS Versi 2.0
18
Temu Kembali
19
• Auto-Suggest• Relevancy Search• Faceting• Deduplication
Auto-Suggest
20
Relevancy & Facet
21
Sort by Relevancy, etc.
Facet
Duplicate Records
22
Deduplication
23
Sebelum Sesudah
Semantic Web
24
Contoh: Semantic Search
25
Fact Extraction
Fact Extraction
26
Fact extractedfrom document
Fact Extraction dalam Medical
27
Fact extractedfrom document
28
Knowledge Graph
29
Resource Description Framework (RDF)
30
IOS: Fact Extraction
31
Text Analysis
32
Text Analysis is:• the process of
analyzing unstructured text,
• extracting relevant information
• and then transformingthat information into structured information
• that can be leveragedin different ways
Contoh: Tesis “Hak Ulayat”
33
Contoh: Tesis dari UNDIP
34
Fullteks tesis: 112 halamanBahasa: Indonesia
35
S
P
O
Fact Graph
36
Fact Graph
37
Co-occurrence Analysis
38
Open vs Closed Access
39
Open vs Closed Access
40
Contoh: Tesis dari UAJ
41
Open Access: Enabling Innovation
42
Tesis dari UNDIP Tesis dari UAJ
Text Analysis: Manfaat
43
Semoga bisa menjadi dasarpemahaman:• interdisiplinaritas, • cross-disciplinarity, • transdisciplinarity, dan
multidisciplinarity
- Edda Priyanto – Dosen Ilmu Perpustakaan UGM
Open Access Copyright
44
1. Authors sign a publishing agreement where they will have copyright but grant broad publishing and distribution rights to the publisher.
2. The author chooses an end user license under which readers can use and share the article.
3. The publisher makes the article available online with the author's choice of end user license.
Text Analysis: Open Access Licensing
45
PDF, 55 pages, English
Knowledge Graph: Open Access
46
People
47
Kesimpulan
48
• Open Access akan membantu mempercepat terjadinya INOVASI.
• Open Access Indonesia – Discovery System (OAI-DS), dibutuhkan untuk mengelola seluruh repositori Open Access dan seluruh jenis data (tidak terbatas pada e-jurnal).
• Indonesia OneSearch (IOS) adalah sebuah OAI-DS.• IOS versi 2.0 memiliki fitur yang lebih lengkap, dan organisasi
informasi yang lebih baik.• Text Analysis dan Fact Extraction dalam IOS merupakan
langkah awal membangun Knowledge Graph dari seluruh repositori Open Access di Indonesia.