soft skill (teknologi interface)
Post on 21-Oct-2015
99 Views
Preview:
DESCRIPTION
TRANSCRIPT
U n i v e r s i t a s G u n a d a r m a
“ Teknologi Interface ”
Nama Kelompok :
1. Imam Setiawan Rahmat 13110466
2. Sarip 16110389
3. Sumaryanto 16110740
4. Apryan Muchamad S 10110975
5. Imam Maulana 13110459
Teknologi Interface
Interface (Antarmuka) adalah penghubung antara dua sistem atau alat. Media penghubung antara satu
subsistem dengan subsistem lainnya. Interface meliputi :
1. Perangkat yang dipakai untuk mengerjakan sesuatu, dan perangkat yang secara tidak langsung
mengontrol perangkat lunak.
2. Piranti input atau output
3. Prosedur pemakaian perangkat
Teknologi interface adalah sebuah teknologi dimana dua zat atau benda yang berbeda saling bertemu,
dan digunakan juga secara metafora untuk perbatasan antara benda yang satu dengan yang lainnya.
Secara khusus interface juga dapat diartikan yaitu suatu fungsi atribut atau sensor dari suatu system
yaitu perangkat lunak (software), aplikasi , kendaraan (alat transfortasi) dan lain-lain, yang
berhubungan dengan pengoperasiannya oleh user.
Secara umum telematika merupakan bertemunya sistem jaringan komunikasi dengan teknologi
informasi. Jadi, interface telematika adalah atribut sensor dari pertemuan sistem jaringan komunikasi
dan teknologi informasi yang berhubungan dengan pengoperasian oleh pengguna, sehingga
memudahkan pengguna dalam melakukan kegiatan yang menggunakan jaringan
Terdapat beberapa teknologi yang berhubungan dengan telematika yaitu :
1. Head Up Displays System
Head Up Displays adalah setiap tampilan transparan yang menyajikan data tanpa mengharuskan
pengguna untuk melihat dari sudut pandang yang biasa. Asal usul nama berasal dari pilot yang dapat
melihat informasi dengan kepala "up" dan melihat ke depan, bukan miring ke bawah melihat
instrumen yang lebih rendah.
HUDs menurut wikipedia dibagi menjadi empat generasi mencerminkan teknologi yang digunakan
untuk menghasilkan gambar :
a. Generasi Pertama
Gunakan CRT untuk menghasilkan sebuah gambar pada layar fosfor,memiliki
kelemahan dari lapisan fosfor layar merendahkan dari waktu ke waktu.
Mayoritas HUDs beroperasi saat ini adalah jenis ini.
b. Generasi Kedua
Gunakan sumber keadaan menyala terang, misalnya LED, yang dimodulasi
oleh layar LCD untuk menampilkan gambar.
c. Generasi Ketiga
Pandu gelombang optik untuk menghasilkan gambar secara langsung di
Combiner daripada menggunakan sistem proyeksi.
d. Generasi Keempat
Gunakan laser scanning untuk menampilkan gambar dan gambar video pada
media transparan yang jelas.
Contoh :
Aplikasi khusus pesawat militer termasuk sistem senjata dan data sensor
seperti : penerapan sasaran (TD), Vc-penutupan kecepatan dengan target,
range-target, waypoint, Peluncuran Penerimaan Daerah (LAR),senjata
pencari, status senjata.
Terdapat 5 Macam Teknologi HUD yaitu :
CRT (Cathode Ray Tube) – Hal yang sama untuk semua HUD adalah sumber dari gambar yang
ditampilkan, CRT, yang dikemudikan oleh generator. Tanda generator mengirimkan informasi ke
CRT berbentuk koordinat x dan y. Hal itu merupakan tugas dari CRT untuk menggambarkan
koordinat senagai piksel, yaitu grafik. CRT membuat piksel dengan menciptakan suatu sinar elektonil,
yang menyerang permukaan tabung (tube).
Refractive HUD – Dari CRT, sinar diproduksi secara paralel dengan sebuah lensa collimating. Sinar
paralel tersebut diproyeksikan ke kaca semitrasnparan (kaca gabungan) dan memantul ke mata pilot.
Salah satu keuntungan dari reaktif HUD adalah kemampuan pilot untuk menggerakkan kepalanya dan
sekaligus melihat gambar yang ditampilkan pada kaca gabungan.
Reflective HUD – Kerugian dari HUD reflektif adalah akibatnya pada besarnya tingkat kompleksitas
yang terlibat dalam meproduksi penggabungan lekungan dari segi materi dan rekayasa. Keuntungan
besarnya adalah kemampuan pada peningkatan tanda brightness (terang), meminimalisir redaman
cahaya dari pemandangan visual eksternal dan adanya kemungkinan untuk menghemat ruang di
kokpit, karena lensa collimating yang tidak diperlukan.
System Architecture – HUD komputer mengumpulkan informasi dari sumber – sumber seperti IRS
(Inertial Reference System), ADC (Air Data Computer), radio altimeter, gyros, radio navigasi dan
kontrol kokpit. Diterjemahkan ke dalam koordinat x dan y, komputer HUD selanjutnya akan
menyediakan informasi yang dibutuhkan untuk hal apa yang akan ditampilkan pada HUD ke
generator simbol. Berdasarkan informasi ini, generator simbol menghasilkan koordinat yang
diperlukan pada grafik, yang akan dikirmkan ke unit display (CRT) dan ditampilkan sebagai simbol
grafik pada permukaan tabung. Kebanyakan HUD militer mudah memberikan atau melewatkan
isyarat kemudi FD melalui generator simbol. HUD memperhitungkan isyarat kemudi pada komputer
HUD dan hal tersebut membuatnya sebagai sistem „standalone‟. Sipil HUD merupakan fail-passive
dan mencakup pemeriksaan internal yang besar mulai dari data sampai pada simbol generator.
Kebanyakan perselisihan perhitungan dirancang untuk mencegah data palsu tampil.
Display Clutter – Salah satu perhatian penting dengan simbologi HUD adalah kecenderungan
perancang untuk memasukkan data terlalu banyak, sehingga menghasilkan kekacauan tampilan.
Kekacauan tampilan ini jauh dari eksklusif untuk HUD, tetapi hal ini sangat kritis pada saat melihat
ke arah tampilan. Setiap simbologi yang tampil pada sebuah HUD harus melayani atau memiliki
sebuah tujuan dan mengarahkan peningkatan performa. Kenyataannya, bukan piksel tunggal yang
dapat menerangi kecuali dia secara langsung mengarahkan pada penigkatan. Prinsip yang diterapkan
pada perancangan HUD adalah „ketika dalam keraguan, tinggalkan saja‟.
2. Tangible User Interface
Sebuah user interface yang nyata (TUI) adalah sebuah antarmuka pengguna di mana
seseorang berinteraksi dengan informasi digital melalui lingkungan fisik. Nama awal Graspable User
Interface, yang tidak lagi digunakan.
Karakteristik Tangible User Interface
a. Representasi fisik adalah komputasi digabungkan dengan informasi
digital yang mendasari
b. Representasi fisik mewujudkan mekanisme kontrol interaktif.
c. Representasi fisik adalah perseptual digabungkan dengan representasi
digital secara efektif dimediasi.
d. Keadaan fisik tangibles mencakup aspek kunci dari negara digital sistem.
Contoh :
Contoh TUI adalah sistem Topobo. Blok di Topobo seperti blok LEGO yang bisa diambil bersama-
sama. tetapi juga dapat bergerak sendiri menggunakan komponen bermotor. Seseorang dapat
mendorong, menarik, dan memutar blok-blok, dan blok-blok bisa menghafal gerakan-gerakan ini dan
replay mereka.
Dasar Model Dari TUI
Antarmuka antara manusia dan informasi membutuhkan dua komponen utama, yaitu input dan output,
atau kontrol dan representasi. Kontrol memungkinkan pengguna untuk memanipulasi informasi,
sedangkan representasi eksternal dianggap sebagai indera manusia. Gambar 2.9 menampilkan model
sederhana yang terdiri dari kontrol, representasi dan informasi.
TUI menggunakan representasi nyata dari informasi yang juga berfungsi sebagai mekanisme kontrol
secara langsung pada informasi digital. Dengan merepresentasikan informasi pada kedua bentuk
tangible dan intangible, pengguna dapat lebih secara langsung menekankan representasi digital
dengan menggunakan tangan mereka.
Representasi Tangible Sebagai Kontrol
Gambar 1 menggambarkan ide utama dari TUI untuk memberikan representasi (physical dan
graspable)nyata eksternal ke informasi digital. Represenntasi tangible membantu jemabatan batas
antara fisik dan dunia fisik. Representasi tangible juga adalah komputasi digabungkan dengan kontrol
terhadap dasar informasi digital dan model komputasi.
Fungsi dari representasi tangible adalah sebagai pengendali fisik interaktif. Upaya TUI untuk
mewujudkan informasi digital dalam bentuk fisik, memaksimalkan kelangsungan informasi dengan
manipulasi sambungan ke dasar perhitungan. Melalui pemanipulasian fisik dari representasi tangible,
representasi digital diubah.
Representasi Intangible – Representasi tangible (berwujud) memungkinkan perwujudan fisik secara
langsung digabungkan ke informasi digita. Namun, ia memiliki kemampuan terbatas.untuk mewakili
perubahan banyak materi atau properti (sifat) fisik. Tidak seperti penempaan pixel pada komputer,
untuk mengubah suatu objek fisik dalam bentuk, posisi, atau properti dalam real-time sangat sulit.
Dalam perbandingan dengan “bit”, “atom” sangat kaku, mengambil massa dan ruang.
Ada beberapa jenis TUI yang telah digerakkan dari representasi berwujud (benda fisik) sebagai pusat
dari umpan balik. Contohnya adalah inTouch ((Brave, et al., 1998), curlybot (Frei, et al., 2000a), dan
topobo (Undian, et al, 2004). Jenis kekuatan umpan balik TUI ini tidak tergantung pada representasi
berwujud, sejak umpan balik aktif melalui representasi berwujud sebagai saluran tampilan utama.
Genre Aplikasi TUI
TUI memiliki berbagai macam aplikasi domain. Ada terdpat 7 genre untuk aplikasi yang
menjanjikan,, yaitu:
Tangible Telepresence – Genre ini merupakan komunikasi antar-pribadi yang mengambil keuntungan
dari interasiksi haptic yang diggunakan untuk menengahi representasi tangible dan kontrol.Genre ini
bergantung pda pemetaan reprensentasi input haptic jarak jauh. Tangible telepresence, dasar
mekanismenya dalah sinkronisasi objek terdistribusi dan gestural simulasi kehadiran artefak, sepertu
gerakan atau getaran, yang memungkunka peserta jarak jauh untuk menyampaikan manipulasi
hapticmereka dari pendistribusian objek fisik. Contohnya: inTouch (Berani dan Dahley, 1997),
HandJive (Fogg, et al, 1998), dan ComTouch (Chang, et al . 2002).
Tangible With Kinetic Memory – Penggunaan gerak kinestetik dan gerakan untuk meningkarkan
pembelajaran konsep lain merupakan domain lain yang menjanjikan. Mainan pendidikan untuk
mewujudkan catatan dan konsep bermain sudah dieksplorasi dengan menggunakan teknologi aktuasi
dan mengambil keuntungan dari i/o kebetulan dari TUI. Gerak dalam ruang fisik menerangi
hubungan matematika simetris di alam, dan gerakan kinetik dapat digunakan untuk mengajarkan
kepada anak-anak konsep yang relevan dengan program dan geometri diferensial serta bercerita.
Contoh dari genre ini adalah Curlybot (Frei, et, al, 2000) dan topobo (undian, et al, 2004) merupakan
mainan yan menyaring ide-ide yang berkaitan dengan gerak tubuh dan bentuk pergerakan dinamis,
fisik dan bercerita (strory telling).
Constructive Assembly – Domain lainnya adalah pendekatan peraktian konstruktif yang menarik
inspirasi dari LEGO TM dan blok bangunana, pembangunan pada interkoneksi unsur fisik modular.
Domain ini terutama berkaitan dengan kesesuain fisik antara obyek dan hubungan kinetik antara
potongan-potongan yang memungkinkan konstruksi yang lebih besar dan pergerakan varietas. Contoh
domain ini adalah perakitan konstruksi yang dipelopori oleh Aish dan Frazer di akhir tahun 1970-an.
Aish membangun BBS untuk analisis kinerja panas (thermal), dan Frazer membangun serangkaian
pemodelan alat cerdas sperti Universal Constructor untuk pemodelan san simulasi. Contoh terbaru
adalah AlgoBlock (Suzuki dan Kato, 1993), ActiveCube (Kitamura, et al, 2001), Blok System
(Zuckerman dan resnick 2004), dll.
Tokens and Constraints – Token dan kendala (constraint) adalah pendekatan lain TUI untuk
mengoperasikan informasi digital abstrak menggunakan mekanisme kendala (Ullmer, et al, 2005).
Token adalah diskrit, benda fisik spasial reconfigurable yang mewakili digital informasi atau operasi.
Kendal membatasi daerah dimana tanda dapat ditempatkan. Kendala yang dipetakan ke operasi digital
atau properti yang diterapkan pada penempatan token dengan batasan-batasan.Kendala yang sering
diwujudkan sebagai struktur fisik yang mekanisme salurannya menetukan bagaimana token dapat
dimanipulasi, padahal sering membatasi pergerakannya pada dimensi fisik. Contohnya adalah media
Blocks (Ullmer, et al, 1998), LogJam(Cohen, et al, 1999(, Tangible Query Interface (Ullmer, et al,
2003), dll
Interactive Surfaces (table top TUI) – Interaktif permukaan lain adalah pendekatan yang menjanjikan
untuk mendukung kolaborasi desain dan simulasi yang telah dieksplorasi oleh banyak peneliti dalam
tahun terakhir untuk mendukung berbagai aplikasi spasial. Digital Desk (Wallner, et al, 1993) adlah
karya perintis dalam genre ini, dan berbegai TUI meja dikembangkan menggunakan beberapa artefak
berwujud dalam bingkai umum dari permukaan kerja horizontal. Contohnya adalah metaDesk (Ulmer
dan Ishi, 1997), AudioPad(Patten, et all, 2002), Desain Jaringan IP Workbeach (Kobayashi, et al,
2003), dll.
Continuous Plastic TUI – Keterbatasan dari TUI sebelumnya adalah kurangnya kemampuan untuk
mengubah bentuk representasi berwujud selama berinteraksi. Pengguna harus menggunakan standar
himpunan objek fixed-form, hanya mengubah hubungan spasial diantara mereka, tetapi tidak bentuk
individual objek itu sendiri. Alih-alih menggunakan benda diskrit dengan bentuk tetap, jenis baru dari
sistem TUI memanfaatkan bahan tangible secara berlanjut, seperti tanah liat dan pasir yang
dikembangkan untuk memberikan bentuk cepat dan patung untuk desain landscape. Contohnya adalah
illumniating Clay (Piper, et al, 2002), dan SandSpcape (Ishii, et al, 2004).
Augmented Everyday Objects – Peningkatan benda-benada yang familiar setiap harinya adalah
pendekatan desain penting dari TUI untuk memperpendek lantai dan membuatnya mudah untuk
memahami konsep-konsep dasar. Contohnya adalah Notebook Audio(Stifelman, 1996),
LumiTouch(Chang, et al, 2001), I/O Brush (Ryokai, et al, 2004), dll.
3. Computer Vision
Computer Vision adalah ilmu dan teknologi mesin yang melihat, di mana dalam hal ini berarti
bahwa mesin mampu mengekstrak informasi dari gambar yang diperlukan untuk menyelesaikan tugas
tertentu. Visi komputer berkaitan dengan teori di balik sistem buatan bahwa ekstrak informasi dari
gambar. Data gambar mengambil banyak bentuk, seperti urutan video, pandangan dari beberapa
kamera, atau data multi-dimensi dari scanner medis.
Contoh :
Contoh aplikasi dari visi komputer mencakup sistem untuk :
a. Pengendalian proses
b. Mendeteksi peristiwa
c. Mengorganisir informasi
d. Modeling benda atau lingkungan
e. Interaksi
Computer vision merupakan proses otomatis yang mengintegrasikan sejumlah besar proses
untuk persepsi visual, seperti akuisisi citra, pengolahan citra, pengenalan dan membuat
keputusan. Computer vision mencoba meniru cara kerja sistem visual manusia (human vision)
yang sesungguhnya sangat kompleks. Untuk itu, computer vision diharapkan memiliki
kemmpuan tingkat tinggi sebagaiman human visual. Kemampuan itu diantaranya adalah:
Object detection → Apakah sebuah objek ada pada scene? Jika begiru, dimana
batasan-batasannya..?
Recognation → Menempatkan label pada objek.
Description → Menugaskan properti kepada objek.
3D Inference → Menafsirkan adegan 3D dari 2D yang dilihat.
Interpreting motion → Menafsirkan gerakan.
Computer Vision sering didefinisikan sebagai salah satu cabang ilmu pengetahuan yang
mempelajari bagaimana komputer dapat mengenali obyek yang diamati/ diobservasi. Cabang
ilmu ini bersama intelijensia semu (Artificial Intelligence) akan mampu menghasilkan sistem
intelijen visual (Visual Intelligence System). Computer Vision adalah kombinasi antara
Pengolahan Citra dan Pengenalan Pola yang hubungan antara ketiganya dapat dilihat pada
gambar 1. Pengolahan citra merupakan proses awal dari computer vision, sedangkan
pengenalan pola merupakan proses menginterpretasikan citra.
Gambar1. Hubungan Antara Computer Vision, Pengolahan Citra, dan Pengenalan Pola
Pengolahan Citra (Image Processing) merupakan bidang yang berhubungan dengan proses
transformasi citra/gambar (image). Proses ini bertujuan untuk mendapatkan kualitas citra
yang lebih baik. Sedangkan Pengenalan Pola (Pattern Recognition) berhubungan dengan
proses identifikasi obyek pada citra atau interpretasi citra. Proses ini bertujuan untuk
mengekstrak informasi/pesan yang disampaikan oleh gambar/citra.
Untuk mendukung tugas dari computer vision, aka ada beberapa fungsi pendukung yang
ditambahkan ke dalam sistemini, yaitu:
Proses penangkapan citra/gamabr (image acquisition)
Proses pengolahan citra (image processing)
Analisa data citra (image analysis)
Proses pemahaman data citra (image understanding)
Proses dan Hirarki Pada Computer Vision
Ada terdapat 3 proses yang terjadi dalam computer vision, yaitu:
Memperoleh atau mengakuisisi citra digital.
Operasi pengolahan citra.
Menganalisis dan menginterpretasi citra dan menggunakan hasil pemrosesan untuk
tujuan tertentu, misal memandu robot, mengontrol peralatan, dll.
Gambar2. Proses Pada Computer Vision
Hirarki pada computer vision ada 3 tahap, yaitu:
Pengolahan Tingkat Rendah (Image to image) → Menghilangkan noise, dan
peningkatan gambar (enchament image).
Pengolahan Tingkat Menengah (Image to dimbolic) → Kumpulan garis / vektor yang
merepresentasikan batas sebuah obyek PADA citra.
Pengolah Tingkat Tinggi (Simbolic to simbolic) → Representasi simbolik batas- batas
obyek menghasilkan nama obyek tersebut.
Sebelum membuat aplikasi computer vision, maka perlu dibuat pertimbangan dan
perancangannya. Pertimbangan dan perancangan tersebut dapat dilakukan dalam 3 tahap,
yaitu:
♥ Informasi apa yang ingin diperoleh dan bagaimana informasi tersebut dimanifestasikan ke
dalam citra.
♥ Pengetahuan apa yang diperlukan untuk memperoleh informasi.
Untuk menentukan hubungan antara intensitas piksel dan sifat-sifat citra diperlukan suatu
model, misalnya adalah:
♦ Scene model: jenis features, textures, smoothness.
♦ Illumination model: posisi dan karakteristik sumber cahaya serta sifat-sifat
reflektansi permukaan obyek .
♦ Sensor model: posisi dan kinerja optik dari kamera yang digunakan, noise dan
distorsi pada proses dijitasi .
♥ Kecepatan pemrosesan dan representasi pengetahuan.
Aplikasi Computer Vision
Sebagai teknologi disiplin, visi komputer berusaha untuk menerapkan teori dan model untuk
pembangunan sistem visi komputer. Aplikasi pada visi komputer mencakup berbagai macam
sistem, yaitu:
1. Pengendalian proses (misalnya, sebuah robot industri atau kendaraan otonom).
2. Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang menghitung).
3. Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan gambar
urutan).
4. Modeling benda atau lingkungan (misalnya, industri inspeksi, analisis gambar medis /
topografis).
5. Interaksi (misalnya, sebagai input ke perangkat untuk interaksi manusia komputer).
6. Sub-domain visi komputer meliputi adegan rekonstruksi, acara deteksi, pelacakan
video, pengenalan obyek, belajar, pengindeksan, gerak estimasi, dan gambar restorasi.
Gambar3. Hasil Proses Computer Vision Pada Shape Recovery Dan Cell Segementation
4. Browsing Audio Data
Data audio berarti data yang bersifat audio seperti musik, lagu, suara dan sebagainya. Sebuah
metode browsing jaringan disesiakan untuk browsing video / audio data yang ditembak oleh sebuah
IP kamera.
Contoh :
Sebagai kemajuan teknologi jaringan, semakin banyak diterapkan jaringan
produk yang dibuat-buat terus-menerus. Salah satu yang paling umum
diterapkan jaringan yang dikenal adalah produk kamera IP,yang dapat
menampilkan isi (video / audio data) melalui Internet. Kamera IP biasanya
terhubung ke jaringan melalui router, dan memiliki sebuah IP (Internet
Protocol) address setelah operasi sambungan.
Browsing Audio Data merupakan metode browsing jaringan yang digunakan untuk browsing video /
audio data yang ditangkap oleh sebuah IP kamera. Sebuah komputer lokal digabungkan ke LAN
(local area network) untuk mendeteksi IP kamera. Jaringan video / audio metode browsing mencakupi
langkah-langkah sebagai berikut :
Menjalankan sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi
yang disimpan dalam kamera IP.
Transmisi untuk mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name Server)
oleh program aplikasi.
Mendapatkan kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP
kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat server pribadi
compile ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan video /
audio data yang ditangkap oleh kamera IP, dimana server layanan menangkap video / audio
data melalui Internet.
Browsing audio data tidak semudah browsing dokumen cetak, karena adanya sifat temporal suara.
Ketika melakukan browsing terhadap dokumen, kita dapat dengan cepat mengalihkan fokus perhatian
dengan membaca sepintas isi dari dokumen tersebut. Kita dapat mengetahui ukuran dan struktur
dokumen, dan menggunakan memori spasial visual untuk mengingat dan mencari spesifik topik.
Namun, ketika browsing suatu rekaman audio, kita harus berulang kali memainkan dan melompati
bagian tertentu, tanpa memainkannya, kita tidak bisa menyadari suara atau isinya. Kita harus
mendengarkan semua stream audio untuk dapat menangkap semua isinya.
5. Speech Recognation
Speech recognation (ASR) adalah suatu pengembangan teknik dan sistem yang
memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi
ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang
diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu
pola tertentu yang tersimpan dalam suatu perangkat.
Speech Recognation (juga dikenal sebagai pengenalan suara otomatis atau pengenalan suara otomatis
atau pengenalan pembicaraan kata-kata untuk teks. Pengenalan pembicaraan adalah solusi yang lebih
luas yang mengacu pada teknologi yang dapat mengenali pidato tanpa ditargetkan pada pembicara
tunggal seperti pusat panggilan sistem yang dapat mengenali suara sewenang-wenang.
Contoh :
Aplikasi perawata kesehatan. dalam metode perawatan kesehatan domain,
bahkan di bangunmeningkatkan teknologi pengenalan suara (transcriptionist
medis (MTs) belum menjadi ibunya.
Pengenalan ucapan (speech recognation) dalam perkembangan teknologinya merupakan
bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya).
Pengenalan suara sendiri terbagi menjadi du kategori, yaitu:
Piranti pengenalan kata (word recognation) yang mampu merespon ucapan-ucapan
secara indovidu atau perintah-perintah yang menggunakan teknik yang dikenal
sebagai speaker verification. Pertama kali sistem akan membangkitkan suatu template
untuk mengenali suara user.
Piranti pengenalan kalimat (speech recognation) yang mampu mengenali hubungan
antar kata terucap di dalam kalimat atau frase. Teknik - teknik statistik dipakai dalam
hal pola perekaman suara yang akan dicocokkan dengan kata-kata terucap.
Jenis-Jenis Pengenalan Ucapan
Berdasarkan kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis pengenalan
kata, yaitu :
Kata-kata yang terisolasi : Proses pengidentifikasian kata yang hanya dapat mengenal
kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata
Kata-kata yang berhubungan : Proses pengidentifikasian kata yang mirip dengan kata-
kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih
singkat
Kata-kata yang berkelanjutan : Proses pengidentifikasian kata yang sudah lebih maju
karena dapat mengenal kata-kata yang diucapkan secara berkesinambungan dengan
jeda waktu yang sangat sedikit atau tanpa jeda waktu. Proses pengenalan suara ini
sangat rumit karena membutuhkan metode khusus untuk membedakan kata-kata yang
diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata
secara natural
Kata-kata spontan: Proses pengidentifikasian kata yang dapat mengenal kata-kata
yang diucapkan secara spontan tanpa jeda waktu antar kata
Verifikasi atau identifikasi suara: Proses pengidentifikasian kata yang tidak hanya
mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara
Prinsip Dasar Speech Recognation
Semua metode dasar proses pengenalan suara terdiri dari dua fase operasi, yaitu:
Proses training. Pada proses ini sistem belajar dari referensi pola yang berupa
perbedaan pola sinyal suara misal frase, kata, fonem yang akan mengisi vocabulari
dari sistem. Setiap referensi di pelajari dari kata yang dikatakan yang kemudian
disimpan dalam template dan telah mengalami metode untuk merata-rata dan
karakteristik statistik dan parameter statistik.
Proses recognation. Pada proses ini sistem akan diberikan inputan yang belum
diketahui dan akan di identifikasi berdasarkan pola template yang telah didapatkan
pada proses training.
Pada umumnya, suatu sistem pengenalan suara terdiri dari beberapa modul utama, yaitu:
Signal processign frontend digunakan untuk mengkonversi sinyal suara kedalam
bentuk sequence feature vector yang akan digunakan pada saat klasifikasi.
Accoustic modelling digunakan untuk memodelkan secara statistik hasil training yang
telah dilakukan kedalam sebuah template.
Language modelling digunakan untuk memodelkan bentuk kata baik berupa kata,
fonem, ataupun kalimat.
Gambar1. Blok Diagram Speech Recognation
Alat Pengenal Suara (Speech Recognizer)
Alat pengenal ucapan, yang sering disebut dengan speech recognizer, membutuhkan sampel
kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan
dalam komputer, dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang
diucapkan selanjutnya. Sebagian besar alat pengenal ucapan sifatnya masih tergantung
kepada pengeras suara. Alat ini hanya dapat mengenal kata yang diucapkan dari satu atau dua
orang saja dan hanya bisa mengenal kata-kata terpisah, yaitu kata-kata yang dalam
penyampaiannya terdapat jeda antar kata. Hanya sebagian kecil dari peralatan yang
menggunakan teknologi ini yang sifatnya tidak tergantung pada pengeras suara. Alat ini
sudah dapat mengenal kata yang diucapkan oleh banyak orang dan juga dapat mengenal kata-
kata kontinu, atau kata-kata yang dalam penyampaiannya tidak terdapat jeda antar kata.
Aplikasi dari alat pengenal suara dapata ditemukan dalam berbagai bidang, diantaranya
adalah:
1. Bidang komunikasi
Komando Suara – Komando Suara adalah suatu program pada komputer yang
melakukan perintah berdasarkan komando suara dari pengguna. Contohnya pada
aplikasi Microsoft Voice yang berbasis bahasa Inggris. Ketika pengguna mengatakan
“Mulai kalkulator” dengan intonasi dan tata bahasa yang sesuai, komputer akan
segera membuka aplikasi kalkulator. Jika komando suara yang diberikan sesuai
dengan daftar perintah yang tersedia, aplikasi akan memastikan komando suara
dengan menampilkan tulisan “Apakah Anda meminta saya untuk „mulai
kalkulator‟?”. Untuk melakukan verifikasi, pengguna cukup mengatakan “Lakukan”
dan komputer akan langsung beroperasi.
Pendiktean – Pendiktean adalah sebuah proses mendikte yang sekarang ini banyak
dimanfaatkan dalam pembuatan laporan atau penelitian. Contohnya pada aplikasi
Microsoft Dictation yang merupakan aplikasi yang dapat menuliskan apa yang
diucapkan oleh pengguna secara otomatis.
Telepon – Pada telepon, teknologi pengenal ucapan digunakan pada proses penekanan
tombol otomatis yang dapat menelpon nomor tujuan dengan komando suara.
2. Bidang Kesehatan
Alat pengenal ucapan banyak digunakan dalam bidang kesehatan untuk membantu para
penyandang cacat dalam beraktivitas. Contohnya pada aplikasi Antarmuka Suara Pengguna
atau Voice User Interface (VUI) yang menggunakan teknologi pengenal ucapan dimana
pengendalian saklar lampu misalnya, tidak perlu dilakukan secara manual dengan
menggerakkan saklar tetapi cukup dengan mengeluarkan perintah dalam bentuk ucapan
sebagai saklarnya. Metode ini membantu manusia yang secara fisik tidak dapat
menggerakkan saklar karena cacat pada tangan misalnya. Penerapan VUI ini tidak hanya
untuk lampu saja tapi bisa juga untuk aplikasi-aplikasi kontrol yang lain.
Gambar 2 Voice User Interface (VUI)
3. Bidang militer
Pelatihan Penerbangan – Aplikasi alat pengenal ucapan dalam bidang militer adalah
pada pengatur lalu-lintas udara atau yang dikenal dengan Air Traffic Controllers
(ATC) yang dipakai oleh para pilot untuk mendapatkan keterangan mengenai keadaan
lalu-lintas udara seperti radar, cuaca, dan navigasi. Alat pengenal ucapan digunakan
sebagai pengganti operator yang memberikan informasi kepada pilot dengan cara
berdialog.
Helikopter – Aplikasi alat pengenal ucapan pada helikopter digunakan untuk
berkomunikasi lewat radio dan menyesuaikan sistem navigasi. Alat ini sangat
diperlukan pada helikopter karena ketika terbang, sangat banyak gangguan yang akan
menyulitkan pilot bila harus berkomunikasi dan menyesuaikan navigasi dengan
terlebih dahulu memencet tombol tertentu
6. Speech Syntesis
Pidato sintesis adalah produksi buatan manusia pidato. Sebuah sistem komputer yang digunakan
untuk tujuan ini disebut synthesizer-speech.
Speech synthesis juga sebuah kemampuan bicara manusia yang dibuat oleh manusia (artificial).
Sebuah sistem komputer digunakan untuk tujuan ini yang disebut sebagai speech synthesizer, dan
dapat diimplementasikan ke dalam software atau hardware. Sebagai contoh sebuah sistem text-to-
speech (TTS) yang dapat mengkonversikan teks dengan bahasa biasa menjadi suara.
Synthesized speech dapat diciptakan dengan menggabungkan beberapa potongan-potongan dari
pembicaraan/pidato yang sudah direkam dalam sebuah basis data. Kualitas dari sebuah speech
synthesizer dilihat dari kemiripannya dengan suara manusia dan kemampuannya untuk bisa dipahami.
Program TTS yang jelas dapat membantu orang dengan gangguan visual atau ketidakmampuan
membaca, untuk mendengarkan pada pekerjaan yang tertulis dalam komputer. Banyak Sistem Operasi
komputer yang telah dimasukkan speech synthesizer sejak tahun 1980-an.
Teknologi Speech Synthesis
Yang paling penting dalam kualitas sistem speech synthesis adalah kealamian dan kejelasannya.
Kealamaian menjelaskan bagaimana dekatnya suara output dengan suara manusia, sementara
kejelasan adalah dengan kemudahan di mana output tersebut dapat dipahami. Speech synthesizer yang
ideal adalah yang alami dan jelas. Sistem speech synthesis biasanya mencoba untuk memaksimalkan
kedua karakteristik.
Dua teknologi utama dalam pembuatan gelombang suara synthetic speech adalah Concatenative
Synthesis dan Formant Synthesis. Setiap teknologi mempunyai kekuatan dan kelemahannya, dan
penggunaan yang ditujukan dari sistem synthesis akan menentukkan pendekatan mana yang
digunakana.
Concatenative Synthesis
Concantenative synthesis didasarkan dengan penggabungan dari segmen-segmen dari pembicaraan
yang sudah direkam. Secara umum, concatenative synthesis memproduksi synthesized speech dengan
suara yang paling alami. Tetapi, perbedaan antara variasi alami dalam pembicaraaan dan sifat dari
teknik otomasi untuk pensegmentasian gelombang suara terkadang menghasilkan kesalahan suara
dalam output.
Formant Synthesis
Formant synthesis tidak menggunakan pembicaraan manusia sebagai sample pada runtime. Daripada
itu, synthesized speech yang dihasilkan dibuat dengan additive synthesis dan sebuah model akustik
(physical modelling synthesis). Parameter seperti frekuensi dasar, penyuaraan, dan tingkat kebisingan
di variasikan dari waktu ke waktu untuk menciptakan gelombang buatan (artificial) dari sebuah
pembicaraan. Banyak sistem yang berdasarkan formant synthesis menciptakan pembicaraan yang
seperti robot yang tidak mungkin dapat dikenal sebagai suara manusia.
Tetapi, kealamian maksimum bukan selalu tujuan dari sebuah sistem speech synthesis, dan sistem
formant synthesis mempunyai keuntungan dari sistem concatenative. Pembicaraan yang di-formant
synthesis-kan dapat menjadi sangat jelas, bahkan dalam kecepatan yang tinggi, sehingga menghindari
kesalahan suara yang sering dialami sistem concatenative.
Formant synthesis biasanya program yang lebih kecil dari concatenative sistem karena ia tidak
menggunakan basis data dari sampel-sampel pembicaraan. Oleh karena itu formant synthesis dapat
ditanamkan dalam sistem yang mempunyai memory dan microprosesor yang terbatas. Karena sistem
yang berdasarkan formant mempunyai kendali penuh dari sluruh aspek dari hasil pembicaraan, variasi
yang luas dari prosodi dan intonasi dapat dihasilkan, menyampaikan tidak hanya pertanyaan dan
pernyataan tetapi juga emosi dan nada suara.
Daftar Pustaka
1] http://macuy-marucuy.blogspot.com/2010/11/teknologi-interface.html
2] http://diehermawan.blogspot.com/2012/11/teknologi-interface.html
3] http://catatandigital15.wordpress.com/2012/11/17/teknologi-interface/
4] http://catatandigital15.wordpress.com/2012/11/17/teknologi-interface/
5] http://freezcha.wordpress.com/2010/11/16/browsing-audio-data/
6] http://ranggaadhityap.blogspot.com/2011/11/speech-synthesis.html
top related